HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:
|
|
- Hartanti Tedja
- 6 tahun lalu
- Tontonan:
Transkripsi
1 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks cluster 7. w adalah derajat fuzzy, w [1, ]. Algoritme Fuzzy C-Means secara keseluruhan adalah sebagai berikut: 1. Memasukkan data yang akan dikelompokkan berupa martiks berukuran nxm (n adalah jumlah dokumen, m adalah jumlah kata) dan tentukan parameter yang terlibat, yaitu: Jumlah cluster (c); Tingkat fuzzy (w); Maksimum iterasi (MaxIter); Error terkecil yang diharapkan (e); Fungsi objektif awal ( P 0 = 0); Iterasi awal ( t = 1); 2. Membangkitkan bilangan acak μ ik sebagai derajat keanggotaan, dengan i adalah indeks dokumen (i=1,2,,n) dan k adalah indeks cluster (k = 1,2,,c) sebagai elemen-elemen matriks partisi awal μ. 3. Menghitung pusat cluster ke-k: V kj dengan k = 1, 2, 3,,c dan j=1, 2, 3,,m. V kj = n i=1 μ w ik x x ij n i=1 μ w ik 4. Menghitung fungsi objektif pada iterasi ke-t, n c P t = x ij v kj 2 i=1 k=1 m j =1. μ ik w 5. Meng-update derajat keanggotaan μ ik = c k=1 m j =1 m j =1 X ij V kj 2 X ij V kj 2 1 w 1 1 w 1 6. Mengecek kondisi berhenti: Jika ( P t P t 1 < e) atau (t > MaxIter) maka berhenti. Jika tidak : t = t+1, mengulangi kembali iterasi dimulai dari langkah ke-3. Evaluasi Evaluasi dilakukan dengan menghitung F-Measure keseluruhan cluster hasil.. clustering. Untuk menghitung F-Measure dibutuhkan pengetahuan mengenai pengelompokan dokumen yang telah dianggap benar. Dalam penelitian ini, pengelompokan dokumen yang telah dianggap benar adalah pengelompokan yang dilakukan dengan cara manual (Ramdani 2011). Lingkungan Implementasi Lingkungan implementasi yang dalam penelitian ini adalah sebagai berikut: Perangkat lunak: Sistem operasi Windows 7 PHP Sphinx Perangkat keras: Processor Intel Core 2 Duo 1,50GHz RAM 2 GB Hardisk dengan kapasitas 120 GB HASIL DAN PEMBAHASAN Karakteristik Dokumen Dokumen yang digunakan dalam penelitian ini adalah dokumen berbahasa Indonesia yaitu dokumen jurnal hortikultura dan dokumen tanaman obat. Jumlah dokumen yang digunakan adalah 324 dokumen untuk jurnal hortikultura dan 93 dokumen tanaman obat. Koleksi dokumen jurnal hortikultura terbagi ke dalam tiga cluster, yaitu Ekofisiologi dan Agronomi, Pemuliaan dan Teknologi Benih, serta Proteksi. Dokumen tanaman obat terbagi ke dalam tujuh cluster, yaitu Kronis, Kulit, Nyeri-Radang-Demam, Pencernaan, Perawatan, Pernapasan, dan Saluran kemih. Seluruh dokumen yang digunakan dalam penelitian ini berformat plain-text yang memiliki struktur XML. Struktur tulisan dokumen jurnal hortikultura dapat dilihat pada Gambar 2, sedangkan struktur tulisan dokumen tanaman obat dapat dilihat pada Gambar 3. Dokumen dikelompokkan ke dalam beberapa tag sebagai berikut: <DOCID></DOCID>, menunjukkan ID dari dokumen jurnal hortikultura. <DOCNO></DOCNO>, menunjukkan ID dari dokumen tanaman obat. 5
2 <content></content>, menunjukkan isi atau informasi dari dokumen. <nama></nama>, menunjukkan nama tanaman obat pada dokumen tanaman obat. <namal></namal>, menunjukkan nama latin tanaman obat pada dokumen tanaman obat. <fam></fam>, menunjukkan nama family dari tamanan obat pada dokumen tanaman obat. <penyakit></penyakit>, menunjukkan penyakit yang berkaitan dengan tanaman obat pada dokumen tanaman obat. Dalam penelitian ini, pemrosesan text hanya dilakukan pada text yang berada di antara tag <content> dan </content>, sehingga text yang berada di dalam tag lainnya tidak diproses. <docid>dok001.txt</docid> <content>akhir-akhir ini kentang menjadi tanaman prioritas dan mempunyai nilai ekonomi tinggi. Produksi umbi kentang di Indonesia masih rendah sehingga </content> Gambar 2 Struktur dokumen jurnal hortikultura. <DOCNO>001</DOCNO> <nama>akar Kuning</nama> <namal>arcangelisia flava (L.) Merr.</namal> <fam>menispermaceae</fam> <penyakit>pencernaan</penyakit> <content> Famili:Menispermaceae </content> Gambar 3 Struktur dokumen tanaman obat. Pembuangan Stopwords dan Term Pada tahap praproses dilakukan pembuangan term di dalam dokumen yang termasuk ke dalam stopwords dan term yang memiliki bobot (tf.idf) kurang dari threshold. Threshold yang digunakan pada penelitian ini adalah sebesar 1.5 dan 3 untuk dokumen jurnal hortikultura, sedangkan untuk dokumen tanaman obat digunakan threshold sebesar 1.5 dan Ukuran threshold yang berbeda antara dokumen jurnal hortikultura dengan dokumen tanaman obat dikarenakan karakteristik dokumen yang berbeda. Ukuran threshold yang dipilih disesuaikan dengan seluruh koleksi dokumen, sehingga dari setiap dokumen terdapat kata-kata yang memiliki bobot lebih besar dari threshold dan merepresentasikan dokumennya. Karena semakin sering suatu kata muncul pada suatu dokumen (selain kata yang termasuk ke dalam stopwords), maka diduga semakin penting kata itu untuk dokumen tersebut (Manning et al. 2009). Clustering Dokumen dengan Fuzzy C- Means Clustering dokumen jurnal hortikultura dan dokumen tanaman obat dilakukan dengan menggunakan algoritme Fuzzy C- Means (FCM) dengan input sebagai berikut: 1. Term yang telah dihitung bobotnya menggunakan tf.idf dan bernilai lebih dari threshold 2. Jumlah cluster (c), yaitu tiga cluster untuk dokumen jurnal hortikultura dan tujuh cluster untuk dokumen tanaman obat 3. Pengontrol tingkat fuzzy (w), yaitu dua dan untuk pembanding sebesar tiga 4. Jumlah maksimum iterasi (maxiter) sebesar 100 iterasi 5. Nilai error (e) sebesar Untuk meringkas dan memudahkan penulisan nama cluster, maka dilakukan penamaan seperti pada Tabel 2. Tabel 2 Keterangan penamaan cluster C1 C2 C3 C1 C2 C3 C4 C5 C6 C7 Dokumen Jurnal Hortikultura Ekofisiologi dan Agronomi Pemuliaan dan Teknologi Benih Proteksi Dokumen Tanaman Obat Kronis Kulit Nyeri-Radang-Demam Pencernaan Perawatan Pernapasan Saluran kemih 6
3 1. Clustering Dokumen Jurnal Hortikultura Perhitungan pertama adalah melakukan clustering terhadap dokumen jurnal hortikultura dengan menggunakan nilai w = 2 dan threshold = 3. Tabel -prediksinya dapat dilihat pada Tabel 3 dan Confusion Matrix dari hasil nilai -prediksinya ditunjukkan pada Tabel 4. Tabel 3 Nilai -prediksi jurnal hortikultura dengan w = 2 dan threshold = 3 C1 C2 C3 C C C Tabel 4 Confusion matrix jurnal hortikultura dengan w = 2 dan threshold = Berdasarkan Tabel 4, total pengujian koleksi dokumen jurnal hortikultura terhadap tiga cluster dengan nilai w = 2 dan threshold = 3 terdapat 190 dokumen yang dikelompokkan secara benar, dan total dokumen yang salah dikelompokkan sebanyak 134 dokumen. Nilai recall untuk hasil ini adalah 58.64% dan nilai precision adalah 58.64%. Oleh karena itu perhitungan di atas menghasilkan F-Measure sebesar 58.64% dan akurasi sebesar 72.42%. Perhitungan kedua adalah melakukan clustering terhadap dokumen jurnal hortikultura dengan menggunakan nilai w = 2 dan threshold = 1.5. Tabel -prediksinya dapat dilihat pada Tabel 5 dan Confusion Matrix dari hasil nilai -prediksinya ditunjukkan pada Tabel 6. Berdasarkan Tabel 6 dapat dilihat bahwa total pengujian koleksi dokumen jurnal hortikultura terhadap tiga cluster dengan nilai w = 2 dan threshold = 1.5 terdapat 218 dokumen yang dikelompokkan secara benar, dan total dokumen yang salah dikelompokkan sebanyak 106 dokumen. Nilai recall untuk hasil ini adalah 67.28% dan nilai precision adalah 67.28%. Oleh karena itu perhitungan di atas menghasilkan F-Measure sebesar 67.28% dan akurasi sebesar 78.19%. Tabel 5 Nilai -prediksi jurnal hortikultura dengan w = 2 dan threshold = 1.5 Akurasi % 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 72.42% C1 C2 C3 C C C Tabel 6 Confusion matrix jurnal hortikultura dengan w = 2 dan threshold = Setelah dilakukan clustering pada dokumen jurnal hortikultura, maka dapat diketahui bahwa tingkat akurasi clustering dengan nilai w = 2 dan threshold = 1.5 lebih baik dibandingkan dengan clustering menggunakan nilai w = 2 dan threshold = 3. Diagram perbandingan akurasi hasil clustering dengan menggunakan nilai w = 2 dan threshold = 1.5 dengan nilai w = 2 dan threshold = 3 ditunjukkan pada Gambar % T = 3 T = 1.5 Series % w = % w = 2 w dan threshold (T) Gambar 4 Diagram akurasi nilai w = 2 dan T = 1.5 dengan nilai w = 2 dan T = 3 7
4 Selain menggunakan nilai threshold yang berbeda, untuk mengetahui pengaruh parameter w terhadap hasil clustering dengan menggunakan algoritme FCM, maka dilakukan perhitungan clustering dengan menggunakan nilai w = 3 dengan nilai threshold = 1.5. Tabel -prediksinya dapat dilihat pada Tabel 7 dan Confusion Matrix dari hasil nilai -prediksinya seperti pada Tabel 8. Tabel 7 Nilai -prediksi jurnal hortikultura dengan w = 3 dan threshold = 1.5 C1 C2 C3 C C C Tabel 8 Confusion matrix jurnal hortikultura dengan w = 3 dan threshold = Berdasarkan Tabel 8 dapat dilihat bahwa total pengujian koleksi dokumen jurnal hortikultura terhadap tiga cluster dengan nilai w = 3 dan threshold = 1.5 terdapat 197 dokumen yang dikelompokkan secara benar, dan total dokumen yang salah dikelompokkan sebanyak 127 dokumen. Nilai recall untuk hasil ini adalah 60.80% dan nilai precision adalah 60.80%. Oleh karena itu perhitungan di atas menghasilkan F-Measure sebesar 60.80% dan akurasi sebesar 73.87%. Untuk melihat pengaruh nilai w terhadap hasil clustering dokumen jurnal hortikultura menggunakan algoritme FCM, dapat dibandingkan hasil yang diperoleh antara penggunaan nilai w = 2 dan threshold = 1.5 dengan w = 3 dan threshold = 1.5. Dari hasil yang ditunjukkan sebelumnya oleh Tabel 6 dan Tabel 8, dapat dilihat bahwa selisih hasil dokumen yang secara benar dikelompokkan dengan menggunakan algoritme FCM adalah 21 dokumen, dengan w = 2 yang berhasil melakukan clustering terhadap 21 dokumen tersebut dengan benar. Perbandingan akurasi antara penggunaan nilai w = 2 dan w = 3 dapat dilihat pada Gambar 5. Akurasi % 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 78.19% 73.87% T = 1.5 T = 1.5 Series % w = % w =3 w dan threshold (T) Gambar 5 Diagram akurasi nilai w = 2 dan T = 1.5 dengan nilai w = 3 dan T = 1.5 Selisih jumlah dokumen hasil clustering dengan penggunaan nilai parameter w yang berbeda tidak terlalu signifikan yang dapat disebabkan oleh jumlah dokumen yang digunakan tidak terlalu besar. Menurut James Bezdek tahun 1984, tidak ada petunjuk secara teoritikal ataupun secara komputasional mengenai penggunaan parameter w sebagai parameter pengontrol tingkat fuzzy yang optimal. Berdasarkan percobaan yang dilakukan, penggunaan nilai w yang semakin besar akan menyebabkan distribusi data menjadi kurang baik, sehingga menyebabkan akurasi hasil clustering menurun. Oleh karena itu, untuk clustering dokumen tanaman obat hanya akan digunakan nilai w = 2. Distribusi dokumen hasil clustering pada umumnya akan berubah dengan penetapan jumlah cluster yang berbeda-beda. Untuk melihat distribusi dokumen jurnal hortikultura terhadap jumlah cluster yang ditentukan, maka selain dilakukan clustering menjadi tiga cluster, dilakukan pula clustering menjadi empat cluster dan lima cluster (Tabel 9 dan 10). Berdasarkan Tabel 9 dan 10, dapat diketahui bahwa koleksi dokumen jurnal hortikultura yang terbagi ke dalam tiga cluster ternyata dapat dikelompokkan ke dalam empat cluster dan lima cluster. Hal tersebut menandakan bahwa dari tiga cluster hasil pengelompokan oleh manusia, ternyata dapat dikelompokkan kembali menjadi sejumlah 8
5 cluster lain oleh sistem. Pengelompokan yang dilakukan oleh sistem mampu menghasilkan cluster dokumen baru yang lebih spesifik, yang sebelumnya berdasarkan pengelompokan oleh manusia dianggap termasuk ke dalam cluster yang lebih umum. Tabel 9 Hasil clustering terhadap empat cluster C1 C2 C3 C4 C C C Tabel 10 Hasil clustering terhadap lima cluster C1 C2 C3 C4 C5 C C C Clustering Dokumen Tanaman Obat Clustering dokumen tanaman obat yang berjumlah 93 dilakukan dengan menggunakan nilai w = 2 dengan nilai threshold sebesar 1.5 dan Perhitungan pertama untuk clustering dokumen tanaman obat adalah dengan menggunakan nilai w = 2 dan threshold = 1.5. Tabel -prediksinya dapat dilihat pada Tabel 11 dan Confusion Matrix dari hasil nilai -prediksinya dapat dilihat pada Tabel 12. Tabel 11 Nilai -prediksi dokumen tanaman obat dengan w = 2 dan threshold = 1.5 C1 C2 C3 C4 C5 C6 C7 C C C C C C C Tabel 12 Confusion matrix dokumen tanaman obat dengan w = 2 dan threshold = Berdasarkan Tabel 12 total pengujian koleksi dokumen tanaman obat terhadap tujuh cluster dengan nilai w = 2 dan threshold = 1.5 terdapat 49 dokumen yang dikelompokkan secara benar, dan total dokumen yang salah dikelompokkan adalah 44 dokumen. Nilai recall untuk hasil ini adalah 52.69% dan nilai precision adalah 52.69%. Oleh karena itu perhitungan di atas menghasilkan F-Measure sebesar 52.69% dan akurasi sebesar 86.48%. Perhitungan kedua untuk clustering dokumen tanaman obat adalah dengan menggunakan nilai w = 2 dan threshold = Tabel -prediksinya dapat dilihat pada Tabel 13 dan Confusion Matrix dari hasil nilai -prediksinya ditunjukkan pada Tabel 14. Tabel 13 Nilai -prediksi dokumen tanaman obat dengan w = 2 dan threshold = 0.75 C1 C2 C3 C4 C5 C6 C7 C C C C C C C Tabel 14 Confusion matrix dokumen tanaman obat dengan w = 2 dan threshold = Berdasarkan Tabel 14 dapat dilihat bahwa total pengujian koleksi dokumen tanaman obat terhadap tujuh cluster dengan nilai w = 2 dan threshold = 0.75 terdapat 54 dokumen 9
6 yang dikelompokkan secara benar, dan total dokumen yang salah dikelompokkan adalah 39 dokumen. Nilai recall untuk hasil ini adalah 58.06% dan nilai precision adalah 58.06%. Oleh karena itu perhitungan di atas menghasilkan F-Measure sebesar 58.06% dan akurasi sebesar 88.01%. Setelah clustering dokumen tanaman obat dilakukan, maka dapat dilihat bahwa tingkat akurasi clustering dengan nilai w = 2 dan threshold = 0.75 lebih baik dibandingkan dengan clustering menggunakan nilai w = 2 dan threshold = 1.5. Diagram perbandingan akurasi hasil clustering dokumen tanaman obat dengan menggunakan nilai w = 2 dan threshold = 1.5 dengan nilai w = 2 dan threshold = 0.75 dapat dilihat pada Gambar 6. Akurasi % 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 86.48% 88.01% T = 1.5 T = 0.75 Series % w = % w =2 w dan threshold (T) Gambar 6 Diagram akurasi nilai w = 2 dan T = 1.5 dengan nilai w = 2 dan T = 0.75 Berdasarkan seluruh hasil perhitungan yang telah dilakukan terhadap dokumen jurnal hortikultura dan dokumen tanaman obat, dapat dilihat bahwa penggunaan threshold sebesar 1.5 untuk dokumen jurnal hortikultura dan threshold sebesar 0.75 untuk dokumen tanaman obat memberikan hasil akurasi yang lebih baik. Berdasarkan hal tersebut dapat diketahui bahwa penggunaan threshold yang sesuai dapat menghasilkan akurasi yang lebih baik. Karena dengan penggunaan threshold yang terlalu besar, menyebabkan range bobot term yang masuk dalam proses clustering menjadi lebih kecil dan menyebabkan tidak ikutnya term penciri yang bernilai lebih kecil dari threshold dalam proses clustering. Oleh karena itu, hasil clustering yang diimplementasikan pada search engine adalah clustering dengan menggunakan w = 2 dengan threshold = 1.5 untuk dokumen jurnal hortikultura dan w = 2 dengan threshold 0.75 untuk dokumen tanaman obat. Temu Kembali Informasi Setelah hasil clustering didapat, maka dokumen-dokumen yang ada dalam koleksi sudah terkumpul dalam cluster masingmasing berdasarkan algoritme FCM. Proses akhir dari penelitian ini adalah proses temu kembali informasi yang dibangun dengan menggunakan Sphinx search. Sebelum tahap temu kembali informasi dengan menggunakan Sphinx search dapat dilakukan, harus melakukan indexing terlebih dahulu terhadap seluruh dokumen dengan perintah seperti pada Gambar 7. C:\Sphinx\bin>indexer -- config c:\sphinx\sphinx.conf --all Gambar 7 Perintah indexing dokumen oleh Sphinx search Indexing dilakukan pada satu file XML yang berisi seluruh koleksi dokumen yang ada yang di dalamnya terdapat beberapa tag yang dikenali oleh Sphinx search. Indexing yang dilakukan oleh Sphinx search bertujuan agar dokumen tersebut dapat dikenali dan dapat ditemu-kembalikan oleh Sphinx search. Langkah selanjutnya adalah membuat service untuk Sphinx search. Nama service yang digunakan dalam penelitian ini yaitu SphinxJurnal untuk koleksi dokumen jurnal hortikultura dan SphinxTanob untuk koleksi dokumen tanaman obat. Pembuatan service untuk tanaman obat dilakukan dengan cara yang sama dengan mengganti servicename saja. Perintah untuk membuat service ditunjukkan oleh Gambar 8. \Sphinx\bin\searchd --install --config C:\Sphinx\sphinx.conf -- servicename SphinxJurnal Gambar 8 Perintah pembuatan service Sphinx search Sphinx search menerima input query dari pengguna dan mengembalikan dokumendokumen yang sesuai dengan query. Dokumen yang sesuai dengan query yang ditemu-kembalikan oleh Sphinx search dapat berupa dokumen-dokumen yang berasal dari 10
7 seluruh cluster yang ada, atau dapat berasal dari cluster tertentu saja. Apabila pengguna sudah mengetahui kelas dari informasi yang dibutuhkannya terlebih dahulu, maka proses pencarian akan lebih efisien, karena fokus pencarian informasi hanya dilakukan pada satu cluster saja. Pengujian Kinerja Sistem Proses pengujian kinerja sistem dilakukan dengan melakukan pemeringkatan dokumen dengan memperhitungkan ukuran kesamaan antara query dengan dokumen dan query dengan pusat cluster. Ukuran kesamaan antara query q dengan dokumen d pada c adalah: Sim(q,d c) = asim(q,d)+(1-a)sim(q,c), dengan 1. Sim(q,d) adalah ukuran kesamaan antara query q dengan dokumen d 2. Sim(q,c) adalah dot product antara query q dengan pusat cluster c. 3. a adalah bobot (0 < a < 1). Pada penelitian ini dipilih a = 0.5. Pengujian pada Dokumen Jurnal Hortikultura Proses pengujian kinerja sistem pada keseluruhan koleksi dokumen tanaman obat menggunakan 15 kueri uji (Lampiran 1). Pencarian dengan kueri uji bertujuan untuk mendapatkan nilai recall dan precision dari sistem temu kembali dokumen jurnal hortikultura. Setelah nilai recall dan precision didapat, kemudian dihitung interpolasi maksimumnya untuk mendapatkan nilai average precision (AVP) yang menggambarkan kinerja sistem secara keseluruhan. Berdasarkan hasil pengujian terhadap seluruh cluster pada dokumen jurnal hortikultura didapat nilai average precision sebesar (Lampiran 2). Hal tersebut menunjukkan bahwa kinerja sistem temu kembali terhadap hasil clustering dokumen jurnal hortikultura sudah baik. Gambar 9 menunjukkan kinerja sistem pada pencarian dokumen jurnal hortikultura. Pengujian pada Dokumen Tanaman Obat Proses pengujian kinerja sistem pada dokumen tanaman obat menggunakan 7 kueri uji (Lampiran 3). Pengujian ini dilakukan untuk mendapat nilai recall dan precision dari sistem temu kembali dokumen tanaman obat. Setelah nilai recall dan precision didapat, kemudian dihitung interpolasi maksimumnya untuk mendapatkan nilai average precision (AVP) yang menggambarkan kinerja sistem secara keseluruhan. Berdasarkan hasil pengujian terhadap seluruh cluster pada dokumen tanaman obat didapat nilai average precision sebesar (Lampiran 4). Hal tersebut menunjukkan bahwa kinerja sistem temu kembali terhadap hasil clustering dokumen tanaman obat sudah baik. Gambar 10 menunjukkan kinerja sistem pada pencarian dokumen tanaman obat. Precision Precision Recall Gambar 9 Grafik R-P pencarian pada dokumen jurnal hortikultura Recall Gambar 10 Grafik R-P pencarian pada dokumen tanaman obat Pengujian pada dokumen jurnal hortikultura mendapatkan hasil yang lebih baik dari pengujian dokumen tanaman obat. Hal ini karena dokumen jurnal hortikultura lebih memiliki penciri yang berbeda dari dokumen lainnya dibandingkan dengan dokumen tanaman obat, sehingga sistem 11
8 dapat menemukembalikan dokumen relevan yang lebih banyak. KESIMPULAN DAN SARAN Kesimpulan Berdasarkan hasil yang diperoleh, dapat disimpulkan bahwa clustering dengan menggunakan algoritme Fuzzy C-Means dapat diterapkan pada dokumen berbahasa Indonesia dengan topik pertanian. Ditinjau dari segi hasil, kinerja sistem clustering terhadap dokumen jurnal hortikultura lebih baik pada saat menggunakan nilai w = 2 sebagai parameter tingkat fuzzy dan threshold = 1.5 sebagai batas minimun bobot term yang diikutsertakan pada proses clustering. Kinerja sistem clustering terhadap dokumen tanaman obat lebih baik pada saat menggunakan nilai w = 2 sebagai parameter tingkat fuzzy dan threshold = 1.5. Penggunaan threshold pada tahap praproses dapat mengurangi dimensi dokumen dan mempengaruhi hasil clustering. Clustering dokumen jurnal hortikultura yang dikelompokkan menjadi tiga cluster oleh manusia ternyata dapat dikelompokkan menjadi empat cluster dan lima cluster oleh sistem. Sistem mampu mendistribusikan dokumen dan menghasilkan cluster dokumen baru yang lebih spesifik yang sebelumnya berdasarkan pengelompokan oleh manusia dianggap termasuk ke dalam cluster yang lebih umum. Saran Salah satu faktor yang menentukan tingkat keakurasian hasil clustering adalah penentuan fitur atau penciri dokumen. Oleh karena itu perlu dicobakan metode lain untuk menentukan fitur dokumen. DAFTAR PUSTAKA Baeza-Yates R, Ribeiro-Neto B Modern Information Retrieval. England: Addison Wesley. Bezdek C James, Ehrlich R, Full W FCM: The Fuzzy C-Means Clustering Algorithm. Computers & Geosciences Vol. 10, No. 2-3, pp Pegamon Press Ltd. USA. Hadi Y H Pembagian Kelas Kuliah Mahasiswa Menggunakan Algoritma Pengklasteran Fuzzy. [skripsi]. Semarang: Jurusan Teknik Elektro, Universitas Diponegoro. Karypis G, Han E Concept Indexing: A Fast Dimensionally Reduction Algorithm with Applications to Document Retrieval & Categorization. Computer Science and Engineering. University of Minnesota. Minneapolis. Kondadadi R, Kozma R A Modified Fuzzy ART for Soft Document Clustering. Memphis: Division of Computer Science, University of Memphis. Manning C D, Raghavan P, Schutze H An Introduction to Information Retrieval. Cambridge: Cambridge University Press. Ramdani H Clustering Konsep Dokumen Berbahasa Indonesia menggunakan Bisecting K-Means. [skripsi]. Bogor: Departemen Ilmu Komputer, Institut Pertanian Bogor. Ridha A Pengindeksan Otomatis dengan Istilah Tunggal untuk Dokumen Berbahasa Indonesia.[skripsi]. Bogor: Departemen Ilmu Komputer, Institut Pertanian Bogor. Win T T, Mon L Document Clustering by Fuzzy C-Mean Algorithm. IEEE : /10. Ali A Sphinx Search Beginner's Guide. Birmingham, England: Packt Publishing. ISBN Antonius T Penggalian Pola Churn Menggunakan Data Mining pada Institusi Perbankan Nasional. [thesis].jakarta: Program Studi Magister Teknologi Informasi, Universitas Indonesia. 12
CLUSTERING DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN FUZZY C-MEANS ISNA MARIAM
CLUSTERING DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN FUZZY C-MEANS ISNA MARIAM DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 CLUSTERING DOKUMEN
Lebih terperinciHASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.
beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j
3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan
Lebih terperinciPenerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia
Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas
Lebih terperinciHASIL DAN PEMBAHASAN. sim(, )=
4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i
Lebih terperinciAnalisis Perbandingan Algoritma Fuzzy C-Means dan K-Means
Analisis Perbandingan Algoritma Fuzzy C-Means dan K-Means Yohannes Teknik Informatika STMIK GI MDD Palembang, Indonesia Abstrak Klasterisasi merupakan teknik pengelompokkan data berdasarkan kemiripan data.
Lebih terperincibeberapa tag-tag lain yang lebih spesifik di dalamnya.
metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista
Lebih terperinciQUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK
QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut
Lebih terperinciPENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS
PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS WULAN ANGGRAENI wulangussetiyo@gmail.com Program Studi Pendidikan Matematika Universitas Indraprasta PGRI Abstract. The purpose of this study was to
Lebih terperinciHASIL DAN PEMBAHASAN. Praproses
5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk
Lebih terperinciINDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id
Lebih terperinciProsiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN :
Clustering Data Status Tugas Belajar Dan Ijin Belajar Menggunakan Metode Fuzzy C-Means (Studi Kasus : Di Lingkungan Pemerintah Provinsi Kalimantan Timur) Fevin Triyas Rantika 1, Indah Fitri Astuti, M.Cs
Lebih terperinciTUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA
TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
Lebih terperinciII TINJAUAN PUSTAKA. * adalah operasi konvolusi x dan y, adalah fungsi yang merepresentasikan citra output,
5 II INJAUAN PUSAKA.1 Fitur Scale Invariant Feature ransform (SIF) Fitur lokal ditentukan berdasarkan pada kemunculan sebuah objek pada lokasi tertentu di dalam frame. Fitur yang dimaksudkan haruslah bersifat
Lebih terperinciHASIL DAN PEMBAHASAN. menggunakan formula (4) dan (5) untuk setiap kelasnya berdasarkan tabel confusion matrix.
yang tidak berarti sebagai pembeda antar dokumen. c. Pembobotan indeks yaitu pembobotan secara lokal dan global. Pembobotan lokal dilakukan dengan cara menghitung frekuensi kemunculan kata dan total seluruh
Lebih terperinciKLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA
KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi Penelitian merupakan acuan dalam pelaksanaan sebuah penelitian. Metodologi penelitian berisi rencana kerja yang berurutan agar hasil yang didapatkan sesuai dengan
Lebih terperinciCLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN
CLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN Fitri Wulandari, Rinto Setiawan Jurusan Teknik Informatika Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif
Lebih terperinciBAB II TINJAUAN PUSTAKA
7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan
Lebih terperinciIntegrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction
Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko
Lebih terperinciIMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS
IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,
Lebih terperinciHASIL DAN PEMBAHASAN. B fch a. d b
7 dengan nilai σ yang digunakan pada tahap pelatihan sebelumnya. Selanjutnya dilakukan perhitungan tingkat akurasi SVM terhadap citra yang telah diprediksi secara benar dan tidak benar oleh model klasifikasi.
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1. Tahapan Penelitian Tahapan penelitian yang dilaksanakan ditunjukan pada Gambar 6. Akusisi Citra INPUT Citra Query Preprocessing Citra Pre processing Citra Ekstraksi Fitur
Lebih terperinciIMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN
IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN. Tabel 4.1 Kebutuhan Perangkat Keras. Perangkat Keras Spesifikasi Processor Intel Core i3. Sistem Operasi Windows 7
BAB IV HASIL DAN PEMBAHASAN 4.1 Kebutuhan Sistem Sebelum melakukan penelitian dibutuhkan perangkat lunak yang dapat menunjang penelitian. Perangkat keras dan lunak yang digunakan dapat dilihat pada Tabel
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas seiring dengan sumber informasi yang banyak merupakan suatu bukti konkret bahwa informasi sangat dibutuhkan
Lebih terperinciIMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN
IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma
Lebih terperinci3. METODOLOGI. Penelitian dilakukan dalam tiga tahap utama : Persiapan, Evaluasi
3. METODOLOGI A. Kerangka Pemikiran Penelitian dilakukan dalam tiga tahap utama : Persiapan, Evaluasi dan Pembuatan Prototipe Sistem (Gambar 3.1). Tahap Persiapan terdiri dari pengumpulan dokumen, input
Lebih terperinciUNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI
UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester
Lebih terperinciSistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Lebih terperinciKLASIFIKASI USAHA KECIL DAN MENENGAH (UKM) SEKTOR INDUSTRI DENGAN METODE FUZZY C-MEANS CLUSTERING WILAYAH KOTA CILEGON
Seminar Nasional IENACO 213 ISSN: 2337-39 KLASIFIKASI USAHA KECIL DAN MENENGAH (UKM) SEKTOR INDUSTRI DENGAN METODE FUZZY C-MEANS CLUSTERING WILAYAH KOTA CILEGON Ratna Ekawati 1),Nurul Yulis 2) 1) Jurusan
Lebih terperinciKLUSTERING BERBASIS PROTOTIPE DENGAN METODE FUZZY C-MEANS
JURNAL LOGIC. VOL.15. NO.1 MARET 015 51 KLUSTERING BERBASIS PROTOTIPE DENGAN METODE FUZZY C-MEANS Putu Manik Prihatini Jurusan Teknik Elektro, Politeknik Negeri Bali Bukit Jimbaran, P.O.Box 1064 Tuban
Lebih terperinciCLUSTERING KONSEP DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN BISECTING K-MEANS HIZRY RAMDANI
CLUSTERING KONSEP DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN BISECTING K-MEANS HIZRY RAMDANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2011 CLUSTERING
Lebih terperinciINTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN
INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com
Lebih terperinciPERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN
PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN Rendy Handoyo 1, R. Rumani M 2, Surya Michrandi Nasution 3 1,2,3 Gedung N-203, Program Studi Sistem
Lebih terperinciKONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431
KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :
Lebih terperinci4 HASIL DAN PEMBAHASAN
4 HASIL DAN PEMBAHASAN Penelitian ini dibuat menggunakan bahasa pemrograman PHP untuk tahapan praproses data, implementasi algoritme DIG dan pembangkitan metafile penyusun struktur digraf. Representasi
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciHASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi.
5 Mulai HASIL DAN PEMBAHASAN Kromosom P = rand [0,1] Ya P < Pm R = random Gen(r) dimutasi Selesai Tidak Gambar 7 Diagram alur proses mutasi. Hasil populasi baru yang terbentuk akan dievaluasi kembali dan
Lebih terperinciFM-UDINUS-BM-08-04/R0 SILABUS MATAKULIAH. Silabus: Information Retrieval Hal: 1 dari 5. Revisi : - Tanggal Berlaku : Januari 2015
SILABUS MATAKULIAH Revisi : - Tanggal Berlaku : Januari 2015 A. Identitas 1. Nama Matakuliah : A11. 54823 / 2. Program Studi : Teknik Informatika-S1 3. Fakultas : Ilmu Komputer 4. Bobot sks : 3 SKS 5.
Lebih terperinciJURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010
PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification
Lebih terperinci4 HASIL DAN PEMBAHASAN
24 4 HASIL DAN PEMBAHASAN 4.1 Data Korpus Data korpus berisi berita-berita nasional berbahasa Indonesia dari tanggal 11 Maret 2002 sampai 11 April 2002. Berita tersebut berasal dari berita online harian
Lebih terperinciEVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA
EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA Fridolin Febrianto Paiki Universitas Papua, Jl. Gunung Salju, Amban, Manokwari ff.paiki@unipa.ac.id
Lebih terperinciBAB V PENUTUP. Menggunakan Metode Fuzzy C-Means Clustering, dapat diambil kesimpulan
BAB V PENUTUP 5.1. Kesimpulan Dari serangkaian uji coba dan analisa yang telah dilakukan pada aplikasi Sistem Pendukung Keputusan Pengadaan Buku Perpustakaan STIKOM Surabaya Menggunakan Metode Fuzzy C-Means
Lebih terperinciRata-rata token unik tiap dokumen
Percobaan Tujuan percobaan ini adalah untuk mengetahui kinerja algoritme pengoreksian ejaan Damerau Levenshtein. Akan dilihat apakah algoritme tersebut dapat memberikan usulan kata yang cukup baik untuk
Lebih terperinciLingkungan Implementasi Clustering Menggunakan SOM HASIL DAN PEMBAHASAN Pengumpulan Data Perkembangan Anak Validasi Cluster Menggunakan
sehingga dapat diproses dengan SOM. Pada tahap seleksi data, dipilih data perkembangan anak berdasarkan kategori dan rentang usianya. Kategori perkembangan tersebut merupakan perkembangan kognitif, motorik
Lebih terperinciPERBANDINGAN KINERJA METODE K-HARMONIC MEANS DAN PARTICLE SWARM OPTIMIZATION UNTUK KLASTERISASI DATA
PERBANDINGAN KINERJA METODE K-HARMONIC MEANS DAN PARTICLE SWARM OPTIMIZATION UNTUK KLASTERISASI DATA Ahmad Saikhu, Yoke Okta 2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi
Lebih terperinciPemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa
Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa Aidina Ristyawan 1), Kusrini 2), Andi Sunyoto
Lebih terperinciBAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen
BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1 Jenis dan Sumber Data Penelitian yang dilaksanakan adalah penelitian eksperimen, yaitu melakukan implementasi algoritma Fuzzy C-Means dalam pengelompokan berdasarkan data
Lebih terperinciBAB V IMPLEMENTASI DAN PENGUJIAN
BAB V IMPLEMENTASI DAN PENGUJIAN 5.1. Tahapan Implementasi Tahap implementasi ini dilakukan setalah tahap analisa dan perancangan selesai dilakukan. Dalam tahap implementasi ini akan dilakukan pengkodingan
Lebih terperinciBernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract
IMPLEMENTASI SISTEM TEMU KEMBALI INFORMASI Studi Kasus: Dokumen Teks Berbahasa Indonesia (IMPLEMENTATION OF INFORMATION RETRIEVAL SYSTEM Case Study: Text Document in Indonesian Language) Bernadus Very
Lebih terperinci1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah
1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari
Lebih terperinciPENDAHULUAN. 1.1 Latar Belakang
DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan
Lebih terperinciABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document
Jurnal Ilmiah Widya Teknik Volume 15 Nomor 2 2016 ISSN 1412-7350 SISTEM PEMEROLEHAN INFORMASI UNDANG-UNDANG DAN KASUS MENGGUNAKAN STRUKTUR DATA INVERTED INDEX DENGAN PEMBOBOTAN TF-IDF Fredes Winda Oktaviani
Lebih terperinciSYSTEM IDENTIFIKASI GANGGUAN STROKE ISKEMIK MENGGUNAKAN METODE OTSU DAN FUZZY C-MEAN (FCM)
SYSTEM IDENTIFIKASI GANGGUAN STROKE ISKEMIK MENGGUNAKAN METODE OTSU DAN FUZZY C-MEAN (FCM) Jani Kusanti Program Studi Teknik Informatika, Fakultas Teknik Elektro dan Informatika Universitas Surakarta (UNSA),
Lebih terperinciKLASIFIKASI SISWA KELAS UNGGULAN MENGGUNAKAN FUZZY C-MEANS
KLASIFIKASI SISWA KELAS UNGGULAN MENGGUNAKAN FUZZY C-MEANS Nunik Mariastuti Wijilestari, Moch. Hariadi Jurusan Teknik Elektro Fakultas Teknologi Industri Institut Teknologi Sepuluh Nopember Surabaya 60
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1. Tahapan Penelitian Metodologi penelitian digunakan sebagai pedoman dalam pelaksanaan penelitian agar hasil yang dicapai tidak menyimpang dari tujuan. Tahapan penelitian
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Sistem Pendukung Keputusan Sebuah aplikasi berupa Sistem Pendukung Keputusan (Decision Support System) mulai dikembangkan pada tahun 1970. Decision Support Sistem (DSS) dengan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Lebih terperinciXML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI
XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 XML RETRIEVAL UNTUK DOKUMEN
Lebih terperinci1. Pendahuluan. 2. Tinjauan Pustaka
1. Pendahuluan Propinsi Daerah Istimewa Yogyakarta sebagai Daerah Tujuan Wisata (DTW) utama indonesia memiliki beraneka ragam jenis wisata yang menarik wisatawan domestik dan wisatawan asing. Banyaknya
Lebih terperinciStemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic
Lebih terperinci1. Pendahuluan 1.1 Latar Belakang
1. Pendahuluan 1.1 Latar Belakang Saat ini, kebutuhan manusia akan teknologi semakin meningkat karena tidak bisa dipungkiri bahwa teknologi tersebut dapat meringankan pekerjaan manusia. Hal ini juga diimbangi
Lebih terperinciStudi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine
Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya Terhadap Peningkatan Kinerja Image Search Engine Nugroho Herucahyono (13504038) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika,
Lebih terperincidan 3. Jumlah partisi vertikal (m) dari kiri ke kanan beturut-turut adalah 1, 2, 3, 4, dan 5. akurasi =.
dan 3. Jumlah partisi vertikal (m) dari kiri ke kanan beturut-turut adalah 1, 2, 3, 4, dan 5. Gambar 5 Macam-macam bentuk partisi citra. Ekstraksi Fitur Pada tahap ini semua partisi dari citra dihitung
Lebih terperinciV HASIL DAN PEMBAHASAN
22 V HASIL DAN PEMBAHASAN 5.1 Karakteristik Video dan Ektraksi Frame Video yang digunakan di dalam penelitian ini merupakan gabungan dari beberapa cuplikan video yang berbeda. Tujuan penggabungan beberapa
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Pada penelitian ini ada beberapa tahapan penelitian yang akan dilakukan seperti terlihat pada gambar 3.1 berikut : Mulai Identifikasi Masalah Pengumpulan Data Analisa Aplikasi
Lebih terperinciCLUSTERING LULUSAN MAHASISWA MATEMATIKA FMIPA UNTAN PONTIANAK MENGGUNAKAN ALGORITMA FUZZY C-MEANS
Buletin Ilmiah Mat. Stat. Dan Terapannya (Bimaster) Volume 02, No.1(2013), hal. 21-26 CLUSTERING LULUSAN MAHASISWA MATEMATIKA FMIPA UNTAN PONTIANAK MENGGUNAKAN ALGORITMA FUZZY C-MEANS Cary Lineker Simbolon,
Lebih terperinciEnigma Journal of Infotmatic (ENJOI 2016) ISSN :
b 1 Kombinasi Fuzzy C-Means Clustering dan MADM Model Yager Untuk Menentukan Kelompok UKT (Studi Kasus Universitas Sembilanbelas November Kolaka) Muhammad Nurtanzis Sutoyo 1 dan Andi Tenri Sumpala 2 12
Lebih terperinciBAB 4 PENGUJIAN DAN EVALUASI. dengan menggunakan 15 tanda tangan yang berasal dari 1 user yang masing masing
BAB 4 PENGUJIAN DAN EVALUASI 4.1 Pengujian Pengujian tanda tangan dilakukan dengan cara meminta masing masing user untuk melakukan 60 tanda tangan. Lalu kami akan menyeleksi tanda tangan mereka dengan
Lebih terperinciPenerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)
157 Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop) Elly Muningsih AMIK BSI Yogyakarta E-Mail : elly.emh@bsi.ac.id Abstrak Berkembangnya
Lebih terperinciBAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang
58 BAB 3 METODE PENELITIAN 3.1 Analisis Masalah Seiring dengan perkembangan zaman, jumlah informasi yang disimpan dalam betuk digital semakin bertambah, sehingga dibutuhkan cara pengorganisasian dan pengelolaan
Lebih terperinciPENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Abstrak
PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Dini Fakta Sari Teknik Informatika STMIK AKAKOM Yogyakarta dini@akakom.ac.id Abstrak Tenaga
Lebih terperinci3 METODE. Implementasi Document Index Graph. Penetapan nilai jarak intercluster. Penetapan nilai jarak intracluster. Stemming Penetapan jumlah dokumen
3 METODE Metode penelitian metafile penyusun struktur digraf menggunakan algoritme Document Index Graph (DIG) terdiri atas beberapa tahapan yaitu tahap analisis masalah dan studi literatur dari penelitian
Lebih terperinciPERBANDINGAN SEGMENTASI CITRA BERWARNA DENGAN FUZZY CMEANS CLUSTERING PADA BEBERAPA REPRESENTASI RUANG WARNA
PERBANDINGAN SEGMENTASI CITRA BERWARNA DENGAN FUZZY CMEANS CLUSTERING PADA BEBERAPA REPRESENTASI RUANG WARNA Naser Jawas Sistem Komputer STMIK STIKOM Bali Jl Raya Puputan No.86 Renon, Denpasar, Bali 80226
Lebih terperinciBreak Even Point Estimation Using Fuzzy Cluster(FCM)
Break Even Point Estimation Using Fuzzy Cluster(FCM) Stefant Cristian, Kartina Diah Kusuma W, S.T., Dadang Syarif SS, S.Si, M.Sc. Politeknik Caltex Riau Jl. Umban Sari No. 1, Phone: 0761-53939, Fax: 0761-554224
Lebih terperincicommit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari
Lebih terperinciIII METODOLOGI PENELITIAN
13 III METODOLOGI PENELITIAN 3.1 Kerangka Penelitian Penelitian dilakukan dalam lima tahapan utama, yaitu ekstraksi frame video, ekstraksi fitur SIFT dari seluruh frame, pembentukan kantong kata visual
Lebih terperinciTabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita
6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional
Lebih terperinciProsiding Seminar Nasional Matematika dan Terapannya 2016 p-issn : ; e-issn :
Prosiding Seminar Nasional Matematika dan Terapannya 2016 p-issn : 2550-0384; e-issn : 2550-0392 PENGELOMPOKAN PERSENTASE PENDUDUK BERUMUR 15 TAHUN KE ATAS MENURUT KABUPATEN/KOTA DAN PENDIDIKAN TERTINGGI
Lebih terperinci1. PENDAHULUAN. Kata Kunci: Data Mining, Clustering, Fuzzy C-Means
CLUSTERING BIDANG PEKERJAAN BERDASARKAN PEMETAAN MATA KULIAH MENGGUNAKAN ALGORITMA FUZZY C-MEANS PADA FAKULTAS ILMU KOMPUTER UNIVERSITAS DIAN NUSWANTORO SEMARANG Taufiq Ramadhan Ashari 1, Ruri Suko Basuki
Lebih terperinciPENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL
Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,
Lebih terperinciLingkungan Pengembangan HASIL DAN PEMBAHASAN
aturan 3--5 untuk menentukan interval akan dibagi menjadi berapa kelompok. Hasilnya akan menjadi hirarki paling atas. Kemudian nilai maksimum dan nilai minimum diperiksa apakah nilainya masuk ke dalam
Lebih terperinciBAB V EKSPERIMEN TEXT CLASSIFICATION
BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan
Lebih terperinciANALISIS KLASTERING LIRIK LAGU INDONESIA
ANALISIS KLASTERING LIRIK LAGU INDONESIA Afdilah Marjuki 1, Herny Februariyanti 2 1,2 Program Studi Sistem Informasi, Fakultas Teknologi Informasi, Universitas Stikubank e-mail: 1 bodongben@gmail.com,
Lebih terperinciAnalisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering
Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering Aufa Bil Ahdi P 1, Kemas Rahmat Saleh W, S.T., M.Eng 2, Anisa Herdiani, S.T., M.T 3 1.2.3 Teknik Informatika,
Lebih terperinciPENERAPAN ALGORITMA K MEANS UNTUK PENENTUAN PENCOCOKAN PEWARNAAN CLUSTERING SECARA OTOMATIS PADA PRODUK FASHION
Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2016, pp. 590~595 PENERAPAN ALGORITMA K MEANS UNTUK PENENTUAN PENCOCOKAN PEWARNAAN CLUSTERING SECARA OTOMATIS PADA PRODUK FASHION 590 Indra Gunawan
Lebih terperinciBAB III METODOLOGI PENELITIAN
28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian
Lebih terperinciBAB III PERANCANGAN SISTEM. pengetahuannya melalui buku-buku yang ada. Pihak perpustakaan harus. sesuai dengan kebutuhan dan anggaran yang disediakan.
BAB III PERANCANGAN SISTEM 3.1 Analisis Permasalahan Perpustakaan merupakan salah satu gudang ilmu pengetahuan bagi sebagian masyarakat. Perpustakaan STIKOM Surabaya merupakan salah satu tempat bagi para
Lebih terperinciImplementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian
Implementasi Sistem Clustering FCM diimplementasikan pada program yang dikembangkan dengan perangkat lunak Matlab v.7.7. Tahap implementasi sistem mengikuti langkahlangkah melakukan clustering dengan FCM,
Lebih terperinciHASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi
4 Perangkat keras berupa Notebook: Processor intel Core i3 2.2 GHz. RAM kapasitas 2. GB. Harddisk Kapasitas 5 GB. Monitor pada resolusi 1366 x 768 piksel. Merek Acer Aspire 475. Perangkat lunak berupa:
Lebih terperinciMelihat Pengaruh Cuaca Terhadap Penyakit Demam Berdarah Di Banjarbaru menggunakan Fuzzy C-Means
Melihat Pengaruh Cuaca Terhadap Penyakit Demam Berdarah Di Banjarbaru menggunakan Fuzzy C-Means Muhammad Halim 1, Andi Farmadi 2, H. Irwan Budiman 3 1,2,3 Prodi Ilmu Komputer FMIPA UNLAM Jl. A. Yani Km
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen
6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat
Lebih terperinciPerbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen
Perbandingan Algoritma Pengelompokan Non-Hierarki untuk Dataset Dokumen Dyah Herawatie Prodi Sistem Informasi Fakultas Sains dan Teknologi Universitas Airlangga Surabaya, Indonesia dy4h_h3r4@yahoo.com
Lebih terperinciDATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA
DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas
Lebih terperinciSistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)
Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Wahyudi,MT Laboratorium Sistem Informasi Fakultas Sains dan Teknologi UINSUSKA RIAU Jl.HR.Subrantas KM.15
Lebih terperinciBAB I PENDAHULUAN 1.1 LATAR BELAKANG
BAB I PENDAHULUAN Pada bab ini akan dibahas latar belakang penelitian, perumusan masalah, tujuan penelitian, manfaat penelitian dan batasan masalah. 1.1 LATAR BELAKANG Perkembangan penggunaan informasi
Lebih terperinci