STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH

Ukuran: px
Mulai penontonan dengan halaman:

Download "STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH"

Transkripsi

1 STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

2 STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

3 ABSTRACT HAFIZHIA DHIKRUL ANUGRAH. Comparative Study of Term Weighting for Information Retrieval on Indonesian Documents. Supervised by JULIO ADISANTOSO. One of the classical models of Information Retrieval (IR) systems is the vector space model. Vector in this model represents the weight of terms contained in the documents and queries. A term can be a word, a phrase, or a unit in a document describing the context of the document. Since each term has a different level of importance in the document, weighting is needed. The commonly used weighting method is TF-IDF (Term Frequency Inverse Document Frequency). Previous research indicates that the distribution of term weighting follow the Poisson distribution, hence a method called RIDF (Residual Inverse Document Frequency) was developed. Other weighting methods by considering the query is called Query Term weighting. Both of the latter methods has not been implemented for documents in Indonesian. This research implements the methods TF-IDF, RIDF and Query Term Weighting on search engine for documents in Indonesian. The result of this research is a search engine with an average precision of 63,9%. Keyword : IDF, Term Weighting, TF, TF-IDF, RIDF, Query Term Weighting

4 Judul Skripsi Nama NIM : Studi Komparatif Pembobotan Kata untuk Temu Kembali Informasi Dokumen Bahasa Indonesia : Hafizhia Dhikrul Anugrah : G Menyetujui: Pembimbing Ir. Julio Adisantoso, M.Kom NIP Mengetahui: Ketua Departemen Ilmu Komputer Dr. Ir. Agus Buono, M.Si, M.Kom NIP Tanggal Lulus:

5 KATA PENGANTAR Alhamdulillahirabbil alamin, puji syukur penulis panjatkan ke hadirat Allah subhanahu wata ala yang telah memberikan rahmat dan karunia-nya sehingga tugas akhir dengan judul Sistem Manajemen Pembelajaran Pemrograman dapat diselesaikan. Shalawat dan salam penulis sampaikan kepada Nabi Muhammad shallallahu alaihi wassalam beserta keluarga, sahabat dan para pengikutnya yang selalu berpegang teguh kepada Al-Quran dan As-Sunnah. Penulis menyadari bahwa tugas akhir ini tidak akan terselesaikan tanpa bantuan dari berbagai pihak. Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada: 1 Ayahanda Yoyo Suwaryo, Ibunda Dedeh Sulastri, serta adik-adik Nuri Dinaliya, Khalifatul Ardy, dan Mohammad Shabry Syukur atas doa, nasihat, semangat, dukungan, dan kasih sayang yang luar biasa kepada penulis. 2 Bapak Ir. Julio Adisantoso, M.Kom selaku dosen pembimbing tugas akhir yang memberikan bimbingan, ide, dukungan, semangat serta kesabaran dalam pengerjaan tugas akhir ini. 3 Bapak Ahmad Ridha, S.Kom, MS dan Bapak Sony H. Wijaya, S.Kom, M.Kom selaku dosen penguji yang telah memberi masukan dan saran pada tugas akhir penulis. 4 Ilman, Ryantie, Tiara, Putra, Pradit, Nanda, Dipo, Dayat, Dani, Catur, dan rekan-rekan seperjuangan di Ilmu Komputer IPB angkatan 45 atas segala kebersamaan, bantuan, dukungan, serta kenangan bagi penulis selama menjalani masa studi. Semoga kita berjumpa kembali kelak sebagai orang-orang sukses. 5 Rekan-rekan satu bimbingan, Rizky Utama Pramudia, Fania Rahmanawati Karimah, Putri Dewi Purnama Sari, Nofel Saputra, Meriska Defriani, Susi Handayani, Meri Marlina, Anita, dan khususnya Alfa Nugraha Pradana yang selalu memberi semangat, bantuan, dan kesetiaannya dalam menemani penulis selama studi di IPB. 6 Para sahabat dan rekan-rekan lainnya, Gina, Mike, Mey, Wuri, Eka, Winda, Encang, Ucha, Ina, Isti, Ojan, Dinie, Aul, Zuma, Depe, Imel, Tika, Ruri, Dila, Aini, Norma, Eja, dan Brud yang telah memberikan bantuan, dukungan, dan semangat dalam mengerjakan skripsi ini. 7 Para peserta seminar yang telah hadir dan memberikan pertanyaan maupun masukan kepada penulis mengenai skripsi ini. Penulisan tugas akhir ini masih terdapat banyak kekurangan dan kelemahan dalam berbagai hal karena keterbatasan kemampuan penulis. Penulis menerima adanya masukan berupa saran atau kritik yang bersifat membangun. Semoga penelitian ini memberikan manfaat dalam proses perkuliahan baik sekarang maupun di masa mendatang. Bogor, April 2013 Hafizhia Dhikrul Anugrah

6 RIWAYAT HIDUP Penulis dilahirkan di Kota DKI Jakarta, pada tanggal 14 Mei 1990 dari pasangan Ibu Dedeh Sulastri dan Bapak Yoyo Suwaryo, merupakan anak pertama dari empat bersaudara. Pada tahun 2008 penulis lulus dari Sekolah Menengah Atas Negeri 47 Jakarta dan diterima di Program Studi Ilmu Komputer Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Setelah menyelesaikan Tingkat Persiapan Bersama di IPB pada tahun 2009, penulis diterima sebagai mahasiswa Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Penulis pernah melaksanakan kegiatan Praktik Kerja Lapangan di Pengembangan dan Pemeliharaan Aplikasi (PPA) Bidang Moneter Bank Indonesia.

7 DAFTAR ISI Halaman DAFTAR TABEL...viii DAFTAR GAMBAR...viii DAFTAR LAMPIRAN...viii PENDAHULUAN... 1 Latar Belakang... 1 Tujuan... 1 Ruang Lingkup... 1 METODE PENELITIAN... 1 Koleksi Dokumen... 1 Praproses Dokumen... 1 Pembobotan TF-IDF... 2 Pembobotan TF-RIDF... 2 Pembobotan Query Term Weighting (TF-F1)... 2 Pemrosesan Kueri... 2 Pemeringkatan Dokumen... 2 Evaluasi Sistem... 3 Lingkungan Implementasi... 3 HASIL DAN PEMBAHASAN... 3 Dokumen Pengujian... 3 Pemrosesan dokumen... 4 Pengujian Kinerja Sistem... 4 SIMPULAN DAN SARAN... 7 Simpulan... 7 Saran... 7 DAFTAR PUSTAKA... 7 LAMPIRAN... 8

8 DAFTAR TABEL Halaman 1 Relevant dan retrieved documents Deskripsi Dokumen Uji Pertanian (.txt) Perbandingan 30 kueri pada sistem... 6 DAFTAR GAMBAR Halaman 1 Tahapan pembangunan sistem Contoh dokumen pengujian Perbandingan asumsi r/r pada pembobotan TF-F Perbandingan pembobotan untuk pembobotan TF-IDF, TF-RIDF, dan TF-F DAFTAR LAMPIRAN Halaman 1 Daftar kueri uji dan dokumen yang relevan Contoh dokumen koleksi pengujian Daftar stopword Daftar AVP pada pengujian pembobotan TF-IDF Daftar AVP pada pengujian pembobotan TF-RIDF Daftar AVP pada pengujian pembobotan TF-F1dengan asumsi 0, Daftar AVP pada pengujian pembobotan TF-F1 dengan asumsi 0, Daftar AVP pada pengujian pembobotan TF-F1 dengan asumsi 0, Antarmuka halaman utama sistem komparatif pembobotan kata Antarmuka hasil pencarian Antarmuka pemilihan dokumen... 30

9 1 Latar Belakang PENDAHULUAN Seiring dengan perkembangan informasi, masalah telah bergeser dari cara mengakses informasi menjadi memilih informasi yang berguna. Pemilihan atau penemuan kembali informasi ini tidak mungkin dilakukan secara manual karena kumpulan informasi yang sangat besar dan terus bertambah besar. Sistem temu kembali informasi (information retrieval system) merupakan sistem yang digunakan untuk menemukan informasi yang relevan dengan kebutuhan pengguna secara otomatis berdasarkan query yang diberikan (Mandala dan Setiawan 2002). Salah satu model sistem temu kembali informasi klasik adalah model ruang vektor (Mandala dan Setiawan, 2002). Vektor dalam model ini merepresentasikan bobot term yang terdapat pada dokumen dan query. Term dapat berupa kata, frasa, atau unit dalam suatu dokumen yang menggambaran konteks dari dokumen tersebut. Karena tiap term memiliki tingkat kepentingan yang berbeda dalam dokumen, maka diperlukan bobot. Metode pembobotan yang umum digunakan ialah TF- IDF (Term Frequency Inverse Document Frequency). Pembobotan melibatkan tiga komponen yaitu pembobotan lokal, global, dan normalisasi (Manning et al. 2008). Pembobotan lokal menentukan posisi kata dalam suatu dokumen sedangkan pembobotan global mengitung posisi kata dalam koleksi. Normalisasi mengubah panjang vektor menjadi vektor satuan. Dalam pembobotan global (IDF), asumsi yang digunakan adalah jika suatu kata mucul hanya dalam beberapa koleksi maka kata itu semakin penting digunakan sebagai penciri. Xia dan Chai (2011) mengungkapkan bahwa sebuah term harus diberi pembobotan yang berbeda. Nanas et al. (2004) menyatakan bahwa pembobotan kata dengan menggunakan log dalam formula IDF menyebar menurut sebaran Poisson sehingga dikembangkan metode Residual Inverse Document Frequency (RIDF). Metode pembobotan global lainnya dengan memperhatikan query disebut Query Term Weighting (F1). Kedua metode terakhir belum pernah diimplementasikan dalam sistem Temu Kembali Informasi dokumen berbahasa Indonesia. Oleh karena itu, penelitian ini mengimplementasikan metode Residual Inverse Document Frequency (TF-RIDF) dan Query Term Weighting (TF-F1) pada mesin pencari dokumen bahasa Indonesia. Tujuan Penelitian ini bertujuan membandingkan metode pembobotan kata TF-IDF, TF-RIDF dan TF-F1 dalam temu kembali informasi dokumen bahasa Indonesia. Ruang Lingkup Dokumen yang digunakan dalam penelitian ini adalah dokumen berbahasa Indonesia dan tidak memperhatikan adanya kesalahan ketik. METODE PENELITIAN Penelitian akan dilakukan dalam beberapa tahap yakni: praproses dokumen, pemrosesan kueri, pemeringkatan dokumen, dan evaluasi hasil temu-kembali informasi. Tahapan-tahapan tersebut dapat dilihat pada Gambar1. Gambar 1 Tahapan pembangunan sistem. Koleksi Dokumen Dokumen yang digunakan sebagai dokumen pengujian adalah korpus yang tersedia di lab Temu Kembali Informasi hasil penelitian Adisantoso & Ridha (2004). Dokumen tersebut merupakan dokumen pertanian yang berjumlah 1000 dokumen dan kueri uji berjumlah 30 kueri dengan daftar dokumen yang relevan (Lampiran 1). Praproses Dokumen Tahapan penelitian dimulai dengan melakukan indexing terhadap dokumen di dalam sebuah korpus. Terdapat tiga tahapan praproses yang digunakan pada penelitian, yaitu: 1 Tokenisasi, adalah suatu proses pemisahan (parsing) kalimat ke dalam unit-unit yang lebih kecil yang disebut token. Hal ini dilakukan dengan cara menghapus semua karakter dalam tanda

10 2 baca yang terdapat pada dokumen dan mengubah kata menjadi lowercase. 2 Pembuangan stopword. Stopword adalah kata-kata umum yang biasanya muncul dalam jumlah yang besar dan dianggap tidak memiliki makna (Manning et al. 2008). 3 Pembobotan menggunakan metode TF- IDF, TF-RIDF, dan TF-F1. Pembobotan TF-IDF Diketahui tf t,d adalah frekuensi kemunculan suatu term t pada dokumen d dan df t adalah banyaknya dokumen di dalam korpus yang mengandung kata tertentu (Manning et al. 2008). Pembobotan TF-IDF memberikan bobot pada term t dalam dokumen d dengan nilai: dengan dokumen dalam koleksi. Pembobotan TF-RIDF, dan N adalah jumlah Nanas et al. (2004) mengungkapkan RIDF merupakan variasi dari IDF yang memberikan bobot untuk term berdasarkan selisih logaritme terhadap IDF sebelumnya. RIDF memakai model Poisson: ( ) dengan Y = 0,1,2,3,, dan tengah sebaran Poisson. adalah nilai Peluang banyaknya peubah acak Y dalam periode waktu t diberikan oleh : ( ). (1) dengan dengan adalah frekuensi kumulatif kata t dalam koleksi. Persamaan (1) digunakan untuk menghitung peluang peubah acak Y. Dengan demikian nilai RIDF kata t adalah ( ) ( ( )) Pembobotan Query Term Weighting (TF-F1) Robertson dan Sparck (1976) mengusulkan perhitungan F1 sebagai solusi untuk penyusunan kemungkinan pembobotan dalam mencari term, yaitu dengan r adalah jumlah dokumen yang ditentukan pengguna yang berisi istilah, R adalah jumlah dokumen yang ditentukan pengguna, n adalah jumlah dokumen dalam koleksi yang mengandung istilah, dan N adalah jumlah dokumen dalam koleksi. Karena r dan R tidak diketahui berapa jumlah dokumen yang ditentukan oleh pengguna sehingga pada penelitian ini r/r diuji dengan tiga nilai asumsi yaitu 0.1, 0.3, dan 0.5. Pemrosesan Kueri Pemrosesan kueri meliputi tokenisasi, pembuangan stopword, dan proses penghitungan pembobotan. Kueri yang dimasukkan akan dilakukan indexing kueri yang dilakukan secara online sehingga diperoleh array kueri yang dapat digunakan dalam proses perhitungan ukuran kesamaan. Pemeringkatan Dokumen Hasil pembobotan yang diperoleh pada pengindeksan korpus secara offline dengan pengindeksan kueri secara online kemudian diperiksa kesamaan dokumen menggunakan ukuran kemiripan kosinus (Cosine Similarity). Ukuran kesamaan kosinus (cosine similarity) adalah sebuah model matematika yang digunakan untuk menghitung kesamaan antara kueri dan dokumen (Manning et al. 2008). Dokumen dan kueri dengan kata penciri digambarkan sebagai model vektor sehingga dapat dihitung kesamaannya (Salton 1989). Misalkan Q w, w,, w ) adalah ( q1 q2 qt Di ( wi 1, wi 2,, wit vektor kueri dan ) adalah vektor dokumen dengan w qj dan w ij sebagai bobot istilah t dalam kueri Q dan dokumen D i. Koefisien kesamaan antara kueri dan dokumen dapat diperoleh dengan rumus inner product: (, i)= w j.w ij =1 Namun demikian, dokumen yang lebih panjang dengan lebih banyak kata penciri memiliki kemungkinan nilai kemiripan yang lebih besar dengan kueri tertentu dibandingkan dokumen-dokumen yang lebih pendek sehingga vektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i menjadi: w j.w ij (, i)=. (2) 2 2 w j wij Formula (2) ini merepresentasikan sudut kosinus antara vektor kueri dan vektor dokumen sebagai vektor-vektor dalam ruang t dimensi, dengan t sebagai jumlah istilah unik dalam sistem (Salton 1989). Dilihat dari hasil kemiripan cosine, semakin tinggi nilai

11 3 pembobotannya menunjukkan bahwa dokumen tersebut memiliki tingkat kemiripan yang besar dari kueri yang diinputkan. Evaluasi Sistem Dua ukuran utama keefektifan penemu kembalian yang telah digunakan sejak lama adalah recall dan precision (Salton 1989). Recall adalah perbandingan jumlah materi relevan yang ditemukembalikan terhadap jumlah materi yang relevan, sedangkan precision adalah perbandingan jumlah materi relevan yang ditemukembalikan terhadap jumlah materi yang ditemukembalikan. Tabel 1 Relevant dan retrieved documents Berdasarkan Tabel 1, recall (R) dan precision (P) dapat dinyatakan sebagai persamaan = Relevant t t t dan = t n. (3) Average precision (AVP) dihitung berdasarkan 11 standard recall levels, yaitu 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% dengan menggunakan interpolasi maksimum (Baeza-Yates & Ribeiro-Neto 1999). Lingkungan Implementasi Non Relevant Retrieved true positive (tp) false positive (fp) Non retrieved false negative (fn) true negative (tn) Lingkungan implementasi yang digunakan adalah sebagai berikut: Perangkat lunak: Microsoft Windows 7 Professional sebagai sistem operasi PHP sebagai bahasa pemrograman Netbeans IDE 7.0 sebagai IDE untuk pembangunan sistem Xampp Server Apache version sebagai server web Notepad++ Microsoft Office 2010 sebagai aplikasi yang digunakan untuk melakukan perhitungan dalam evaluasi Perangkat Keras: Processor Intel Core 2 Duo 2.53 GHz RAM 4 GB Harddisk 320 GB HASIL DAN PEMBAHASAN Dokumen Pengujian Penelitian ini menggunakan 1000 dokumen pertanian yang berasal dari Laboratorium Temu Kembali Departemen Ilmu Komputer IPB. Deskripsi dokumen uji yang digunakan dapat dilihat pada Tabel 2. Tabel 2 Deskripsi Dokumen Uji Pertanian (.txt) Dokumen Bytes Ukuran rata-rata dokumen 4139 Ukuran seluruh dokumen Ukuran dokumen terbesar Ukuran dokumen terkecil 444 Koleksi ini dibuat sesuai struktur tag XML pada masing-masing dokumen. Contoh dokumen pengujian yang digunakan dapat dilihat pada Lampiran 2. Tag XML yang digunakan dalam koleksi dokumen pertanian adalah <DOC></DOC> mewakili keseluruhan dokumen. Di dalamnya terdapat tag lain yang mendeskripsikan isi dokumen secara lebih jelas. <DOCNO></DOCNO> mewakili ID dokumen. ID yang dipakai merupakan kombinasi nama sumber berita, tanggal berita, dan urutan berita pada tanggal yang sama. <TITLE></TITLE> mewakili judul dokumen. <AUTHOR></AUTHOR> menunjukkan penulis dari berita tersebut. <TEXT></TEXT> mewakili isi dokumen. Jumlah kueri uji yang akan digunakan dalam penelitian ini adalah 30 kueri uji dokumen pertanian yang berasal dari Laboratorium Temu Kembali (Lampiran 1). <DOC> <DOCNO>balaipenelitian </DOCNO> <TITLE>PRODUKTIVITAS SOM JAWA (Tal nu pan cula u Gaer n.) </TITLE> <AUTHOR>Ireng Darwati Ireng Darwati, Mono Rahardjo, dan Rosita SMD </AUTHOR> <TEXT> <P>Som Jawa merupakan tanaman yang menghasilkan umbi. Untuk.</P> </TEXT> Gambar 2 Contoh dokumen pengujian.

12 4 Pemrosesan dokumen Pemrosesan dokumen dilakukan melalui beberapa tahapan yaitu: tokenisasi, pembuangan stopword, dan pembobotan. Tahap tokenisasi dilakukan dengan pembacaan karakter per karakter. Tujuannya untuk membedakan karakter-karakter yang bersifat separator. Separator yang dihilangkan yaitu: karakter pemisah indeks istilah (whitespace), karakter angka, titik, koma, dan karakter lainnya yang dianggap kurang representasif dalam mencirikan suatu dokumen. Tahap pembuangan stopword dilakukan setelah hasil tokenisasi dokumen didapatkan. Hasil tokenisasi dibandingkan dengan stopword. Jika token berada di dalam stopword, token tersebut harus dihilangkan. Pembuangan juga dilakukan untuk token yang terdiri atas dua kata karena token tersebut kurang representatif dalam mencirikan suatu dokumen. Daftar stopword yang digunakan dalam penelitian ini diperoleh dari Herdi (2010) dan dicantumkan pada Lampiran 3. Hasil dari tahap ini akan digunakan sebagai input pada tahap selanjutnya yaitu pembobotan. Tahap pembobotan dilakukan secara offline dengan menggunakan TF-IDF, TF-RIDF, dan TF-FI. Untuk semua term pada masing-masing dokumen dihitung bobotnya untuk kemudian digunakan dalam proses temu kembali informasi. Hasil pembobotan tersebut disimpan ke dalam file teks sehingga dapat digunakan pada proses temu kembali. Pengujian Kinerja Sistem Proses evaluasi dalam penelitian ini dilakukan pada koleksi dokumen pertanian. Proses evaluasi pada koleksi dokumen pertanian menggunakan 30 kueri uji yang terdapat pada Laboratorium Information Retrieval. Precision Pencarian dengan kueri uji ini dilakukan dengan melakukan pengukuran recall-precision dari sistem. Perhitungan recall dan precision menggunakan persamaan (3). Hasil dari evaluasi recall precision masing-masing kueri diinterpolasi maksimum untuk mencari nilai average precision (AVP) dan digambarkan dalam bentuk grafik serta tabel (Gambar 3 dan 4). Pada tahap evaluasi penelitian ini, dilakukan beberapa perbandingan hasil temu kembali pada kueri uji berdasarkan metode pembobotan TF- IDF, TF-RIDF dan TF-F1. Kueri yang digunakan untuk evaluasi memiliki panjang dua sampai empat kata. Jumlah kueri yang memunyai panjang kueri dua kata sebanyak 17 kueri, untuk panjang kueri tiga kata sebanyak 9 kueri, dan untuk panjang kueri empat kata sebanyak 4 kueri. Tabel 3 merupakan hasil perbandingan dari 30 kueri yang dimasukkan ke sistem komparatif pembobotan kata. Pada pembobotan TF-FI diggunakan tiga asumsi untuk r/r yaitu 0.1, 0.3, dan 0.5. Nilai AVP TF-F1 dengan asumsi 0.5 memiliki nilai akurasi paling besar dibandingkan yang lainnya, yaitu 63.9% sehingga penelitian ini menggunakan asumsi 0.5 pada pembobotan TF- F1. Perbandingan nilai AVP dengan asumsi 0.1, 0.3, dan 0.5 pada pembobotan TF-F1 dapat dilihat pada Gambar 3. Dibandingkan dengan metode pembobotan lainnya, nilai AVP TF-F1 paling besar. Perbandingan nilai AVP dari pembobotan TF- IDF, TF-RIDF dan TF-F1 dapat dilihat pada Gambar 4. Pada Lampiran 4, 5, 6, 7, dan 8 dapat dilihat nilai AVP pada masing-masing kueri pada pengujian pembobotan TF-IDF, TF- RIDF, TF-F1 dengan asumsi 0.1, 0.3, dan Recall Tf-F1 0.5 Tf-F1 0.1 Tf-F1 0.3 Gambar 3 Perbandingan asumsi r/r pada pembobotan TF-F1.

13 Precision Recall TfIdf TfRidf Tf-F1 Gambar 4 Perbandingan pembobotan untuk pembobotan TF-IDF, TF-RIDF, dan TF-F1.

14 6 Tabel 3 Perbandingan 30 kueri pada sistem Kueri TF-IDF TF-RIDF TF-F1 0,1 TF-F1 0,3 TF-F1 0,5 Bencana Kekeringan Dukungan Pemerintah Pada Pertanian Flu Burung Gabah Kering Giling Gagal Panen Impor Beras Indonesia Industri Gula Institut Pertanian Bogor Kelangkaan Pupuk Kelompok Masyarakat Tani Laboratorium Pertanian Musim Panen Pembangunan Untuk Sektor Pertanian Penerapan Bioteknologi Di Indonesia Penerapan Teknologi Pertanian Penyakit Hewan Ternak Penyuluhan Pertanian Perdagangan Hasil Pertanian Sistem Pertanian Organik Petani Tebu Peternak Ayam Produk Usaha Peternakan Rakyat Pupuk Organik Riset Pertanian Swasembada Pangan Tadah Hujan Tanaman Obat Tanaman Pangan Upaya Peningkatan Pendapatan Petani Harga Komoditas Pertanian Average Precision (AVP)

15 7 Berdasarkan Tabel 3, panjang kueri dua kata mempunyai hasil yang paling optimal untuk menaikkan temu kembali, karena semakin panjang kueri yang diberikan maka dokumen yang di-retrieve semakin tidak relevan. Sistem pembobotan berdasarkan pembobotan TF-F1 memiliki hasil yang lebih baik dari TF-IDF dan TF-RIDF. Namun, terdapat beberapa kueri dari sistem TF-IDF dan TF-RIDF yang memiliki nilai yang lebih baik dari TF-F1. Sebagai contoh kueri tersebut adalah flu burung. Hal tersebut disebabkan oleh jumlah kata pada gugus jawaban dari kueri sedikit. Jumlah kata yang sedikit berakibat pada sedikitnya jumlah paragraf pada dokumen dan mengakibatkan kata penciri pada dokumen tidak tersebar. Pada penelitian ini, penciri yang tidak tersebar menyebabkan penciri dokumen mendapatkan bobot yang kecil dan kinerja sistem menurun. Antarmuka sistem komparatif pembobotan kata ini dapat dilihat pada Lampiran 9, 10, dan 11. Simpulan SIMPULAN DAN SARAN Berdasarkan penelitian yang telah dilakukan, dapat disimpulkan bahwa sistem komparatif pembobotan kata berhasil menerapkan metode pembobotan TF-IDF, TF- RIDF, dan TF-F1. Nilai AVP dari hasil pembobotan TF-F1 lebih besar dibandingkan pembobotan TF-IDF dan TF-RIDF untuk 1000 dokumen pertanian, yaitu 63.9% untuk TF-F1, 54.2% untuk TF-RIDF, dan 51% untuk TF-IDF. Saran Beberapa hal yang perlu dikembangkan dalam penelitian ini: 1 Perlu menggunakan metode pembobotan yang lebih beragam untuk melihat berbagai perbandingan dari metode pembobotan pada sistem temu kembali informasi. DAFTAR PUSTAKA Adisantoso J, Ridha A Corpus Dokumen Teks Bahasa Indonesia untuk Pengujian Efektifitas Temu Kembali Informasi. Laporan Akhir Hibah Penelitian SP4, Departemen Ilmu Komputer FMIPA IPB, Bogor. Baeza-Yates R, Ribeiro-Neto B Modern Information Retrieval. Harlow (UK): Addison Wesley. Herdi H Pembobotan dalam proses pengindeksan dokumen bahasa Indonesia menggunakan framework Indri [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Mandala R, Setiawan H Peningkatan Performansi Sistem Temu Kembali Informasi dengan Perluasan Query secara Otomatis. Bandung, Indonesia: Institut Teknologi Bandung. Manning CD, Raghavan P, Schutze H Introduction to Information Retrieval. Cambridge: Cambridge University Press. Nanas N, Uren V, Roeck AD A Comparative Study of Term Weighting Methods for Information Filtering. Milton Keynes (UK): The Open University Knowledge Media Institute Milton Keynes. Robertson SE, Sparck JK Relevance weighting of search term. Journal of the American Society for Information Science 27: Salton G Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer. Boston: Addison- Wesley. Xia T, Chai Y An Improvement to TF- IDF: Term Distribution based Term Weight Algorithm. Journal of Software 6(3): Perlu adanya pemilihan fitur sehingga hanya token tertentu yang dipilih untuk proses perhitungan.

16 LAMPIRAN

17 9 Lampiran 1 Daftar kueri uji dan dokumen yang relevan Kueri Bencana kekeringan Dukungan pemerintah pertanian Flu burung Gabah giling pada kering Gugus Jawaban gatra070203, gatra161002, gatra210704, gatra301002, indosiar010903, indosiar170603, indosiar220503, indosiar , indosiar310504, kompas210504, kompas250803, mediaindonesia , mediaindonesia110703, mediaindonesia160603, mediaindonesia240503, mediaindonesia260803, mediaindonesia270803, mediaindonesia310503, pikiranrakyat020704, republika , republika , republika , republika , republika , republika , republika , republika200603, republika , republika250604, republika270503, republika , situshijau , suarakarya , suarakarya , suaramerdeka130602, suaramerdeka190903, suarapembaruan150903, suarapembaruan180303, suarapembaruan indosiar070504, jurnal , kompas030401, kompas050303, kompas060503, kompas071100, kompas150201, kompas200802, kompas300402, mediaindonesia130204, mediaindonesia220303, pembaruan110903, poskota040804, republika100903, republika180303, republika210902, republika230903, republika , republika , republika , situshijau , situshijau , situshijau , situshijau , situshijau , suarakarya , suaramerdeka130902, wartapenelitian , wartapenelitian gatra220604, gatra , gatra , gatra300104, indosiar020304, indosiar240204, mediaindonesia090204, mediaindonesia140704, mediaindonesia200204, republika090604, republika , republika , republika , republika , republika , situshijau , suarakarya , suarakarya , suarakarya , suaramerdeka160204, suaramerdeka indosiar180603, indosiar240703, indosiar300304, kompas , kompas , kompas160704, kompas170903, mediaindonesia250304, pikiranrakyat300604, republika040303, republika , republika , republika100804, republika , republika , republika , republika , republika , republika , republika , republika , situshijau , suarakarya , suaramerdeka Gagal panen gatra070203, gatra190802, gatra , gatra301002, indosiar010504, indosiar031203, indosiar040903, indosiar , indosiar070504, indosiar130504, indosiar140204, indosiar160304, indosiar170603, indosiar180304, indosiar240703, indosiar , indosiar , kompas030704, kompas031003, kompas170504, mediaindonesia030603, mediaindonesia , mediaindonesia110703, mediaindonesia140203, mediaindonesia160603, mediaindonesia240503, mediaindonesia310503, republika , republika , republika080703, republika , republika , republika , republika , republika200603, republika , republika , situshijau , situshijau , situshijau , situshijau , suarakarya , suarakarya , suaramerdeka120104, suaramerdeka130602, suarapembaruan120104, suarapembaruan , suarapembaruan

18 10 Lanjutan Kueri Impor Indonesia beras Gugus Jawaban gatra180103, gatra220802, indosiar180603, indosiar180703, indosiar200304, indosiar , kompas , kompas , kompas050602, kompas101002, kompas101004, kompas160704, kompas180504, kompas270401, kompas , kompas310702, mediaindonesia050104, mediaindonesia060803, mediaindonesia100203, mediaindonesia131003, mediaindonesia160603, mediaindonesia250304, republika , republika , republika090902, republika100703, republika , republika , republika , republika , republika , republika , republika , republika , situshijau , suarakarya , suarakarya , suaramerdeka120104, suaramerdeka130104, suaramerdeka , suaramerdeka270601, suarapembaruan100903, suarapembaruan Industri gula gatra200103, kompas031003, kompas250901, mediaindonesia , pikiranrakyat , republika , republika020804, republika090902, republika100902, republika , republika , republika301002, situshijau , suarakarya , suarakarya , suarakarya , suaramerdeka130902, suarapembaruan100903, suarapembaruan Institut pertanian bogor Kelangkaan pupuk Kelompok masyarakat tani Laboratorium pertanian gatra020804, gatra180304, gatra180702, gatra220704, gatra290903, gatra300404, kompas100399, kompas111099, kompas121099, kompas , kompas200704, kompas200799, kompas230704, mediaindonesia080704, mediaindonesia090704, mediaindonesia101003, mediaindonesia , republika , republika061003, republika , republika , republika , republika , republika , republika , republika , republika180303, republika180604, republika , republika , republika211002, republika , republika , situshijau070503, situshijau , situshijau , suarakarya , suarakarya , suarapembaruan150903, suarapembaruan indosiar010704, indosiar060204, indosiar , indosiar200104, indosiar260504, indosiar290604, kompas210504, kompas , pikiranrakyat , republika050604, republika , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka bitraindonesia , indosiar , jurnal , kompas180502, kompas211103, kompas250901, kompas260304, kompas260902, kompas , kompas , kompas , replubika110804, republika030304, republika , republika , republika140703, republika151202, republika180303, republika , republika280703, republika , situshijau070503, situshijau , situshijau , situshijau , situshijau , situshijau , suarakarya , suarakarya , suaramerdeka260902, suarapembaruan090202, suarapembaruan balaipenelitian , gatra100203, indobic , indosiar010704, jurnal , kompas220801, kompas241203, kompas , mediaindonesia , republika , republika , republika , republika , situshijau040603, situshijau , situshijau , situshijau , situshijau , situshijau , suarakarya , suaramerdeka031101

19 11 Lanjutan Kueri Gugus Jawaban Musim panen gatra , gatra , gatra240203, indosiar010504, indosiar , indosiar060204, indosiar071103, indosiar110304, indosiar240604, indosiar300304, kompas , kompas041103, kompas , kompas240103, kompas , mediaindonesia , mediaindonesia230604, pikiranrakyat240404, pikiranrakyat300604, poskota261202, republika , republika , republika , republika151202, republika171102, republika , republika , republika , situshijau , situshijau040603, situshijau , situshijau , situshijau , situshijau , suarakarya , suarakarya , suarakarya , suaramerdeka120104, suaramerdeka290901, suarapembaruan Pembangunan gatra180304, jurnal , kompas020803, kompas031003, untuk sektor kompas060203, kompas060503, kompas100399, kompas101004, pertanian kompas110201, kompas111099, kompas121099, kompas , kompas190802, kompas191099, kompas200799, kompas210502, kompas , kompas230603, kompas240803, kompas260203, kompas270204, kompas280602, kompas290404, mediaindonesia , mediaindonesia060903, mediaindonesia090903, mediaindonesia160903, pembaruan110903, poskota110703, republika060903, republika070104, republika080703, republika100804, republika100903, republika101203, republika , republika , republika , republika150903, republika190803, republika , republika , republika , situshijau , situshijau280203, suarapembaruan Penerapan jurnal , kompas121099, puslitbang , republika bioteknologi 003, republika , situshijau , situshijau , di indonesia situshijau040603, situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau160103, situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau300403, situshijau310303, situshijau no, suarakarya , suarakarya , suarapembaruan020603, suarapembaruan no, harga komoditas pertanian suarapembaruan151102, wartapenelitian indosiar071103,indosiar180603,indosiar221003,indosiar240604,indosiar300304,jurnal ,jurnal ,kompas ,kompas ,kompas ,kompas080702,kompas100399,kompas101004, kompas111099,kompas140802,kompas160304,kompas170104,kompas171002, kompas180502,kompas180504,kompas230603,kompas250901,kompas ,kompas270401,kompas ,kompas280602,kompas311203, mediaindonesia060803,mediaindonesia310503,pikiranrakyat240404, pikiranrakyat300604,poskota ,poskota ,republika ,republika060503,republika ,republika , republika061102,republika090902,republika ,situshijau , situshijau070503,situshijau ,situshijau ,situshijau280203, situshijau ,situshijau ,situshijau , suarakarya ,suarakarya ,suaramerdeka , suaramerdeka290802,suaramerdeka311003,suarapembaruan100903, suarapembaruan220403,trubus000004,wartapenelitian

20 12 Penerapan pertanian Kueri teknologi Penyakit hewan ternak Gugus Jawaban indosiar , jurnal , jurnal , jurnal , jurnal , jurnal , kompas121099, kompas251003, kompas290402, mediaindonesia170403, republika050903, republika , republika , republika , republika201102, republika , republika , republika260803, situshijau , situshijau080103, situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , suarakarya , suarapembaruan No, suarapembaruan060602, suarapembaruan160702, wartapenelitian , wartapenelitian , wartapenelitian gatra , gatra , gatra300104, mediaindonesia090204, republika150103, republika , republika , republika , suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka Penyuluhan pertanian bitraindonesia , gatra , indosiar310504, jurnal , jurnal , kompas050802, kompas130699, kompas170104, kompas , mediaindonesia160603, poskota110703, republika , republika , republika061003, republika171003, republika180303, republika200203, republika , republika , republika , republika , situshijau , situshijau , situshijau , suaramerdeka271102, wartapenelitian , wartapenelitian Perdagangan pertanian hasil Sistem pertanian organik Petani tebu gatra011102, indosiar070204, indosiar201103, jurnal , jurnal , kompas031003, kompas041102, kompas101002, kompas140802, kompas160304, kompas270401, kompas , kompas271103, kompas311203, mediaindonesia030104, mediaindonesia101003, mediaindonesia150903, mediaindonesia170303, republika , republika041102, republika281202, situshijau , situshijau191103, situshijau , suarakarya , suaramerdeka120104, suaramerdeka270601, suarapembaruan , suarapembaruan , wartapenelitian indosiar , jurnal , kompas010499, kompas , kompas050802, kompas081203, kompas181099, kompas221001, kompas241203, kompas260304, kompas , kompas , republika , republika150303, republika180303, situshijau070503, situshijau , situshijau , situshijau , suarakarya , suarapembaruan , suarapembaruan090202, suarapembaruan , suarapembaruan indosiar , indosiar290604, kompas031003, kompas250901, kompas310702, republika , republika020804, republika100902, republika , republika , republika , republika , republika , republika , situshijau280203, suarakarya , suarakarya , suaramerdeka130902, suarapembaruan100903, suarapembaruan220403

21 13 Lanjutan Kueri Gugus Jawaban Peternak ayam gatra , gatra , gatra300104, indosiar020304, indosiar161203, indosiar240204, jurnal , kompas051103, kompas120101, mediaindonesia090204, republika061003, republika , republika , republika , situshijau , suarakarya , suarakarya , suarakarya , suarakarya , suarapembaruan Produk usaha peternakan rakyat jurnal , kompas120101, kompas150201, mediaindonesia010304, mediaindonesia090204, republika , republika150303, republika , republika , republika , republika , republika , republika , situshijau , suarakarya , suarakarya , suarakarya , suarakarya , suarapembaruan Pupuk organik balaipenelitian , kompas , kompas280502, kompas , republika , republika190104, republika201102, republika270604, situshijau , situshijau , suarakarya , suarakarya , suaramerdeka031101, suaramerdeka , suarapembaruan090202, suarapembaruan130103, suarapembaruan160702, suarapembaruan220802, wartapenelitian , wartapenelitian Riset pertanian balaipenelitian , gatra , indobic , jurnal , jurnal , jurnal , jurnal , jurnal , kompas010499, kompas170104, kompas221003, kompas230603, mediaindonesia131003, puslitbang , republika , republika , republika , republika140104, republika , republika , republika , republika , republika , republika , republika241203, republika260803, republika280703, republika , situshijau040603, situshijau070503, situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau no, situshijau , situshijau , situshijau , situshijau250203, situshijau , situshijau , situshijau300403, situshijau310303, suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka270601, suarapembaruan , suarapembaruan020603, suarapembaruan060602, suarapembaruan110702, suarapembaruan , suarapembaruan151102, suarapembaruan160702, suarapembaruan241003, suarapembaruan , wartapenelitian , wartapenelitian

22 14 Lanjutan Kueri Swasembada pangan Gugus Jawaban indosiar , kompas060503, kompas100901, kompas110201, kompas , kompas170104, kompas230603, kompas230899, kompas , kompas270401, kompas , mediaindonesia160603, republika030304, republika060503, republika061003, republika080703, republika , republika , republika , republika , republika , republika , republika , suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka , suarapembaruan110903, suarapembaruan Tadah hujan gatra210704, gatra301002, indosiar , indosiar310504, jurnal , kompas , mediaindonesia160603, mediaindonesia310503, republika , republika , republika , republika , republika , suarakarya , suarakarya , suaramerdeka130602, suarapembaruan , wartapenelitian Tanaman obat balaipenelitian , balaipenelitian , indobic120504, indosiar010704, indosiar , republika , republika , republika270604, republika , situshijau , situshijau041203, situshijau060503, situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau Tanaman pangan bitraindonesia , indosiar , indosiar030304, indosiar , indosiar130104, indosiar130504, indosiar160304, indosiar180304, indosiar310504, kompas020603, kompas120102, kompas120702, kompas171002, kompas180701, kompas240302, kompas260203, kompas311203, mediaindonesia030104, mediaindonesia160603, mediaindonesia170303, mediaindonesia220303, republika030304, republika050903, republika , republika150903, republika200603, republika , republika , republika241203, republika , republika271003, situshijau , situshijau , situshijau , situshijau , suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka160703, suaramerdeka250302, suarapembaruan151102, suarapembaruan Upaya peningkatan pendapatan petani indosiar , jurnal , kompas , kompas031003, kompas100399, kompas170903, kompas200802, kompas210502, kompas260702, kompas , kompas300402, kompas , pembaruan110903, poskota110703, republika , republika , republika , republika , republika230404, republika , republika , republika , republika241203, republika281202, republika , situshijau , situshijau , situshijau , situshijau , situshijau280203, suaramerdeka120104, suaramerdeka , suarapembaruan060602, suarapembaruan , wartapenelitian

23 15 Lampiran 2 Contoh dokumen koleksi pengujian <DOC> <DOCNO>balaipenelitian </DOCNO> <TITLE>PENGARUH JARAK TANAM TERHADAP JUMLAH MATA TUNAS PADA BEBERAPA KLON KAPUK </TITLE> <AUTHOR>MOCH. SAHID, BUADI, dan O.M.Y. FACHRUDIN </AUTHOR> <TEXT> RINGKASAN Percobaan dilakukan di Kebun Percobaan Muktiharjo, Pati dari bulan Desember 1991 sampai dengan Desember Perlakuan disusun secara faktorial dalam rancangan petak terbagi dengan tiga ulangan. Petak utama adalah dua macam jarak tanam kapuk masing-masing 2 m x 1 m dan 2 m x 2 m. Anak petak terdiri dari delapan macam klon sebagai sumber mata tunas yaitu : MH I, MH II, Togo B, (Lanang 36 x Siam) x Congo, (Congo 2 x Lanang), (SS 29 x Congo), (Jepara x Congo 2), dan (P. Gudang x Lanang x Congo). Ukuran petak 20 m x 4 m. Lubang tanam berukuran 0.6 m x 0.6 m x 0.6 m ditanami satu tanaman. Pupuk kandang dicampur dengan tanah digunakan sebagai penimbunan pada saat tanam. Bahan tanaman berupa bibit stum okulasi. Hasil penelitian menunjukkan bahwa jumlah mata tunas aktif dengan jarak tanam 2 m x 1 m lebih banyak dibanding 2 m x 2 m, masingmasing dan mata tunas per hektar, sedang diameter entresnya pada jarak tersebut masing-masing mm dan mm. Jumlah mata tunas aktif tertinggi dihasilkan oleh klon (SS 29 x Congo), yaitu tunas per hektar dan tunas per tanaman. Kata kunci : Ceiba pentandra, jarak tanam, klon, mata tunas, produksi </TEXT> </DOC>

24 16 Lampiran 3 Daftar stopword Acapkali apalagi begini berikut bukankah Ada apalah beginilah berikutnya bukanlah Adakah apanya begitu berjumlah bukannya Adakan apapun begitulah berkat buktikan Adalah arti begitupula berkenaan cara Adanya artian begitupun berkesan cerita Adapun artinya belakang berkesempatan ceritanya Aduh asalan belakangan berkesimpulan contoh Agak asalkan belum berlalu contohkan Agaknya asumsi belumlah berlalunya contohnya Agar asumsinya benar berlama cukup Aja atas benarkah berlangsung Cuma Akalan atasnya benarnya bermula daerah Akan atau berada bersama dahulu Akankah ataukah berakhir bersamaan dalam Akhir ataupun berakhirnya bertepatan dan Akhirnya awal berakibat beruntun dapat Akibat bagai berakibatkan berupa dapatkah Akibatkan bagaikan beralasan besarnya dapatkan Akibatnya bagaimana beralih beserta dapatlah Aku bagaimanakah beralihnya besok dari Ala bagaimanapun beranggapan besoknya darinya Alangkah bagi berapa betapa daripada Alasan baginya berapanya biar dekat Alasannya bagus berapapun biarlah dekatnya Alih bagusnya berarti biasa demi Alihkan bahkan berasumsi biasanya demikian Amat bahwa berbagai bicarakan demikianlah amatlah baik berbagi bicaranya dengan ambil baiknya berbanding bila dengannya anda balik berbeda bilamana depan andai banding berdampak bilang depannya anggap bandingkan berdasarkan bisa di anggapan banyak berhadapan bisakah dia antar banyaknya berharap bisanya dialah antara barangkali berhubung boleh dialami antaranya baru berhubungan boro dialihkan apa bawah beri buat diambil apabila bawahnya berikan buatnya diambilkan apakah beberapa berikanlah bukan diambilnya

25 17 Lanjutan dianggap dimulailah haruslah kapan lakukan diantara dimulainya harusnya karena lalu diantaranya dimungkinkan hendak karenanya lalui diapakan dipaparkan hendaklah kata lama dibagi dipersilahkan hendaknya katakan lanjut dibagikan disaat hingga katakanlah lantaran dibeberapa disebabkan how katanya lantas diberbagai disejumlah ialah kau lebih diberi diseluruh ingin kayak lepas diberikan disertai ini kayaknya lewat diberinya disertakan inilah ke lokasi dibiarkan disimpulkan inipun kebanyakan maka dibiasakan disitulah itu kebetulan makin dibilang ditanggapi itulah kebiasaan mampu dicontoh ditanya itupun kecil mampukah dicontohkan ditanyakan iya kecuali mampunya dicontohkannya dituturkan jadi kemana mana didapat diucapkan jadikan kemanakah manakala didapati dkk jadilah kembali manalagi didapatkan dll jadinya kemudian manapun didapatnya dsb jangan kemungkinan masa didasarkan dua jarang kemungkinannya masih digolongkan dulu jauh kenapa masihkah digunakan dulunya jelaskan kenapakah masing diharapkan empat jika kepada masuk dijadikan enggak jikalau kepadanya masyarakat dijadikannya engkau juga kepala mau dikarenakan esok jumlah ketika maupun dikasih gimana jumlahnya ketimbang melainkan dikata habis justru khususnya melakukan dikatakan habisan juta kini melalui dikatakannya habiskan kabupaten kita melihat dikategorikan habisnya kadang kondisi memang dikembangkan hal kalau kurang memaparkan diketahui hampir kalaupun lagi membagi diketahuinya hanya kali lagian membagikan dilaksanakan hanyalah kalian lagipula memberi dilakukan hari kami lain memberikan dimana harus kamu lainnya memberinya dimulai haruskah kan laksana membiarkan

26 18 Lanjutan membolehkan menuju paparan sambil segera membuat menunjukkan paparkan sambutannya sehabis memeperoleh menurut paparnya sampai seharusnya memiliki menurutnya para sana seharusnyalah meminta menuturkan pasti sang sehingga memperbolehkannya menyatakan pastilah sangat sehubungan mempersilahkan menyebabkan pastinya sangatlah sejak mempunyai menyebutkan pelak satunya sejauhmana memungkinkan menyia pelbagai saya sejumlah menanggapi mereka pemaparan sayangnya sekalian menanggapinya merupakan pembagian seakan sekaligus menanyakan meski pembagiannnya seandainya sekalipun mencapai meskipun pendapat seantero sekarang mencontohkan mesti pengalihan sebab sekata mendapat mestinya pengambil sebabkan sekedar mendapati misal pengambilan sebabnya sekeliling mendapatkan misalkan pengandaian sebagai seketika mendapatkannya misalnya per sebagaimana sekian menerus mudah peralihan sebagainya sekitar mengada mula percuma sebagian selagi mengaku mulai peri sebaik selain mengalami mulainya perihal sebaiknya selalu mengalihkan mulanya perlahan sebaliknya selama mengambil muncul perlu sebanyak selanjutnya mengambilnya mungkin pernah sebelum selesai menganggap mungkinkah persen sebelumnya selesaikah menganggapnya namun pertamanya sebenarnya seluruh mengapa nanti pinggir seberapa seluruhnya mengatakan negara pula seberat semakin mengembangkan nilai pulalah sebesar semampunya mengenai nyaris pun sebetulnya semenjak menggunakan nyiakan rata sebuah sementara mengungkapkan oleh relevankah secara semestinya meningkat orang rendah sedalam semisal meningkatkan pada saat sedang semoga menjadi padahal saatnya sedangkan semua menjadikan padanannya saatnyalah sedapat semuanya menjadikannya paling saja sedemikian semula menjelang panjangnya salah sedikit seolah menjelaskan papar sama sedikitnya seorang

27 19 Lanjutan seorangpun sia tergolong untuk sepadan sialnya terhadap usah sepanjang siap terjadi usahlah sepasang siapa terjadilah usai sepele siapakah terjadinya usianya sependapat siapapun terkadang waktu seperti silahkan terkait waktulah sepertinya singkatnya terkecuali waktunya seputar sini terlalu walau seraya sinilah terlebih walaupun serba situ termasuk warga serentak sosok ternyata yaitu sering sosoknya tersebut yakni seringkali suatu tertentu yang seringkalinya sudah terus seringlah sulit tetap seringnya sungguh tetapi serta sungguhpun tiap sertanya supaya tiba sesaat tak tidak sesama tambahnya tidaklah sesamamu tanggapan tidaknya sesedikit tanggapannya tiga seseorang tanggapnya tinggi sesuai tanpa tutur sesuatu tapi tuturnya sesuatunya tatkala ucap sesudah telah ucapan sesudahnya tempat ucapannya sesukanya tengah ucapkan sesungguhnya tentang ucapnya setelah tentu ujar setelahnya tentunya ujarnya seterusnya tepatnya umpamanya setiap terbagi umum setidak terbalik umumnya setidaknya terbiasa ungkap seusai terbilang ungkapan sewaktu terdapat ungkapkan seyogyanya terdapat ungkapnya

28 Lampiran 4 Daftar AVP pada pengujian pembobotan TF-IDF Kueri Nilai precision pada eleven standard recall Bencana kekeringan Dukungan pemerintah pada pertanian Flu burung Gabah kering giling Gagal panen Impor beras indonesia Industri gula Institut pertanian bogor Kelangkaan pupuk Kelompok masyarakat tani Laboratorium pertanian Musim panen Pembangunan untuk sektor pertanian Penerapan bioteknologi di indonesia Penerapan teknologi pertanian Penyakit hewan ternak Penyuluhan pertanian Perdagangan hasil pertanian Sistem pertanian organik Petani tebu Peternak ayam Produk usaha peternak rakyat Pupuk organik

29 21 Lanjutan Riset pertanian Swasembada pangan Tadah hujan Tanaman obat Tanaman pangan Upaya peningkatan pendapatan petani Harga komoditas pertanian

30 Lampiran 5 Daftar AVP pada pengujian pembobotan TF-RIDF Kueri Nilai precision pada eleven standard recall Bencana kekeringan Dukungan pemerintah pada pertanian Flu burung Gabah kering giling Gagal panen Impor beras indonesia Industri gula Institut pertanian bogor Kelangkaan pupuk Kelompok masyarakat tani Laboratorium pertanian Musim panen Pembangunan untuk sektor pertanian Penerapan bioteknologi di indonesia Penerapan teknologi pertanian Penyakit hewan ternak Penyuluhan pertanian Perdagangan hasil pertanian Sistem pertanian organik Petani tebu Peternak ayam Produk usaha peternakan rakyat Pupuk organik

31 Lanjutan Riset pertanian Swasembada pangan Tadah hujan Tanaman obat Tanaman pangan Upaya peningkatan pendapatan petani Harga komoditas pertanian

32 Lampiran 6 Daftar AVP pada pengujian pembobotan TF-F1dengan asumsi 0,5 Kueri Nilai precision pada eleven standard recall Bencana kekeringan Dukungan pemerintah pada pertanian Flu burung Gabah kering giling Gagal panen Impor beras indonesia Industri gula Institut pertanian bogor Kelangkaan pupuk Kelompok masyarakat tani Laboratorium pertanian Musim panen Pembangunan untuk sektor pertanian Penerapan bioteknologi di indonesia Penerapan teknologi pertanian Penyakit hewan ternak Penyuluhan pertanian Perdagangan hasil pertanian Sistem pertanian organik Petani tebu Peternak ayam Produk usaha peternakan rakyat Pupuk organik

33 Lanjutan Riset pertanian Swasembada pangan Tadah hujan Tanaman obat Tanaman pangan Upaya peningkatan pendapatan petani Harga komoditas pertanian

34 Lampiran 7 Daftar AVP pada pengujian pembobotan TF-F1 dengan asumsi 0,3 Kueri Nilai precision pada eleven standard recall Bencana kekeringan Dukungan pemerintah pada pertanian Flu burung Gabah kering giling Gagal panen Impor beras indonesia Industri gula Institut pertanian bogor Kelangkaan pupuk Kelompok masyarakat tani Laboratorium pertanian Musim panen Pembangunan untuk sektor pertanian Penerapan bioteknologi di indonesia Penerapan teknologi pertanian Penyakit hewan ternak Penyuluhan pertanian Perdagangan hasil pertanian Sistem pertanian organik Petani tebu Peternak ayam Produk usaha peternakan rakyat Pupuk organik

35 Lanjutan Riset pertanian Swasembada pangan Tadah hujan Tanaman obat Tanaman pangan Upaya peningkatan pendapatan petani Harga komoditas pertanian

36 Lampiran 8 Daftar AVP pada pengujian pembobotan TF-F1 dengan asumsi 0,1 Kueri Nilai precision pada eleven standard recall Bencana kekeringan Dukungan pemerintah pada pertanian Flu burung Gabah kering giling Gagal panen Impor beras indonesia Industri gula Institut pertanian bogor Kelangkaan pupuk Kelompok masyarakat tani Laboratorium pertanian Musim panen Pembangunan untuk sektor pertanian Penerapan bioteknologi di indonesia Penerapan teknologi pertanian Penyakit hewan ternak Penyuluhan pertanian Perdagangan hasil pertanian Sistem pertanian organik Petani tebu Peternak ayam Produk usaha peternakan rakyat Pupuk organik

37 29 Lanjutan Riset pertanian Swasembada pangan Tadah hujan Tanaman obat Tanaman pangan Upaya peningkatan pendapatan petani Harga komoditas pertanian

38 Lampiran 9 Antarmuka halaman utama sistem komparatif pembobotan kata Lampiran 10 Antarmuka hasil pencarian Lampiran 11 Antarmuka pemilihan dokumen

dok023.txt, dok110.txt, dok161.txt, dok196.txt, dok248.txt, dok259.txt

dok023.txt, dok110.txt, dok161.txt, dok196.txt, dok248.txt, dok259.txt LAMPIRAN 13 Lampiran 1 Daftar kueri uji dan dokumen yang relevan Kueri Uji cabai merah buah tropika padi budidaya anggrek Dokumen Relevan dok053.txt, dok059.txt, dok061.txt, dok100.txt, dok124.txt, dok153.txt,

Lebih terperinci

Lampiran 1 Antarmuka implementasi

Lampiran 1 Antarmuka implementasi LAMPIRAN 16 Lampiran 1 Antarmuka implementasi 17 17 Lampiran 2 Contoh dokumen XML dalam koleksi pengujian indosiar050704-001 SumKa Presiden Megawati Lakukan

Lebih terperinci

HASIL DAN PEMBAHASAN. sim(, )=

HASIL DAN PEMBAHASAN. sim(, )= 4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j 3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan

Lebih terperinci

beberapa tag-tag lain yang lebih spesifik di dalamnya.

beberapa tag-tag lain yang lebih spesifik di dalamnya. metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista

Lebih terperinci

PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI

PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya. beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini

Lebih terperinci

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009

Lebih terperinci

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 1 PERBANDINGAN

Lebih terperinci

TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA

TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI

MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

Lampiran 1 Contoh koleksi dokumen. <DOC> <DOCNO>gatra </DOCNO> <TITLE>Semarang Kembangkan Sapi Potong Gemuk</TITLE> <AUTHOR>Tma,

Lampiran 1 Contoh koleksi dokumen. <DOC> <DOCNO>gatra </DOCNO> <TITLE>Semarang Kembangkan Sapi Potong Gemuk</TITLE> <AUTHOR>Tma, LAMPIRAN 11 12 Lampiran 1 Contoh koleksi dokumen. gatra230103-002 Semarang Kembangkan Sapi Potong Gemuk Tma, Ant 23 Januari 2003

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium

Lebih terperinci

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA Fridolin Febrianto Paiki Universitas Papua, Jl. Gunung Salju, Amban, Manokwari ff.paiki@unipa.ac.id

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH

PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 XML RETRIEVAL UNTUK DOKUMEN

Lebih terperinci

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,

Lebih terperinci

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis

Lebih terperinci

PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI

PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI

Lebih terperinci

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.

Lebih terperinci

METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA

METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

PEMBOBOTAN DALAM PROSES PENGINDEKSAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN FRAMEWORK INDRI HENDREX HERDI

PEMBOBOTAN DALAM PROSES PENGINDEKSAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN FRAMEWORK INDRI HENDREX HERDI PEMBOBOTAN DALAM PROSES PENGINDEKSAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN FRAMEWORK INDRI HENDREX HERDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen 6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat

Lebih terperinci

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut

Lebih terperinci

DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA

DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA Oleh: YUDHA PERMADI G64102064 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal

Lebih terperinci

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB RIYAN ADI LESMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENGEMBANGAN WORDNET BAHASA

Lebih terperinci

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan

Lebih terperinci

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita 6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan

Lebih terperinci

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract IMPLEMENTASI SISTEM TEMU KEMBALI INFORMASI Studi Kasus: Dokumen Teks Berbahasa Indonesia (IMPLEMENTATION OF INFORMATION RETRIEVAL SYSTEM Case Study: Text Document in Indonesian Language) Bernadus Very

Lebih terperinci

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015

Lebih terperinci

RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR

RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR Oleh: Andika Wahyu Agusetyawan G64101007 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI 18 PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI Karter D. Putung, Arie Lumenta, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi Manado, Indonesia. karterputung@gmail.com,

Lebih terperinci

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah 1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer CORPUS DOKUMEN TEKS BAHASA INDONESIA UNTUK PENGUJIAN EFEKTIVITAS TEMU KEMBALI INFORMASI Oleh: Ir. Julio Adisantoso, M.Kom.

Lebih terperinci

MEN BAHASA INDONESIA MENGGUNAKAN SE EMANTIC SMOOTHING

MEN BAHASA INDONESIA MENGGUNAKAN SE EMANTIC SMOOTHING KLASIFIKASII DOKUMEN BAHASA INDONESIA MENGGUNAKAN SEMANTIC SMOOTHING DENGAN EKSTRAKSI CIRI CHI-SQUARE NOFEL SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMA ATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIANN

Lebih terperinci

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING

Lebih terperinci

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :

Lebih terperinci

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

METODE PEMBOBOTAN KATA BERBASIS SEBARAN UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA PUTRI DEWI PURNAMA SARI

METODE PEMBOBOTAN KATA BERBASIS SEBARAN UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA PUTRI DEWI PURNAMA SARI METODE PEMBOBOTAN KATA BERBASIS SEBARAN UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA PUTRI DEWI PURNAMA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &

Lebih terperinci

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir

Lebih terperinci

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:

Lebih terperinci

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,

Lebih terperinci

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Wahyudi,MT Laboratorium Sistem Informasi Fakultas Sains dan Teknologi UINSUSKA RIAU Jl.HR.Subrantas KM.15

Lebih terperinci

Rata-rata token unik tiap dokumen

Rata-rata token unik tiap dokumen Percobaan Tujuan percobaan ini adalah untuk mengetahui kinerja algoritme pengoreksian ejaan Damerau Levenshtein. Akan dilihat apakah algoritme tersebut dapat memberikan usulan kata yang cukup baik untuk

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE Sri Ulinar Romatua N B¹, Yanuar Firdaus A.w.², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Dengan semakin

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

PERINGKASAN TEKS BERITA SECARA OTOMATIS MENGGUNAKAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) SKRIPSI DANDUNG TRI SETIAWAN

PERINGKASAN TEKS BERITA SECARA OTOMATIS MENGGUNAKAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) SKRIPSI DANDUNG TRI SETIAWAN PERINGKASAN TEKS BERITA SECARA OTOMATIS MENGGUNAKAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) SKRIPSI DANDUNG TRI SETIAWAN 071402054 PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN

Lebih terperinci

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak

Lebih terperinci

Implementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan

Implementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan Scientific Journal of Informatics Vol. 2, No. 2, November 2015 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Implementasi Vector Space Model dalam Pembangkitan Frequently

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

SISTEM TEMU KEMBALI INFORMASI

SISTEM TEMU KEMBALI INFORMASI SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik

Lebih terperinci

POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH

POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA Aida Indriani ) ) Teknik Informatika STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso 8, Tarakan 77 Email

Lebih terperinci

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Pengujian Kerelevanan Sistem Temu Kembali Informasi Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem

Lebih terperinci

KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA

KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

ROCCHIO CLASSIFICATION

ROCCHIO CLASSIFICATION DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

RDF RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA DENGAN PEMBOBOTAN PER KONTEKS REZA KEMAL ZAEN

RDF RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA DENGAN PEMBOBOTAN PER KONTEKS REZA KEMAL ZAEN RDF RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA DENGAN PEMBOBOTAN PER KONTEKS REZA KEMAL ZAEN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015 PERNYATAAN

Lebih terperinci

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN PEMBOBOTAN FITUR KALIMAT YOZI SUKMATUL AHDA

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN PEMBOBOTAN FITUR KALIMAT YOZI SUKMATUL AHDA PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN PEMBOBOTAN FITUR KALIMAT YOZI SUKMATUL AHDA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015 PERNYATAAN

Lebih terperinci

TEMU KEMBALI INFORMASI

TEMU KEMBALI INFORMASI JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 3 MODEL IR Konsep IR Model IR Konsep Boolean Model Pemodelan IR Model IR Konsep Boolean Model Model IR didefinisikan sebagai empat komponen, yaitu:

Lebih terperinci

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK F.13 TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK Bania Amburika 1*,Yulison Herry Chrisnanto 1, Wisnu Uriawan 2 1 Jurusan Informatika, Fakultas MIPA, Universitas

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan

Lebih terperinci

TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL

TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL MICHAEL SENNA SAPUTRA NIM. 1008605062 PROGRAM STUDI TEKNIK

Lebih terperinci

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan pengetahuan dan kehidupan manusia sungguh dipercepat dengan kemudahan akses terhadap begitu banyak informasi. Pada beberapa waktu yang lalu akses terhadap

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian

Lebih terperinci

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN 1 EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci