PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR

Ukuran: px
Mulai penontonan dengan halaman:

Download "PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR"

Transkripsi

1 PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

2 1 PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

3 2 ABSTRACT ARI ALKAUTSAR Comparison of Efficiency Vector Space Model on Information Retrieval System. Supervised by SONY HARTONO WIJAYA. Information retrieval system is a system to represent, store, organize, and process informations. Discovered documents were ranked by vector space model. Normalization of the vector space models similarity consist of cosine, Jaccard, and Dice. This research aims to compare efficiency of three vector space models based on recall and average precision (AVP), computation time, and algorithm complexcity. A thousand document were used in this research. The result showed that each coefficient of vector space model yield equal value for recall and AVP. The measure of similarity in cosine coefficient vector space model better than Jaccard coefficient and Dice coefficient, in terms of algorithms complexity and 3.1% faster than Jaccard coefficient and 9.4% than Dice coefficient, in terms of computation time. Keywords : cosine, Dice, Information Retrieval System, Jaccard, tf-idf, Vector Space Model.

4 3 Judul Skripsi Nama NRP : Perbandingan Efisiensi Model Ruang Vektor pada Sistem Temu Kembali Informasi : Ari Alkautsar : G Disetujui Pembimbing Sony Hartono Wijaya, S.Kom, M.Kom NIP Diketahui Ketua Departemen Ilmu Komputer Dr. Ir. Agus Buono, M.Si, M.Kom NIP Tanggal Lulus:

5 4 PRAKATA Puji dan syukur penulis panjatkan ke hadirat Tuhan Yang Maha Esa karena berkat rahmat dan karunia-nya penulis dapat menyelesaikan skripsi ini. Skripsi ini merupakan hasil penelitian yang dilakukan dari bulan September sampai bulan Februari dengan bidang kajian Perbandingan Efisiensi Model Ruang Vektor pada Sistem Temu Kembali Informasi. Pembuatan skripsi ini tak lepas dari dukungan dan bantuan dari berbagai pihak. Oleh karena itu, penulis menyampaikan rasa terima kasih kepada: 1 Tuhan Yang Maha Esa atas rahmat dan karunia-nya. 2 Bapa, Mamah, Ira, Teteh, A Iwan, dan Rafi yang selalu memberikan dukungan, motivasi, kasih sayang, serta doanya. 3 Bapak Sony Hartono Wijaya, S. Kom, M.Kom selaku dosen pembimbing tugas akhir. Terima kasih atas kesabaran, bimbingan serta dukungan dalam penyelesaian tugas akhir ini. 4 Bapak Ir. Julio Adisantoso, M.Kom dan Bapak Ahmad Ridha, S.Kom, MS selaku dosen penguji. 5 Teman-teman satu bimbingan, Selamat Subu dan Debi, terima kasih atas semangat dan kebersamaannya selama penyelesaian tugas akhir ini 6 Teman-teman seperjuangan Ekstensi Departemen Ilmu Komputer angkatan 4. 7 Teman-teman seperjuangan Manajemen Informatika angkatan Teman-teman kosan White House beserta Dell Inspiron-ku. 9 Seluruh pihak yang turut membantu baik secara langsung maupun tidak langsung dalam pelaksanaan tugas akhir. Semoga hasil penelitian ini dapat bermanfaat dan dapat terus dikembangkan di masa mendatang. Bogor, April 2012 Ari Alkautsar

6 5 RIWAYAT HIDUP Penulis yang dilahirkan di Serang pada tanggal 10 November 1988 merupakan anak kedua dari tiga bersaudara dengan ayah bernama Dedi Cunyadi Atmadipraja dan ibu bernama Mei Heryati. Pada tahun 2006 penulis lulus dari Sekolah Menengah Atas (SMA) Negeri 1 Serang dan diterima di Diploma Tiga Program Keahlian Manajemen Informatika, Institut Pertanian Bogor (IPB) setelah lulus pada tahun 2009, kemudian melanjutkan kuliah untuk gelar sarjana pada tahun 2009 di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, IPB. Pada tahun 2009 penulis berkerja di perusahaan Property Manajemen Mall (PT. Bogor Anggana Cendekia) sebagai IT Support dan pada tahun 2011 penulis bergabung dengan Team Rainvolution untuk mengerjakan project system.

7 6 DAFTAR ISI Halaman DAFTAR TABEL... vi DAFTAR GAMBAR... vi DAFTAR LAMPIRAN... vi PENDAHULUAN Latar Belakang... 1 Tujuan... 1 Ruang Lingkup... 1 Manfaat... 1 TINJAUAN PUSTAKA Sistem Temu Kembali Informasi... 1 Pembobotan tf-idf... 1 Model Ruang Vektor... 2 Kompleksitas Algoritme... 2 Evaluasi Sistem Temu Kembali Informasi... 2 METODE PENELITIAN Koleksi Dokumen Pengujian... 3 Praproses... 3 Pemrosesan Dokumen... 3 Evaluasi... 4 Lingkungan Pengembangan... 4 HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian... 4 Praproses... 4 Pemrosesan Dokumen... 4 Waktu Komputasi... 5 Kompleksitas Algoritme... 5 Evaluasi... 7 KESIMPULAN DAN SARAN Kesimpulan... 8 Saran... 8 DAFTAR PUSTAKA... 8 LAMPIRAN...10

8 7 DAFTAR TABEL Halaman 1 Ilustrasi Recall dan Precision Kompleksitas algoritme koefisien cosine Kompleksitas algoritme koefisien Jaccard Kompleksitas algoritme koefisien Dice Nilai rata-rata waktu komputasi untuk masing-masing koefisien Nilai perbandingan kompleksitas Algoritme... 8 DAFTAR GAMBAR Halaman 1 Diagram Alur Metode Penelitian Grafik recall precision... 7 DAFTAR LAMPIRAN Halaman 1 Contoh Koleksi Dokumen Daftar Kueri dan Dokumen yang Relevan Tampilan Sistem Tabel Recall dan Preccision untuk Semua Ukuran Kesamaan Grafik Waktu Komputasi Tabel Waktu Komputasi...22

9 1 Latar Belakang PENDAHULUAN Semakin populernya penggunaan internet memengaruhi jumlah sumber daya informasi yang semakin besar keragamannya. Informasi yang jumlahnya sedikit dapat dicari secara manual dengan mudah, namun untuk informasi yang jumlahnya besar dibutuhkan suatu sistem yang dapat mencari dengan cepat informasi tersebut. Masalah lain yang dihadapi adalah sistem tidak mampu memeringkat dokumen relevan yang diinginkan pengguna berdasarkan urutan awal hasil pencarian. Untuk memecahkan masalah tersebut, salah satu pendekatan yang digunakan adalah sistem temu kembali informasi. Sistem temu kembali informasi digunakan untuk menemukembalikan informasi yang dianggap relevan terhadap kebutuhan pengguna. Temu kembali informasi yang baik menghasilkan dokumen relevan pada urutan awal hasil pencarian. Banyak model yang dapat digunakan untuk memeringkat dokumen hasil temu kembali informasi, salah satunya adalah model ruang vektor. Idenya adalah memeringkat dokumen hasil temu kembali informasi berdasarkan tingkat relevansi suatu dokumen. Dalam ukuran kesamaan model ruang vektor, terdapat tiga buah koefisien, yaitu koefisien cosine, koefisien Jaccard, dan koefisien Dice. Penelitian model ruang vektor umumnya menggunakan koefisien cosine, seperti Paiki (2006), Rusidi (2008), dan Rahayuni (2011) untuk memeringkat dokumen hasil pencarian. Intan & Defeng (2006) menggabungkan metode tf-idf dan koefisien Jaccard dalam memperkenalkan suatu algoritme search engine berdasarkan konsep High Accuracy Retrieval from Documents (HARD). Nurhanifah (2001) menggunakan metode trigram dengan ukuran kesamaan Dice dalam bentuk hypertext. Penelitian-penelitian tersebut hanya menggunakan satu koefisien model dalam penelitiannya dan tidak ada yang membandingkan kinerja dari model model ruang vektornya. Tujuan Penelitian ini bertujuan membandingkan efisiensi ukuran koefisien kesamaan model ruang vektor berdasarkan recall dan average precision, waktu komputasi, dan kompleksitas algoritme. Ruang Lingkup Ruang lingkup penelitian ini ialah: 1 Model sistem temu kembali informasi yang digunakan adalah model ruang vektor. 2 Terbatas pada perbandingan koefisien model ruang vektor yang dilihat berdasarkan recall dan average precision, waktu komputasi, dan kompleksitas algoritme. Manfaat Kinerja mesin pencari dapat dikembangkan berdasarkan berbagai macam model. Dari penelitian ini, diharapkan dapat diketahui hasil perbandingan pemeringkatan model ruang vektor dan dapat menjadi pembanding kinerja model lain. TINJAUAN PUSTAKA Sistem Temu Kembali Informasi Temu kembali informasi mempelajari algoritme dan model untuk memperoleh informasi dari koleksi dokumen. Sistem temu kembali informasi merupakan sistem untuk merepresentasikan, menyimpan, mengorganisasikan, dan memproses informasi. Sistem temu kembali informasi menyediakan kemudahan akses informasi bagi pengguna. Pengguna harus menerjemahkan kebutuhan informasinya ke dalam bentuk kueri. Dengan adanya kueri yang diberikan pengguna, tujuan utama dari sistem temu kembali informasi adalah mengembalikan informasi yang relevan dengan kueri dan informasi yang tidak relevan sesedikit mungkin (Baeza-Yates & Ribeiro-Neto 1999). Pembobotan tf-idf Metode tf-idf merupakan suatu cara untuk memberikan bobot hubungan suatu kata (term) terhadap dokumen. Menurut Robertson (2005) dalam Intan & Defeng (2006), metode ini menggabungkan dua konsep untuk perhitungan bobot yaitu, frekuensi kemunculan sebuah kata di dalam sebuah dokumen tertentu dan inverse dokumen frekuensi yang mengandung kata tersebut.

10 2 Persamaan metode tf-idf sebagai berikut: dengan: W ij = tf ij (log( N n )) secara umum W ij : bobot kata/term t j terhadap dokumen d i tf ij : jumlah kemunculan kata/term t j dalam d i N : jumlah semua dokumen yang ada dalam pangkalan data n : jumlah dokumen yang mengandung kata/term t j (minimal ada satu kata yaitu term t j ) Model Ruang Vektor Pengukuran kesamaan (similarity measure) model ruang vektor digunakan untuk memeringkat dokumen hasil temu kembali informasi. Salton (1989) dalam Adisantoso (1996) melakukan normalisasi ukuran koefisien kesamaan ini menjadi tiga, yaitu: 1 Koefisien cosine merupakan metode ukuran kesamaan yang paling popular, yaitu dengan menghitung sudut antara vektor dokumen dengan vektor kueri. Persamaannya sebagai berikut: dengan: similarity d j,q = d j q d j x q d j : vektor dokumen q : vektor kueri 2 Koefisien Jaccard adalah salah satu metode yang dipakai untuk menghitung similarity antara dua obyek. Ditemukan oleh Paul Jaccard yang merupakan metode ukuran kesamaan yang digunakan untuk membandingkan kesamaan dan keragaman set sampel. Persamaannya sebagai berikut: d j q similarity d j,q = d j x q - d j q dengan: d j : vektor dokumen q : vektor kueri 3 Koefisien Dice ditemukan oleh Lee Raymond Dice yang merupakan metode ukuran kesamaan yaang berhubungan dengan koefisien Jaccard. Persamaannya sebagai berikut: similarity d j,q = 2 d j q d j x q dengan: d j : vektor dokumen q : vektor kueri Kompleksitas Algoritme Untuk menyelesaikan suatu masalah pemrograman, terdapat berbagai algoritme yang dapat digunakan. Dalam algoritme, harus ada parameter yang bisa dibandingkan agar dapat diselesaikan secara efektif. Dalam aplikasinya, setiap algoritme memiliki dua buah ciri khas yang dapat digunakan sebagai parameter pembanding, yaitu jumlah proses yang dilakukan dan jumlah memori yang digunakan untuk melakukan proses. Jumlah proses ini dikenal sebagai kompleksitas waktu yang disimbolkan dengan T(n), sedangkan jumlah memori ini dikenal sebagai kompleksitas ruang yang disimbolkan dengan S(n). Kompleksitas waktu diukur berdasarkan jumlah proses khas suatu algoritme, bukan berdasarkan run-time secara nyata ketika aplikasi dilakukan. Hal ini disebabkan oleh arsitektur komputer dan kompilator yang berbeda-beda sehingga suatu algoritme yang sama akan menghasilkan waktu eksekusi yang berbeda, pada komputer dan penyusun yang berbeda (Rheinadi 2009). Evaluasi Sistem Temu Kembali Informasi Terdapat banyak jenis ukuran yang dapat digunakan untuk mengevaluasi kinerja suatu sistem temu kembali informasi. Pengukuran yang paling umum menggunakan recall dan precision. Recall adalah rasio jumlah dokumen relevan yang ditemukan kembali dengan total jumlah dokumen dalam kumpulan dokumen yang dianggap relevan, sedangkan precision adalah rasio jumlah dokumen relevan yang ditemukan dengan total jumlah dokumen yang ditemukembalikan (Manning et al. 2008). Ilustrasi recall dan precision dapat dilihat di Tabel 1.

11 3 Tabel 1 Ilustrasi recall dan precision Relevan Non relevan Retrieved tp fp Non retrieved fn tp Recall= ( tp + fn ) tp Precision= ( tp + fp ) tn 1 Proses tokenisasi (tokenizing) yang membagi teks input menjadi unit-unit kecil yang disebut token, yang dapat berupa suatu kata, suatu angka, atau suatu tanda baca. 2 Proses pembuangan kata yang tidak perlu digunakan (stopwords) seperti dan atau yang. 3 Proses indexing menggunakan pembobotan tf-idf. Gambaran sistem dalam penelitian ini dapat dilihat pada Gambar 1. Pengukuran kinerja pemeringkatan dapat dilakukan dengan interpolasi average precision. Interpolasi average precision adalah suatu ukuran evaluasi kinerja temukembali yang diperoleh dengan menghitung rata-rata precision pada berbagai tingkat recall. Standar yang digunakan adalah standar tingkat recall, yaitu 0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, Average precision diformulasikan sebagai berikut: P r = N q i=1 P i (r) N q P r adalah average precision pada level recall r, N q adalah jumlah kueri yang digunakan, dan P i (r) adalah precision pada level recall r untuk kueri ke-i (Baeza-Yates & Ribeiro-Neto 1999). Dokumen Pemrosesan Dokumen Ukuran kesamaan koefisien cosine Praproses Ukuran kesamaan koefisien Jaccard Kueri Praproses Ukuran kesamaan koefisien Dice METODE PENELITIAN Tahapan yang akan dilakukan pada penelitian secara umum terdiri atas tiga tahap, yaitu: Hasil Evaluasi 1 praproses, 2 pemrosesan dokumen, dan 3 evaluasi. Koleksi Dokumen Pengujian Data didapat dari 1000 dokumen pertanian yang ada di pangkalan data Laboratorium Temu Kembali Informasi, Departemen Ilmu Komputer, Institut Pertanian Bogor hasil penelitian Adisantoso & Ridha (2004). Praproses Pada praproses akan dilakukan tiga tahap, yaitu: Gambar 1 Diagram alur metode penelitian. Pemrosesan Dokumen Pengukuran kesamaan yang dibandingkan menggunakan metode dari model ruang vektor yaitu koefisien cosine, Jaccard, dan Dice. Hasil temu kembali dari masing-masing ukuran koefisien kesamaan akan dibandingkan berdasarkan 3 hal yaitu recall dan average precision, waktu komputasi dan kompleksitas algoritme.

12 4 Evaluasi Pengukuran yang digunakan untuk mengevaluasi kinerja suatu sistem temu kembali informasi dalam penelitian ini adalah recall dan precision. Hasil perhitungan recall dan precision untuk masing-masing pembobotan akan digambarkan dalam bentuk grafik, kemudian dilakukan perhitungan interpolasi maksimum untuk mendapatkan nilai average precision yang akan digambarkan melalui tabel. Dihitung juga nilai kompleksitas algoritme dan waktu komputasi, kemudian dibandingkan untuk masing-masing koefisien. Lingkungan Pengembangan Penelitian ini dilakukan dengan menggunakan bantuan perangkat keras dan perangkat lunak dengan spesifikasi sebagai berikut: Perangkat lunak: Microsoft Windows 7 Ultimate, xampp sebagai web server. Perangkat keras: AMD E-350 Processor 1.6 GHz, 2 GB RAM, Hard disk 300 GB. HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Koleksi dokumen yang digunakan untuk menguji sistem berasal dari korpus yang sudah tersedia di Laboratorium Temu Kembali Informasi, Departemen Ilmu Komputer IPB. Koleksi terdiri atas 1000 dokumen dengan format teks (.txt) dengan struktur tag XML pada masing-masing dokumen. Contoh dokumen uji dapat dilihat di Lampiran 1. Tag yang digunakan dalam dokumen, yaitu : <doc></doc> mewakili keseluruhan dokumen. Di dalamnya terdapat tag lain yang mendeskripsikan isi dokumen lebih jelas. <docno></docno> mewakili ID dokumen. ID yang dipakai merupakan kombinasi nama sumber berita, tanggal, dan urutan berita pada tanggal yang sama. <title></title> mewakili judul dokumen. <author></author> mewakili penulis dokumen. <text></text> mewakili isi dokumen. Jumlah kueri uji yang akan digunakan dalam penelitian ini adalah 30 kueri uji dokumen pertanian yang berasal dari Laboratorium Temu Kembali Informasi. Daftar kueri uji yang digunakan dalam penelitian ini dapat dilihat pada Lampiran 2. Praproses Praproses dilakukan dengan tahapan tokenisasi, pembuangan kata yang tidak perlu, dan pembobotan. Tahap tokenisasi dilakukan dengan pembacaan karakter per karakter. Tujuannya untuk membedakan karakter-karakter yang bersifat separator. Separator yang dihilangkan, yaitu: karakter pemisah indeks istilah (whitespace), karakter angka, titik, koma, dan karakter lainnya yang dianggap kurang representasif dalam mencirikan suatu dokumen. Tahap pembuangan stopword dilakukan setelah hasil tokenisasi dokumen didapatkan. Hasil tokenisasi dibandingkan dengan stopword. Jika token berada di dalam stopword, token tersebut harus dihilangkan. Pembuangan token juga dilakukan untuk token yang terdiri atas dua huruf karena token tersebut kurang representatif dalam mencirikan suatu dokumen. Pembobotan dimulai dengan mendapatkan frekuensi tiap token di dalam setiap dokumen (tf), setelah itu dihitung jumlah dokumen yang mengandung token tertentu (df). Hasil dari df akan digunakan untuk mendapatkan nilai idf (Inverse document frequency) dari setiap token. Hasil idf ini disimpan dalam file Idf.txt. Pembobotan tf-idf didapatkan dari hasil perkalian antara tf dan idf. Hasil perhitungan tf-idf juga disimpan ke dalam file tf-idf.txt untuk mempermudah proses perhitungan selanjutnya. Hasil pemrosesan dokumen digunakan untuk menghitung kesamaan kueri dengan dokumen menggunakan tiga koefisien model ruang vektor. Pemrosesan Dokumen Ukuran kesamaan yang digunakan untuk Menghitung bobot antara dokumen dan kueri yang pertama adalah koefisien cosine. Hasil dari koefisien cosine akan diurutkan berdasarkan dokumen yang memunyai kesamaan terbesar sampai terkecil. Di bawah ini adalah 10 hasil teratas dari dokumen koefisien cosine dengan kueri bencana kekeringan.

13 5 mediaindonesia => gatra => indosiar => mediaindonesia => kompas => mediaindonesia => indosiar => mediaindonesia => indosiar => republika => Ukuran kesamaan kedua adalah koefisien Jaccard, dengan urutan yang tidak berbeda jika dibandingkan dengan cosine. Di bawah ini adalah 10 hasil teratas dari koefisien Jaccard. mediaindonesia => gatra => indosiar => mediaindonesia => kompas => mediaindonesia => indosiar => mediaindonesia => indosiar => republika => Begitu juga dengan koefisien Dice tidak terlihat perbedaan urutan dalam pemeringkatan hasil temu kembali informasi. Di bawah ini adalah 10 hasil teratas dari koefisien Dice. mediaindonesia => gatra => indosiar => mediaindonesia => kompas => mediaindonesia => indosiar => mediaindonesia => indosiar => republika => Waktu Komputasi Waktu komputasi dalam ukuran detik, diambil sebanyak 5 kali, kemudian dibuat nilai rata-rata dari masing-masing nilai berdasarkan kueri. Grafik waktu komputasi dapat dilihat di Lampiran 5 dan tabel waktu komputasi dapat dilihat di Lampiran 6. Kompleksitas Algoritme Kompleksitas algoritme diambil dari masing-masing nilai koefisien. Setiap proses dihitung kompleksitasnya, kemudian dibuat nilai notasi Big-O untuk hasilnya. Notai Big- O yang digunakan karena notasi ini mendeskripsikan kinerja kasus terburuk (worst-case) dari suatu algoritme, sehingga Big-O dapat menjamin bahwa suatu algoritme tidak akan lebih buruk dari worst-case. Tabel 2, 3, dan 4 menunjukkan hasil perhitungan kompleksitas untuk masing-masing koefisien model ruang vektor. Tabel 2 Kompleksitas algoritme koefisien cosine. Algoritme T(n) procedure cosine() cosine <- 0 1 ids <- '' 1 data <- array() 1 Idf <- idf in procedure 1 idf for each idf in array 3*n = to length(id) do: 3n for each array in 3*n*n = termfreq to length(term) do: if term <- q1 or term 4 n 2 <- q2 do: termfreq_q <- 1 2 n 2 Else termfreq_q <- 0 2 n 2 end if tfidf_d <- 4 n 2 termfreq*idf[term] tfidf_q <- 4 n 2 termfreq_q*idf[term] if ids <- id do 2 n 2 atas += tfidf_d*tfidf_q bawah1 += tfidf_d*tfidf_d bawah2 += tfidf_q*tfidf_q else atas <- 0 n 2 atas += tfidf_d*tfidf_q hasilbawah1 <- sqrt(bawah1) hasilbawah2 <- sqrt(bawah2) hasilbawah <- hasilbawah1 * hasilbawah2 bawah1 <- 0 n 2 bawah2 <- 0 n 2

14 6 Algoritme T(n) bawah1 += $tfidf_d*$tfidf_d bawah2 += $tfidf_q*$tfidf_q end if ids <- id 2 n 2 end for hasilbawah1 <- 3 n sqrt(bawah1) hasilbawah2 <- 3 n sqrt(bawah2) hasilbawah <- 3 n hasilbawah1 * hasilbawah2 cosine <- 3 n atas/hasilbawah end for end procedure Total T(n) n + 4 Tabel 3 Kompleksitas algoritme koefisien Jaccard. Algoritme T(n) procedure Jaccard() Jaccard <- 0 1 ids <- '' 1 data <- array() 1 Idf <- idf in 1 procedure idf for each idf in array 3*n = 3n to length(id) do: for each array in 3*n*n = termfreq to length(term) do: if term <- q1 or term 4 n 2 <- q2 do: termfreq_q <- 1 2 n 2 else termfreq_q <- 0 2 n 2 end if tfidf_d <- 4 n 2 termfreq*idf[term] tfidf_q <- 4 n 2 termfreq_q*idf[term] if ids <- id do 2 n 2 atas += tfidf_d*tfidf_q bawah1 += tfidf_d*tfidf_d bawah2 += tfidf_q*tfidf_q else atas <- 0 n 2 Algoritme T(n) atas += tfidf_d*tfidf_q hasilbawah1 <- sqrt(bawah1) hasilbawah2 <- sqrt(bawah2) hasilbawah <- hasilbawah1 * hasilbawah2 bawah1 <- 0 n 2 bawah2 <- 0 n 2 bawah1 += $tfidf_d*$tfidf_d bawah2 += $tfidf_q*$tfidf_q end if ids <- id 2 n 2 end for hasilbawah1 <- 3 n sqrt(bawah1) hasilbawah2 <- 3 n sqrt(bawah2) hasilbawah <- 3 n hasilbawah1 * hasilbawah2 hasilbawah_jaccard <- 3 n hasilbawah-atas jacard <- atas/ 4 n hasilbawah-atas end for end procedure Total T(n) n + 4 Tabel 4 Kompleksitas algoritme koefisien Dice. Algoritme T(n) procedure Dice() Dice <- 0 1 ids <- '' 1 data <- array() 1 Idf <- idf in procedure 1 idf for each idf in array 3*n = to length(id) do: 3n for each array in 3*n*n = termfreq to length(term) do: if term <- q1 or term 4 n 2 <- q2 do: termfreq_q <- 1 2 n 2 else termfreq_q <- 0 2 n 2 end if

15 7 Algoritme T(n) tfidf_d <- 4 n 2 termfreq*idf[term] tfidf_q <- 4 n 2 termfreq_q*idf[term] if ids <- id do 2 n 2 atas += tfidf_d*tfidf_q bawah1 += tfidf_d*tfidf_d bawah2 += tfidf_q*tfidf_q else atas <- 0 n 2 atas += tfidf_d*tfidf_q hasilbawah1 <- sqrt(bawah1) hasilbawah2 <- sqrt(bawah2) hasilbawah <- hasilbawah1 * hasilbawah2 bawah1 <- 0 n 2 bawah2 <- 0 n 2 bawah1 += $tfidf_d*$tfidf_d bawah2 += $tfidf_q*$tfidf_q end if ids <- id 2 n 2 end for hasilbawah1 <- 3 n sqrt(bawah1) hasilbawah2 <- 3 n sqrt(bawah2) hasilbawah <- 3 n hasilbawah1 * hasilbawah2 atas_dice = 2 * atas 2 n Dice = 3 n atas_dice/hasilbawah end for end procedure Total T(n) 56 n n + 4 Evaluasi ini menggunakan nilai recall precision. Hasil evaluasi recall precision dari masing-masing kueri diinterpolasi maksimum untuk mencari nilai average precision dan digambarkan dalam bentuk grafik serta tabel di Gambar 2. Gambar 2 Grafik recall precision Gambar 2 menggambarkan bahwa temu kembali menghasilkan nilai average precision (AVP) sebesar dengan recall rata-rata Dari ketiga perhitungan koefisien di atas, tidak dapat disimpulkan mana yang terbaik karena masing-masing koefisien memiliki nilai keterurutan yang sama. Dalam waktu komputasi, diperoleh perbandingan nilai rata-rata koefisien cosine detik, Jaccard detik, dan Dice detik. Tabel 5 akan menunjukkan perbandingan nilai rata-rata waktu komputasi. Tabel 5 Koefisien Nilai rata-rata waktu komputasi masing-masing koefisien. Waktu Komputasi Cosine Jaccard Dice Kompleksitas algoritme cosine adalah 53 n n + 4, Jaccard n + 4, dan Dice 56 n n + 4 sehingga semua koefisien memiliki notasi Big-O yang sama yaitu O(n 2 ). Evaluasi Proses evaluasi dokumen menggunakan 30 pasangan kueri dengan dokumen relevan. Nilai rata-rata koefisien cosine 3.1% lebih cepat dari koefisien Jaccard dan 9.4% lebih cepat dari koefisien Dice. Kompleksitas algoritme cosine n + 4, Jaccard n + 4, dan Dice 56 n n + 4. Tabel 6 akan menunjukkan perbandingan nilai kompleksitas algoritme dari masing-masing koefisien.

16 8 Tabel 6 Koefisien Nilai perbandingan kompleksitas algoritme. Kompleksitas Alg Cosine n + 4 Jaccard n + 4 Dice 56 n n + 4 Dari ketiga koefisien di Tabel 6, disimpulkan bahwa nilai notasi Big-O adalah O(n 2 ). Koefisien cosine memiliki kompleksitas terbaik dengan tingkat kompleksitas yang lebih rendah dibanding koefisien lain. Kesimpulan KESIMPULAN DAN SARAN Penelitian ini membandingkan efisiensi model ruang vektor pada sistem temu kembali informasi. Dari hasil yang didapat, dapat disimpulkan bahwa: 1 Masing-masing koefisien dalam ukuran kesamaan model ruang vektor memiliki nilai yang sama untuk recall dan AVP. 2 Ukuran kesamaan model ruang vektor koefisien cosine lebih baik dibanding dengan koefisien Jaccard dan koefisien Dice dalam hal kompleksitas algoritme dan waktu komputasi. Saran Beberapa hal yang perlu dikembangkan dalam penelitian selanjutnya ialah: 1 Penggunaan variant lain dari pembobotan tf-idf. 2 Perlu diujicoba dengan menggunakan dokumen yang jumlahnya lebih banyak dan ukuran dokumen yang sama, seperti berita. DAFTAR PUSTAKA Adisantoso J Pendekatan kuantitatif untuk penelusuran informasi. Forum Statistika dan Komputasi 2(1): Adisantoso J, Ridha A Corpus Dokumen Teks Bahasa Indonesia untuk Pengujian Efektivitas Temu Kembali Informasi. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Istitut Pertanian Bogor. Aly AA Using a query technique to improve document retrieval. Information Technologies and Knowledge 2: Baeza-Yates R, Ribeiro-Neto B Modern Information Retrieval. New York: Addison-Wesley. Intan R, Defeng A Hard: subject-based search engine menggunakan tf-idf dan Jaccard s coefficient. Jurnal Teknik Industri 8(1): Manning CD, Raghavan P, Schütze H Introduction to Information Retrieval. Cambridge: Cambridge University Press. Nurhanifah S Pencarian informasi dengan metode trigram [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Paiki FF Evaluasi penggunaan similarity thesaurus terhadap ekspansi kueri dalam sistem temu kembali informasi berbahasa Indonesia [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Rahayuni N Ekspansi kueri pada sistem temu kembali informasi berbahasa Indonesia menggunakan thesaurus [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Rheinadi R Analisis algoritme bubble sort [skripsi]. Bandung: Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung. Ridha A Pengindeksan otomatis dengan istilah tunggal untuk dokumen berbahasa Indonesia [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Robertson S Understanding Inverse Document Frequency: On theoretical arguments for IDF: Journal of Documentation 60(5): Rusidi Ekspansi kueri dalam sistem temu kembali informasi berbhasa Indonesia menggunakan peluang bersyarat [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

17 9 Salton, G Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer. New York: Addison-Wesley. Sitohang NL Ekspansi kueri pada sistem temu kembali informasi berbahasa Indonesia menggunakan kamus dwibahasa [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Telaumbanua P Analisis perbandingan algoritme kompresi Lempel Ziv Welch, Arithmetic Coding, dan Run-Length Encoding pada file teks [skripsi]. Universitas Sumatera Utara.

18 LAMPIRAN 10

19 11 Lampiran 1 Contoh koleksi dokumen <DOC> <DOCNO>gatra011102</DOCNO> <TITLE>Banten Kembangkan Agroindustri </TITLE> <AUTHOR>Ark, Ant</AUTHOR> <TEXT> <P>Selain industri kimia dan parawisata, provinsi Banten juga melirik agroindustri. Provinsi pecahan Jawa Barat ini akan mengembangkan `Agroindustrial Park`, yaitu sebuah kawasan indutri pengolahan hasil pertanian, di Cilegon itu diungkapkan Gubernur Banten, Dr Djoko Munandar, di Serang, Jumat.</P> <P>"Nantinya kawasan ini akan menjadi pusat pengolahan berbagai produk pertanian, walaupun bahan bakunya tidak hanya dipasok dari Banten, tetapi akan makin memacu kemajuan pertanian di provinsi ini," katanya, seusai acara gelar wicara tentang upaya peningkatan produk olahan dan pemasaran hasil pertanian, di Aula Kantor Gubernuran.</P> <P>Program itu menurut Djoko merupakan program makro pengembangan pertanian Banten dengan konsep `Banten Sebagai Bagian Dari Agroindustri Nasional`.</P> <P>Sementara itu, program mikro berupa pemberdayaan petani kecil tetap berjalan dan menjadi prioritas.</p> <P>Djoko menjelaskan Banten mempunyai posisi yang strategis karena berada di lintasan Jawa- Sumatera, mempunyai prasarana yang lengkap mulai dari Pelabuhan, Bandara, jaringan jalan tol, serta dekat dengan akses pasar dalam negeri seperti Jakarta dan Jawa Barat.</P> <P>Untuk mendukung kawasan tersebut, maka Pemprov Banten juga merencanakan membangun Terminal Agribisnis di Cilegon serta Sub Terminal yang ada di ibukota kabupaten, sehingga akses pasar petani akan semakin mudah.</p> <P>Pada acara itu, Dekan Fakultas Pertanian Untirta Ir Mukhtar mengatakan, Banten ke depan perlu mengembangkan pertanian berbasis teknologi, dan tidak sekedar tergantung pada lahan seperti pengembangan pertanian hidroponik dan rekayasa genetik.</p> <P>"Saat ini saya perkirakan baru 60 persen saja petani yang benar-benar menggarap tanaman padi sesuai panca usaha tani," ujarnya.</p> <P>Selain itu, ia mengungkapkan keberadaan beberapa pabrik makanan ternak skala besar di Banten belum mampu menggairahkan petani untuk berlomba memasok bahan baku seperti jagung dan kedele, karena produk mereka sering ditolak oleh pabrik, karena alasan tidak memenuhi standar mutu.</p> <P>"Oleh karena itu, perlu peningkatan pengetahuan petani tentang mutu produksi dan pasca panen, sehingga hasil pertanian mereka tidak lagi ditolak," katanya.</p> <P>Sementara itu, Kepala Dinas Pertanian dan Peternakan Banten Ir Hilman mengatakan, pengembangan pabrik pakan ternak rakyat perlu ditumbuhkan untuk menampung bahan baku yang ditolak pabrik hanya karena kadar air yang masih tinggi.</p> <P>"Di daerah lain ternyata berhasil membangun pabrik skala kecil yang dikelola dengan sistem kemitraan dengan para peternaknya seperti di Pangalengan, Bandung dan di Bogor," ujarnya.</p> </TEXT> </DOC>

20 12 Lampiran 2 Tabel daftar istilah kueri dan dokumen yang relevan No Kueri Gugus Jawaban 1 bencana kekeringan 2 dukungan pemerintah pada pertanian gatra txt, gatra txt, gatra txt, gatra txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, kompas txt, kompas txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, pikiranrakyat txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt. indosiar txt, jurnal txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, mediaindonesia txt, pembaruan txt, poskota txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, suarakarya txt, suaramerdeka txt, wartapenelitian txt, wartapenelitian txt. 3 flu burung gatra txt, gatra txt, gatra txt, gatra txt, indosiar txt, indosiar txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, suarakarya txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suaramerdeka txt. 4 gabah kering giling 5 gagal panen indosiar txt, indosiar txt, indosiar txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, pikiranrakyat txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, suarakarya txt, suaramerdeka txt. gatra txt, gatra txt, gatra txt, gatra txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt,

21 13 Lampiran 2 Lanjutan No Kueri Gugus Jawaban 6 harga komoditas pertanian 7 impor beras indonesia 8 industri gula republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt. indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, jurnal txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, mediaindonesia txt, pikiranrakyat txt, pikiranrakyat txt, poskota txt, poskota txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suaramerdeka txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt, trubus txt, wartapenelitian txt. gatra txt, gatra txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suaramerdeka txt, suaramerdeka txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt. gatra txt, kompas txt, kompas txt, mediaindonesia txt, pikiranrakyat txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, suarakarya txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt.

22 14 Lampiran 2 Lanjutan No Kueri Gugus Jawaban 9 institut pertanian bogor 10 kelangkaan pupuk 11 kelompok masyarakat tani 12 laboratoriu m pertanian 13 musim panen gatra txt, gatra txt, gatra txt, gatra txt, gatra txt, gatra txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, suarakarya txt, suarakarya txt, suarapembaruan txt, suarapembaruan txt. indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, kompas txt, kompas txt, pikiranrakyat txt, republika txt, republika txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suaramerdeka txt. bitraindonesia txt, indosiar txt, jurnal txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, replubika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt. balaipenelitian txt, gatra txt, indobic txt, indosiar txt, jurnal txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, suarakarya txt, suaramerdeka txt. gatra txt, gatra txt, gatra txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, mediaindonesia txt, pikiranrakyat txt, pikiranrakyat txt, poskota txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt,

23 15 Lampiran 2 Lanjutan No Kueri Gugus Jawaban 14 pembangun an untuk sektor pertanian 15 penerapan bioteknolo gi di indonesia 16 penerapan teknologi pertanian situshijau txt, situshijau txt, suarakarya txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suaramerdeka txt, suarapembaruan txt. gatra txt, jurnal txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, pembaruan txt, poskota txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, suarapembaruan txt. jurnal txt, kompas txt, puslitbang txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau no.txt, suarakarya txt, suarakarya txt, suarapembaruan txt, suarapembaruan no.txt, suarapembaruan txt, wartapenelitian txt. indosiar txt, jurnal txt, jurnal txt, jurnal txt, jurnal txt, jurnal txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, suarakarya txt, suarapembaruan no.txt, suarapembaruan txt, suarapembaruan txt, wartapenelitian txt, wartapenelitian txt, wartapenelitian txt.

24 16 Lampiran 2 Lanjutan No Kueri Gugus Jawaban 17 peningkata n pendapatan petani 18 penyakit hewan ternak 19 penyuluhan pertanian 20 perdaganga n hasil pertanian 21 pertanian organik indosiar txt, jurnal txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, pembaruan txt, poskota txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, suaramerdeka txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt, wartapenelitian txt. gatra txt, gatra txt, gatra txt, mediaindonesia txt, republika txt, republika txt, republika txt, republika txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suaramerdeka txt. bitraindonesia txt, gatra txt, indosiar txt, jurnal txt, jurnal txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, poskota txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, suaramerdeka txt, wartapenelitian txt, wartapenelitian txt. gatra txt, indosiar txt, indosiar txt, jurnal txt, jurnal txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, suarakarya txt, suaramerdeka txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt, wartapenelitian txt. indosiar txt, jurnal txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, suarakarya txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt. 22 petani tebu indosiar txt, indosiar txt, kompas txt, kompas txt, kompas txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, suarakarya txt, suarakarya txt,

25 17 Lampiran 2 Lanjutan No Kueri Gugus Jawaban 23 peternak unggas 24 produk usaha peternakan rakyat 25 pupuk organik 26 riset pertanian suaramerdeka txt, suarapembaruan txt, suarapembaruan txt. gatra txt, gatra txt, gatra txt, indosiar txt, indosiar txt, indosiar txt, jurnal txt, kompas txt, kompas txt, mediaindonesia txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suarapembaruan txt. jurnal txt, kompas txt, kompas txt, mediaindonesia txt, mediaindonesia txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suarapembaruan txt. balaipenelitian txt, kompas txt, kompas txt, kompas txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt, wartapenelitian txt, wartapenelitian txt. balaipenelitian txt, gatra txt, indobic txt, jurnal txt, jurnal txt, jurnal txt, jurnal txt, jurnal txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, puslitbang txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau no.txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt, suarapembaruan txt, wartapenelitian txt, wartapenelitian txt.

26 18 Lampiran 2 Lanjutan No Kueri Gugus Jawaban 27 swasembad a pangan indosiar txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt. 28 tadah hujan gatra txt, gatra txt, indosiar txt, indosiar txt, jurnal txt, kompas txt, mediaindonesia txt, mediaindonesia txt, republika txt, republika txt, republika txt, republika txt, republika txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suarapembaruan txt, wartapenelitian txt. 29 tanaman obat 30 tanaman pangan balaipenelitian txt, balaipenelitian txt, indobic txt, indosiar txt, indosiar txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt. bitraindonesia txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, indosiar txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, kompas txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, mediaindonesia txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, republika txt, situshijau txt, situshijau txt, situshijau txt, situshijau txt, suarakarya txt, suarakarya txt, suarakarya txt, suarakarya txt, suaramerdeka txt, suaramerdeka txt, suarapembaruan txt, suarapembaruan txt.

27 Lampiran 3 Tampilan sistem 19

28 20 Lampiran 4 Tabel recall dan precision untuk semua ukuran kesamaan Kueri Recall bencana kekeringan dukungan pemerintah pada pertanian flu burung gabah kering giling gagal panen harga komoditas pertanian impor beras indonesia industri gula institut pertanian bogor kelangkaan pupuk kelompok masyarakat tani laboratorium pertanian musim panen pembangunan untuk sektor pertanian penerapan bioteknologi di indonesia penerapan teknologi pertanian peningkatan pendapatan petani penyakit hewan ternak penyuluhan pertanian perdagangan hasil pertanian pertanian organik petani tebu peternak unggas produk usaha peternakan rakyat pupuk organik riset pertanian swasembada pangan tadah hujan tanaman obat tanaman pangan Nilai rata-rata

29 Lampiran 5 Grafik waktu komputasi 21

beberapa tag-tag lain yang lebih spesifik di dalamnya.

beberapa tag-tag lain yang lebih spesifik di dalamnya. metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista

Lebih terperinci

Lampiran 1 Antarmuka implementasi

Lampiran 1 Antarmuka implementasi LAMPIRAN 16 Lampiran 1 Antarmuka implementasi 17 17 Lampiran 2 Contoh dokumen XML dalam koleksi pengujian indosiar050704-001 SumKa Presiden Megawati Lakukan

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j 3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan

Lebih terperinci

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

Lebih terperinci

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009

Lebih terperinci

PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI

PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

HASIL DAN PEMBAHASAN. sim(, )=

HASIL DAN PEMBAHASAN. sim(, )= 4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i

Lebih terperinci

TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA

TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya. beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini

Lebih terperinci

STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH

STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA Fridolin Febrianto Paiki Universitas Papua, Jl. Gunung Salju, Amban, Manokwari ff.paiki@unipa.ac.id

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen 6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat

Lebih terperinci

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut

Lebih terperinci

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium

Lebih terperinci

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI

PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI

Lebih terperinci

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis

Lebih terperinci

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &

Lebih terperinci

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA Oleh: YUDHA PERMADI G64102064 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008

Lebih terperinci

PEMBOBOTAN DALAM PROSES PENGINDEKSAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN FRAMEWORK INDRI HENDREX HERDI

PEMBOBOTAN DALAM PROSES PENGINDEKSAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN FRAMEWORK INDRI HENDREX HERDI PEMBOBOTAN DALAM PROSES PENGINDEKSAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN FRAMEWORK INDRI HENDREX HERDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI

MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH

PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN 1 EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA

DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.

Lebih terperinci

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI 18 PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI Karter D. Putung, Arie Lumenta, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi Manado, Indonesia. karterputung@gmail.com,

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan

Lebih terperinci

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 XML RETRIEVAL UNTUK DOKUMEN

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah 1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari

Lebih terperinci

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal

Lebih terperinci

EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA

EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian

Lebih terperinci

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita 6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional

Lebih terperinci

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer CORPUS DOKUMEN TEKS BAHASA INDONESIA UNTUK PENGUJIAN EFEKTIVITAS TEMU KEMBALI INFORMASI Oleh: Ir. Julio Adisantoso, M.Kom.

Lebih terperinci

RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR

RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR Oleh: Andika Wahyu Agusetyawan G64101007 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

2. Ketepatan untuk setiap jawaban.

2. Ketepatan untuk setiap jawaban. dikembalikan sebagai top passage dari kueri pertanyaan yang diberikan. 5. Ekstraksi Jawaban Top passages yang diperoleh dilakukan perhitungan terhadap jarak kata. Entitas yang memiliki jarak terpendek

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan

Lebih terperinci

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System) Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System) IF3 Aljabar Geometri Oleh: Rinaldi Munir Program Studi Informatika, STEI-ITB Rinaldi Munir - IF3 Aljabar Geometri

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

STUDI PERBANDINGAN ALGORITMA HUFFMAN DAN LZW (LEMPEL ZIV WELCH) PADA PEMAMPATAN FILE TEKS SKRIPSI CANGGIH PRAMILO

STUDI PERBANDINGAN ALGORITMA HUFFMAN DAN LZW (LEMPEL ZIV WELCH) PADA PEMAMPATAN FILE TEKS SKRIPSI CANGGIH PRAMILO STUDI PERBANDINGAN ALGORITMA HUFFMAN DAN LZW (LEMPEL ZIV WELCH) PADA PEMAMPATAN FILE TEKS SKRIPSI Diajukan untuk melengkapi tugas akhir dan memenuhi syarat mencapai gelar Sarjana Komputer CANGGIH PRAMILO

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN KAMUS DWIBAHASA NETTY LAORA SITOHANG

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN KAMUS DWIBAHASA NETTY LAORA SITOHANG EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN KAMUS DWIBAHASA NETTY LAORA SITOHANG DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUANN ALAM INSTITUT PERTANIAN

Lebih terperinci

ANALISIS PERTANYAAN BERBAHASA INDONESIA PADA QUESTION ANSWERING SYSTEM (QAS) KARTINA

ANALISIS PERTANYAAN BERBAHASA INDONESIA PADA QUESTION ANSWERING SYSTEM (QAS) KARTINA ANALISIS PERTANYAAN BERBAHASA INDONESIA PADA QUESTION ANSWERING SYSTEM (QAS) KARTINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2010 1 ANALISIS

Lebih terperinci

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:

Lebih terperinci

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA Aida Indriani ) ) Teknik Informatika STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso 8, Tarakan 77 Email

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document Jurnal Ilmiah Widya Teknik Volume 15 Nomor 2 2016 ISSN 1412-7350 SISTEM PEMEROLEHAN INFORMASI UNDANG-UNDANG DAN KASUS MENGGUNAKAN STRUKTUR DATA INVERTED INDEX DENGAN PEMBOBOTAN TF-IDF Fredes Winda Oktaviani

Lebih terperinci

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING

Lebih terperinci

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas

Lebih terperinci

Rata-rata token unik tiap dokumen

Rata-rata token unik tiap dokumen Percobaan Tujuan percobaan ini adalah untuk mengetahui kinerja algoritme pengoreksian ejaan Damerau Levenshtein. Akan dilihat apakah algoritme tersebut dapat memberikan usulan kata yang cukup baik untuk

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tes Secara harfiah kata tes berasal dari kata bahasa prancis kuno: testum yang berarti piring untuk menyisihkan logam-logam mulia, dalam bahasa Indonesia diterjemahkan dengan

Lebih terperinci

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka

Lebih terperinci

METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA

METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI

EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Hendri Priyambowo 1, Yanuar Firdaus A.W. S.T, M.T 2, Siti Sa adah S.T. M.T 3 123 Program Studi S1 Teknik Informatika,

Lebih terperinci

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan pengetahuan dan kehidupan manusia sungguh dipercepat dengan kemudahan akses terhadap begitu banyak informasi. Pada beberapa waktu yang lalu akses terhadap

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN Pada bab ini akan dibahas mengenai analisa proses information retrieval dengan menggunakan cosine similarity dan analisa proses rekomendasi buku dengan menggunakan jaccard

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G

EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G64103024 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

BAB I PERSYARATAN PRODUK

BAB I PERSYARATAN PRODUK BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi.

HASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi. 5 Mulai HASIL DAN PEMBAHASAN Kromosom P = rand [0,1] Ya P < Pm R = random Gen(r) dimutasi Selesai Tidak Gambar 7 Diagram alur proses mutasi. Hasil populasi baru yang terbentuk akan dievaluasi kembali dan

Lebih terperinci

POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH

POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu

Lebih terperinci

Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen

Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen Elisabeth Adelia Widjojo, Antonius Rachmat C, R. Gunawan Santosa Program Studi Teknik Informatika, Fakultas Teknologi

Lebih terperinci

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB RIYAN ADI LESMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENGEMBANGAN WORDNET BAHASA

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem

Lebih terperinci

INTEGRASI PEMBOBOTAN TF IDF PADA METODE K-MEANS UNTUK CLUSTERING DOKUMEN TEKS

INTEGRASI PEMBOBOTAN TF IDF PADA METODE K-MEANS UNTUK CLUSTERING DOKUMEN TEKS i TESIS INTEGRASI PEMBOBOTAN TF IDF PADA METODE K-MEANS UNTUK CLUSTERING DOKUMEN TEKS DEDDY WIJAYA SULIANTORO No. Mhs. : 105301466/PS/MTF PROGRAM STUDI MAGISTER TEKNIK INFORMATIKA PROGRAM PASCA SARJANA

Lebih terperinci

HASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan.

HASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan. 4 dan Thelen (2000) karena disesuaikan terhadap kaidah bahasa Indonesia. Rule yang dibuat Sianturi (2008) dan digunakan oleh Sanur (2011) memiliki notasi S sebagai sentence atau passage serta Q sebagai

Lebih terperinci

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Pengujian Kerelevanan Sistem Temu Kembali Informasi Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem

Lebih terperinci

SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL

SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL Sistem Informasi Pengelolaan Arsip Statis... SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL Silmi Kafatan, Djalal Er Riyanto,

Lebih terperinci

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester

Lebih terperinci

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015

Lebih terperinci

BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN

BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN 28 BAB 3 PERANCANGAN Pada bab ini akan dijelaskan mengenai rancangan percobaan pada penelitian segmentasi dokumen ini. Pembahasan akan dimulai dengan penjelasan mengenai gambaran umum proses segmentasi

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada era ini perkembangan teknologi informasi sangat pesat. Hal ini ditandai dengan semakin populernya penggunaan internet dan perangkat lunak komputer sebagai

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,

Lebih terperinci

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik

Lebih terperinci