PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH
|
|
- Widya Iskandar
- 6 tahun lalu
- Tontonan:
Transkripsi
1 PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
2 PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
3 ABSTRACT FANIA RAHMANAWATI KARIMAH. RIDF Weighting for Query Expansion on Information Retrieval System for Documents in Indonesian Using Lokal Context Analysis. Supervised by JULIO ADISANTOSO. Automatic query expansion is a technique for dealing with the fundamental issue of word mismatch between queries and documents in information retrieval. A number of approaches on query expansion have been studied, especially on techniques that analyze the corpus to discover word relationships (global technique) and those that analyze documents retrieved by initial query (local technique). Both techniques have their own advantages and limitations. Local context analysis is an automatic query expansion which is a combination of global and local techniques. The purpose of this research is to implement query expansion with local context analysis using TF (Term Frequency) RIDF (Residual Inverse Document Frequency) weighting method, a variation of IDF (Inverse Document Frequency) that assigns weights to terms according to the difference between the logs of the actual IDF and its prediction by Poisson model. The obtained performance of information retrieval was 15% average precision. The results also showed that the number of top-ranked documents and passages did not significantly affect the average precision. The more influential factor was the number of query expansions. Keyword: analysis context local, IDF, query expansion, RIDF, TF
4 Judul Skripsi Nama NRP : Pembobotan RIDF pada Mesin Pencari Bahasa Indonesia untuk Ekspansi Kueri Menggunakan Analisis Konteks Lokal : Fania Rahmanawati Karimah : G Menyetujui: Pembimbing Ir. Julio Adisantoso, M.Kom NIP Mengetahui: Ketua Departemen Ilmu Komputer, Dr. Ir. Agus Buono, M.Si, M.Kom NIP Tanggal Lulus:
5 PRAKATA Alhamdulilahirobbil alamin, segala puji syukur penulis panjatkan ke hadirat Allah subhanahu wata ala atas segala karunia-nya sehingga penulis dapat menyelesaikan skripsi. Penulis menyadari bahwa tugas akhir ini tidak akan terselesaikan tanpan bantuan dari berbagai pihak. Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada: 1 Orang tua tercinta, bapak Muhamad Rasyid dan ibu Mindarwati, adik yang saya sayangi Fatharani Kurniawati yang selalu memberikan doa, nasihat, semangat, dukungan dan kasih sayang yang luar biasa kepada penulis sehingga dapat menyelesaikan tugas akhir ini. 2 Bapak Ir. Julio Adisantoso, M.Kom selaku dosen pembimbing tugas akhir. Terima kasih atas kesabaran, bimbingan serta dukungan dalam penyelesaian tugas akhir ini. 3 Teman-teman satu bimbingan Meriska Defriani, Susi Handayani, Nofel Saputra, Putri Dewi P, Anita, Mery Marlina, Alfa Nugraha, Risky Utama dan Hafidzhia Dzikrul A terima kasih atas kebersamaan dan semangatnya dalam menyelesaikan tugas akhir ini. 4 Sahabat-sahabat Mitha Rachmawati, Siska Susanti, Brenda Kristi, Chichi, dan Ardini. 5 Teman-teman Ilkomerz Seluruh staf Departemen Ilmu Komputer IPB yang telah banyak membantu baik selama penelitian maupun selama perkuliahan. Penulis menyadari bahwa dalam penulisan tugas akhir ini masih terdapat banyak kekurangan dan kelemahan dalam berbagai hal karena keterbatasan kemampuan penulis. Penulis berharap adanya masukan berupa saran atau kritik yang bersifat membangun dari pembaca demi kesempurnaan tugas akhir ini. Semoga tugas akhir ini bermanfaat. Bogor, April 2013 Fania Rahmanawati Karimah
6 RIWAYAT HIDUP Penulis dilahirkan di Jakarta pada tanggal 5 April 1990 yang merupakan anak pertama dari dua bersaudara dengan ayah bernama Muhamad Rasyid dan Ibu bernama Mindarwati. Pada tahun 2008 lulus dari Sekolah Menengah Atas Negeri 68 Jakarta Pusat dan diterima di Program Studi Ilmu Komputer Institut Pertanian Bogor melalui jalur USMI (Undangan Seleksi Masuk IPB). Selama aktif sebagai mahasiswa, penulis pun turut aktif mengikuti beberapa kegiatan kepanitiaan di Departemen Ilmu Komputer, antara lain: IT TODAY 2010, Pesta Sains 2010, panitia MPD (Masa Perkenalan Departemen). Penulis pun aktif sebagai pengurus Divisi Kesekretariatan Himpunan Mahasiswa Ilmu Komputer. Penulis juga melakukan praktik kerja lapang di Lembaga Minyak dan Gas Bumi (LEMIGAS) Jakarta.
7 DAFTAR ISI Halaman DAFTAR TABEL... v DAFTAR GAMBAR... vi DAFTAR LAMPIRAN... vi PENDAHULUAN... 1 Latar Belakang... 1 Tujuan Penelitian... 1 Ruang Lingkup Penelitian... 1 METODE PENELITIAN... 1 Koleksi Dokumen... 2 Praproses Dokumen... 2 Temu Kembali Awal... 2 Pembentukan Passages... 3 Temu Kembali Passages... 3 Ekspansi Kueri... 3 Analisis Konteks Lokal... 4 Evaluasi... 4 Lingkungan Pengembangan Sistem... 4 HASIL DAN PEMBAHASAN... 5 Koleksi Dokumen Pengujian... 5 Praproses Dokumen... 5 Pembentukan Passages... 5 Temu Kembali Passages... 6 Pemilihan Konsep Ekspansi... 6 Formulasi Kueri Baru... 6 Pengujian Kinerja Sistem... 6 KESIMPULAN DAN SARAN... 7 Kesimpulan... 7 Saran... 7 DAFTAR PUSTAKA... 7 LAMPIRAN... 9 v
8 DAFTAR TABEL Halaman 1 Tabel contingensi recall-precision Koleksi dokumen pengujian Contoh istilah konsep Nilai AVP pada penambahan konsep Nilai AVP pada penambahan jumlah passages DAFTAR GAMBAR Halaman 1 Metode penelitian Contoh dokumen XML Contoh pembentukan passages Grafik recall precision DAFTAR LAMPIRAN Halaman 1 Contoh dokumen pengujian Gugus kueri dan jawaban untuk dokumen pertanian Nilai AVP sistem pada berbagai jumlah dokumen, passages, dan konsep teratas vi
9 1 PENDAHULUAN Latar Belakang Tujuan sistem temu kembali informasi adalah menemukan keberadaan dokumen yang dianggap relevan sesuai kebutuhan informasi pengguna. Pengguna akan merepresentasikan kebutuhan informasi dalam bentuk kueri. Menurut Rahayuni (2011) salah satu masalah yang sering dihadapi adalah pengguna tidak mampu merepresentasikan kebutuhan informasi yang diinginkan dalam bentuk kueri. Masalah lain yang sering muncul adalah pilihan kata yang digunakan seringkali berbeda dangan database dalam koleksi. Hal ini dapat diatasi dengan relevance feedback dan teknik ekspansi kueri. Dengan menggunakan teknik ekspansi kueri pengguna akan dibantu untuk menentukan istilah apa saja yang akan ditambahkan pada kueri awal. Kueri yang telah mengalami perluasan akan digunakan untuk melakukan pencarian selanjutnya. Diharapkan dari hasil ekspansi kueri dokumen yang relevan akan berada di posisi atas dan lebih banyak ditemukembalikan. Metode yang diharapkan bisa lebih meningkatkan kinerja sistem dalam ekspansi kueri adalah analisis konteks lokal. Metode ini merupakan penggabungan antara pendekatan global dan pendekatan lokal dalam memperluas kueri awal (Xu & Croft 2000). Penelitian juga dilakukan oleh Rahayuni (2011) menggunakan pendekatan global berbasis pemilihan kata untuk ekspansi kueri menggunakan ukuran kesamaan antar kata dengan istilah yang ada dalam thesaurus. Hal ini menyebabkan nilai Average Precision (AVP) sistem menjadi Rusidi (2008) melakukan penelitian menggunakan peluang bersyarat dan mengaplikasikan ekspansi kueri dalam sistem temu kembali informasi. Ekspansi kueri yang dilakukan yaitu menggunakan analisis lokal. Diva (2011) melakukan penelitian ekspansi kueri menggunakan teknik analisis konsep lokal. Dalam penelitian ini digunakan pembobotan BM25. Hal ini menyebabkan kinerja sistem kurang baik dengan nilai Average Precision (AVP) sebesar Oleh karena itu, penelitian ini akan menggunakan pembobotan RIDF dan memilihan kata berbasis konsep untuk ekspansi kueri pada mesin pencari bahasa Indonesia. Tujuan Penelitian Penelitian ini bertujuan mengimplementasikan teknik analisis konteks lokal pada ekspansi kueri di mesin pencari bahasa Indonesia. Ruang Lingkup Penelitian Ruang lingkup dalam penelitian ini antara lain: 1 Dokumen yang digunakan dalam penelitian adalah dokumen XML berbahasa Indonesia. 2 Kesalahan dalam pengetikan di dalam korpus tidak diperhatikan. 3 Dokumen yang relevan dengan kueri uji ditentukan berdasarkan koleksi yang ada di Laboratorium Information Retrieval. METODE PENELITIAN Tahapan penelitian ini dapat dilihat pada Gambar 1. Dokumen Praproses Dokumen dengan pembobotan BM25 Ya Dokumen Peringkat N Teratas Pembentukan Passages Praproses Passages dengan Pembobotan Tf Ridf Temu Kembali Passages menggunakan Cosine Similarity Passages Peringkat P Teratas Daftar Konsep Temu Kembali Awal Ekspansi Kueri? Konsep Peringkat c Teratas Tidak Gambar 1 Metode penelitian. Kueri Evaluasi Formulasi Kueri
10 2 Koleksi Dokumen Dokumen yang digunakan dalam penelitian ini berasal dari Laboratorium Temu Kembali Informasi Departemen Ilmu Komputer IPB. Contoh dokumen XML yang digunakan dapat dilihat pada Lampiran 1. Koleksi Dokumen terdiri atas 2095 dokumen pertanian merupakan artikel media umum. Evaluasi kinerja sistem menggunakan 20 kueri dan tersedia himpunan dokumen yang relevan dengan kueri (Lampiran 2). Praproses Dokumen Pada tahap ini dilakukan pemrosesan dokumen melalui proses indexing menggunakan Sphinx. Proses indexing diawali dengan proses tokenisasi yang bertujuan mengidentifikasi kata di dalam teks dengan cara membedakan karakter-karakter yang bersifat separator. Pembuangan stopword dilakukan untuk membuang kata-kata yang tidak diperlukan atau tidak memiliki makna dan terakhir adalah pembobotan dengan BM25 yang bertujuan menentukan tingkat kepentingan suatu istilah dalam dokumen. Pembobotan BM25 merupakan pembobotan yang menggabungkan bobot inverse document frequency dengan pengskalaan khusus untuk dokumen dan kueri. Pembobotan BM25 antara dokumen dan kueri yang diberikan terlihat pada persamaan berikut: dengan R : jumlah dokumen yang relevan dalam koleksi r t R r t df t r t : jumlah dokumen relevan dalam koleksi yang mengandung istilah t : jumlah dokumen relevan dalam koleksi yang tidak mengandung istilah t : jumlah dokumen yang tidak relevan dalam koleksi yang mengandung istilah t N df t R+ r : jumlah dokumen yang tidak relevan dalam koleksi yang tidak mengandung istilah t. Fungsi pembobotan tersebut diubah sehingga menjadi bobot inverse collection frequency tanpa informasi relevansi (R = r = 0) yang berfungsi seperti inverse document frequency: Selanjutnya fungsi tersebut digunakan untuk menentukan kesamaan kueri Q dan dokumen D i dengan formula: dengan N K ( ( )) : banyaknya dokumen pada koleksi : jumlah dokumen yang mengandung term t : frekuensi term kueri t pada dokumen i : frekuensi term kueri t pada kueri Q : panjang dokumen D i : rata-rata panjang dokumen dalam koleksi : faktor normalisasi b : parameter-parameter pengskalaan terhadap tf term dalam dokumen dan panjang dokumen. Nilai parameter yang digunakan adalah k 1 = 1.2 dan b = 0.75 (Manning et al. 2009). Temu Kembali Awal Setelah dilakukan praproses dokumen kemudian dilakukan proses temu kembali awal yang diimplementasikan dengan Sphinx Search. Dengan Sphinx, sebelum proses temu kembali awal diimplementasikan, proses yang terlebih dahulu dilakukan adalah pengindeksan pada dokumen XML hasil praproses. Pengindeksan menggunakan file konfigurasi yang sesuai. Temu kembali awal digunakan untuk mendapatkan dokumen-dokumen yang sesuai dengan kueri yang diberikan pengguna. Dokumen peringkat N teratas akan diambil untuk digunakan dalam tahapan ekspansi kueri menggunakan analisis konteks lokal dengan pembobotan kata TF RIDF.
11 3 Pembentukan Passages Passage merupakan bagian yang lebih kecil dari suatu dokumen. Menurut Callan (1994), passage dapat dibagi dalam tiga kelas: 1 Discourse passage merupakan passage yang dibentuk berdasarkan bagian-bagian dari suatu dokumen, dapat berupa kalimat atau paragraf. 2 Semantic passage merupakan passage yang dibentuk berdasarkan subjek atau konten dari dokumen. 3 Windows passage merupakan passage yang dibentuk berdasarkan jumlah kata yang digunakan. Pada penelitian ini passage yang digunakan adalah Discourse passage. Passage dibentuk dari kumpulan dua kalimat yang saling overlapping, yakni kalimat pertama digabung dengan kalimat kedua menjadi satu passage, kalimat kedua dan kalimat ketiga menjadi satu passage juga, dan begitu seterusnya untuk setiap dokumen peringkat teratas. Temu Kembali Passages Proses temu kembali passages dilakukan dengan tahap awal indexing dengan pembobotan TF-RIDF dan pemeringkatan passages menggunakan cosine similiarity. Bobot dalam term t di dalam sistem temu kembali informasi dihitung menggunakan ukuran TF-RIDF, dengan formula: W t,i =ridf t x tf t,i dengan W t,i adalah bobot kata t pada passagesi. Residual idf (RIDF) merupakan variasi dari idf yaitu menggunakan rasio observasi empiris dan estimasi. Nanas et al. (2004) mengungkapkan RIDF merupakan variasi dari IDF yang memberikan bobot untuk term berdasarkan perbedaan logaritma yang sesuai dengan IDF sebelumnya memakai model Poisson. (1) dengan Y = 0,1,2,3,, dan µ adalah mean distribusi Poisson, mean, dan variansinya adalalah E[y] = var[y] = µ Peluang banyaknya peubah acak Y dalam periode waktu t diberikan oleh:. (2) Persamaan 2 digunakan untuk menghitung peluang peubah acak Y. Cara yang paling umum menghitung RIDF adalah dengan dua persamaan. Persamaan pertama adalah nilai rata-rata kemunculan term per dokumen dan persamaan kedua yaitu 1- p(0;µt). Dengan demikian nilai RIDF kata t adalah RIDF t =obeserved idf t predicted idf t RIDF t = idf t + log 2 (1-p(0;µ)) = (1+ log 2 (N/ df t )) + log 2 (1- p (0; µ)) = (1+ log 2 (N/ df t )) + log 2 (1- exp(- cf t /N)) sedangkan N adalah jumlah dokumen dalam korpus. Ukuran kemiripan cosine similiarity digunakan untuk memeringkat passages dalam koleksi dengan kueri awal yang diberikan pengguna. Cosine similarity merupakan salah satu metode yang digunakan untuk mengukur kemiripan antara dokumen dan kueri. Metode ini mengukur kemiripan berdasarkan vektor istilah kueri (q) dan vektor istilah dokumen (d). Rumus cosine similarity adalah: dengan adalah panjang vektor (Manning et al. 2009). Ekspansi Kueri Dalam relevance feedback pengguna memberikan input tambahan pada koleksi dokumen yang diberikan dengan memberi tanda pada dokumen yang dianggap relevan. Selanjutnya input ini digunakan untuk memperbaiki kueri yang telah diberikan pengguna. Pada ekspansi kueri pengguna memberi input tambahan pada kueri awal berupa kata atau frasa (Manning et al. 2009). Terdapat tiga jenis ekspansi kueri yaitu: 1 Manual Query Expansion (MQE) Dalam metode ini pengguna memodifikasi kueri secara manual tanpa bantuan sistem. 2 Automatic Query Expansion (AQE) Metode ini akan memodifikasi kueri tanpa bantuan pengguna, melainkan dilakukan otomatis melalui sistem. Menurut Baeza- Yates dan Ribeiro-Neto (1999) terdapat beberapa teknik dalam AQE, yaitu: Analisis Global yang prinsip dasarnya memanfaatkan konteks suatu kata untuk menentukan kesamaannya dengan kata yang lain, Analisis Lokal menggunakan dokumen yang ditemukembalikan pengguna untuk mendapat kueri baru, dan analisis konteks lokal yang merupakan gabungan teknik analisis global dan lokal. 3 Interactive Query Expansion (IQE)
12 4 Metode ini membutuhkan interaksi antara pengguna dengan sistem untuk melakukan proses ekspansi kueri. Pertanyaan yang sering muncul adalah bagaimana pemilihan istilah dan berapa jumlah istilah yang digunakan untuk ekspansi kueri. Salah satunya adalah memilih istilah dengan mengambil beberapa yang terbaik atau memasukkan seluruh istilah dokumen relevan (relevance feedback) atau memasukkan seluruh istilah indeks koleksi. Analisis Konteks Lokal Menurut Xu & Croft (2000) analisis konsep lokal adalah teknik yang mengombinasikan analisis lokal dan analisis global pada ekspansi kueri. Langkah-langkahnya adalah: 1 Gunakan sistem temu kembali informasi standar untuk me-retrieved n passagess peringkat teratas menggunakan kueri awal dengan cara memecah dokumen ke dalam passages, kemudian passages diberi peringkat dengan cara yang sama ketika memberi peringkat pada dokumen (Analisis Lokal). 2 Selanjutnya konsep pada passages peringkat n teratas juga diberi peringkat (Analisis Global) menggunakan formula bel(q,c) yaitu: bel(q,c)= sedangkan c adalah konsep, ft ij adalah jumlah kemunculan t i pada p j dan fc ij adalah jumlah kemunculan c pada p j, N adalah jumlah passages pada koleksi dan N i adalah jumlah passages yang memiliki t i dan N c adalah jumlah passages yang memiliki c dan adalah 0.1 untuk menghindari zero bel value. 3 Semua konsep pada peringkat m teratas berdasarkan bel(q, c) ditambahkan pada kueri awal. Evaluasi Manning et al. (2009) menyatakan terdapat dua hal mendasar yang paling sering digunakan untuk mengukur kinerja temu-kembali secara efektif adalah recall dan precision (R-P). Perhitungan recall-precision didasarkan pada tabulasi silang seperti pada Tabel 1. Tabel 1 Tabel kontingensi recall-precision Retrieved Non retrieved Relevant true positives (tp) false negatives (fn) Nonrelevant false positives (fp) true negatives (tn) Oleh karena itu recall-precision didefinisikan sebagai: P = tp/(tp+fp) R = tp/(tp+fn) Menurut Baeza-Yates dan Ribeiro-Neto (1999) algoritma temu-kembali yang dievaluasi menggunakan beberapa kueri berbeda akan menghasilkan nilai R-P yang berbeda untuk masing-masing kueri. Average Precision (AVP) diperlukan untuk menghitung rata-rata tingkat precision pada berbagai tingkat recall, yaitu 0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, dan 1.0. Perhitungan AVP dapat diformulasikan sebagai berikut: ( ) ( ) adalah AVP pada level recall r. N q adalah jumlah kueri yang digunakan dan P i (r) adalah precision pada level recall r untuk kueri ke-i. Lingkungan Pengembangan Sistem Lingkungan implementasi yang digunakan adalah sebagai berikut: Perangkat lunak dan bahasa pemrograman: Windows 7 Professional 64-bit sebagai sistem operasi. C# sebagai bahasa pemrograman untuk pembuatan library. ASP.NET MVC sebagai web framework untuk pembuatan aplikasi website. Visual Studio 2010 sebagai IDE (Integrated Development Environment). SQL Server 2008 R2 sebagai database penyimpanan data. Notepad++ v8.5 sebagai editor. Sphinx sebagai platform temu kembali informasi. Spesifikasi perangkat keras: Processor Intel Core i GHz. RAM 6 GB. Hard disk dengan kapasitas 500 GB.
13 5 HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Dokumen yang digunakan dalam pengujian pada penelitian ini berasal dari Laboratorium Temu Kembali Informasi, Ilmu Komputer IPB dengan jumlah 2095 dokumen. Dokumen tersebut merupakan kumpulan berita tentang pertanian dari surat kabar online. Deskripsi dari dokumen dapat dilihat pada Tabel 2. Contoh salah satu dokumen pertanian yang digunakan dalam penelitian ini seperti yang tercantum pada Gambar 2. Tabel 2 Koleksi dokumen pengujian Keterangan Ukuran (byte) Ukuran seluruh dokumen Ukuran rata-rata dokumen Ukuran dokumen terbesar Ukuran dokumen terkecil 412 <DOC> <DOCNO>gatra011102</DOCNO> <TITLE>Agroindustri</TITLE> <AUTHOR>Ani, Anti</AUTHOR> <DATE> 1 November 2002 </DATE> < TEXT >Selain industry argowisata yang telah </ TEXT > </DOC> Gambar 2 Contoh dokumen XML. Dokumen ditandai dengan tag-tag sebagai berikut: <DOC></DOC>,tag ini mewakili keseluruhan dokumen dan melingkupi tagtag lain yang lebih spesifik <DOCNO></DOCNO>, tag ini menunjukkan ID dari dokumen <TITLE></TITLE>, tag ini menunjukkan judul dari dokumen <DATE></DATE>, tag ini menunjukkan tanggal dari berita atau penulisan <AUTHOR></AUTHOR>, tag ini menunjukkan penulis dari berita tersebut. <TEXT></TEXT>, tag ini menunjukkan isi dari dokumen. Praproses Dokumen Pemrosesan dokumen dilakukan melalui beberapa tahapan yaitu: tokenisasi, pembuangan stopword, dan pembobotan menggunakan rumus TF RIDF. Sebelum dilakukan tokenisasi, seluruh huruf pada koleksi dokumen diubah menjadi huruf kecil dengan menggunakan fungsi strtolower. Dokumen koleksi diproses secara sekuensial per karakter dari awal hinga menghasilkan sebuah token. Tahapan untuk memperoleh token adalah sebagai berikut: 1 Sistem menggolongkan karakter menjadi empat jenis, yaitu : a whitespace, berarti karakter ini merupakan karakter pemisah token. b alpha, berarti karakter ini merupakan huruf. c numeric, berarti karakter ini merupakan angka. d other, berarti karakter ini tidak termasuk jenis-jenis di atas. 2 Sistem mengubah jenis karakter numeric dan other menjadi whitespace. 3 Sistem melakukan pemisahan kata berdasarkan whitespace. 4 Kata yang dianggap token adalah yang mempunyai panjang lebih dari dua. Kenudian dilakukan pembuangan sejumlah kata umum yang tidak berpotensi mencirikan suatu dokumen (stopword). Daftar kata buangan (stopword) menggunakan hasil penelitian Rahayuni (2011). Pembentukan Passages Dokumen XML hasil praproses koleksi seluruh dokumen kemudian diindeks pada Sphinx. Pengindeksan dilakukan sesuai dengan file konfigurasi yang telah dibuat. Pada file konfigurasi, dokumen XML hasil praproses dokumen disimpan dengan nama Corpus2095.xml yang selanjutnya diindeks menggunakan Sphinx Search dan disimpan dalam file bernama IndexingCorpus2095. Pada file konfigurasi Sphinx, xmlpipe_field berfungsi mendefinisikan tag-tag yang terdapat pada file XML. Hal tersebut dapat mempermudah pengaksesantag tertentu. Tahap indexing menggunakan Sphinx Search. Kemudian setelah tahap temu kembali selesai akan diambil dokumen-dokumen peringkat teratas untuk dijadikan passages. Bagian dokumen yang diambil untuk dijadikan passages terdiri atas bagian judul (ditandai dengan tag title) dan paragraf (ditandai dengan tag content). Pada Gambar 3 dapat terlihat contoh pembentukan passages.
14 6 Passages 1 Akibat banjir tersebut, para petani gagal tanam. Ratusan hektar tanaman jeruk petani yang puso akibat banjir Desember 2003 lalu tidak bisa ditanami kembali karena areal kebun jeruk tersebut tergenang air. Passages 2 Ratusan hektar tanaman jeruk petani yang puso akibat banjir Desember 2003 lalu tidak bisa ditanami kembali karena areal kebun jeruk tersebut tergenang air. Banjir tersebut juga membuat para petani tidak bisa menanami lahan mereka tanaman jagung dan padi. Gambar 3 Contoh pembentukan passages. Temu Kembali Passages Passages yang telah terbentuk kemudian akan ditemu kembalikan. Top p passages hasil temu kembali akan menjadi sebuah dokumen untuk menentukan konsep pada formulasi kueri yang baru. Untuk itu dilakukan tokenisasi kembali untuk mendapatkan semua term unik pada semua passages. Setelah didapatkan term unik, dicari frekuensi kemunculan term unik tersebut di semua passages kemudian term diberi bobot sesuai dengan TF RIDF. Berikutnya dengan menggunakan pembobotan TF RIDF dan fungsi kesamaannya dicari nilai kemiripan antara passages dan kueri pengguna sehingga didapatkan passages peringkat m teratas. Pemilihan Konsep Ekspansi Dari passages peringkat teratas diambil kata benda disebut konsep (calon kueri perluasan). Term kueri yang diberikan pengguna dihitung kemunculannya pada setiap passage peringkat teratas dengan semua konsep yang ada menggunakan persamaan bel value. Kemudian dilakukan pencarian nilai kemiripan konsep dengan semua term yang ada pada kueri menggunakan persamaan bel(q,c). Hasil dari tahap ini berupa konsep-konsep yang telah terurut berdasarkan kemiripannya dengan keseluruhan kueri, yang nanti digunakan sebagai term kueri perluasan. Tabel 3 menunjukkan contoh istilah konsep yang akan digunakan dalam ekspansi kueri. Tabel 3 Contoh istilah konsep Kueri persediaan padi memadai nilai jual komoditas rendah upaya peningkatan produksi pertanian sawah rusak berat dana bidang pertanian rendah 7 Istilah Ekspansi *mentan, *optimis, *Indonesia, *ekspor, *beras, *jakarta, *apriyantono *agraris, *harga, *produsen, *buah, *tani, *produk, *jajar *tsunami, *kosong, *susilo, *tingkat, *presiden, *komitmen, *bencana *kira, *tanam, *pimpin, *asal, *mundur, *luas, *lingkung *sektor, *universitas, *pakar, *gantung, *bicara, *satu, *kecil Formulasi Kueri Baru Kueri perluasan yang didapatkan pada tahap sebelumnya digabungkan dengan kueri awal yang diberikan oleh pengguna. Pada penelitian ini, banyak konsep yang ditambahkan sehingga mendapatkan hasil yang optimal adalah 4 konsep. Hasil dari tahap ini adalah kueri baru sebagai hasil ekspansi. Pengujian Kinerja Sistem Pengaruh jumlah konsep yang ditambahkan pada kueri awal diuji pada sistem dengan menggunakan pasangan kueri dan dokumen relevan yang telah disiapkan. Banyaknya konsep yang ditambahkan pada kueri awal diduga mempengaruhi kinerja hasil temu kembali. Dalam penelitian ini digunakan penambahan konsep untuk kemudian dilihat nilai AVP dari setiap penambahan konsep. Dari tabel 4 terlihat bahwa untuk penambahan konsep semakin banyak jumlahnya maka akan menghasilkan nilai AVP yang semakin tinggi. Nilai AVP tertinggi ketika jumlah konsep adalah 4 dan 5. Ketika jumlah konsep yang ditambahkan lebih dari 7 maka nilai AVP sistem akan cenderung tetap.
15 7 Tabel 4 Nilai AVP pada penambahan konsep Penambahan Jumlah Nilai AVP Konsep Pengaruh penambahan jumlah passages dapat dilihat pada Tabel 5. Dapat terlihat bahwa penambahan passages tidak mempengaruhi nilai AVP sistem secara signifikan. Untuk nilai AVP hasil pengujian sistem pada berbagai kombinasi jumlah penambahan dokumen peringkat teratas, jumlah passages, dan jumlah konsep dapat dilihat pada Lampiran 3. Tabel 5 Nilai AVP pada penambahan jumlah passages Penambahan Jumlah AVP Passages sistem setelah ekspansi kueri adalah dengan recall Berdasarkan evaluasi yang dilakukan untuk nilai AVP optimal didapatkan dari kombinasi jumlah dokumen peringkat teratas sebanyak satu, jumlah konsep yang ditambahkan sebanyak empat dan jumlah passages sebanyak satu. KESIMPULAN DAN SARAN Kesimpulan Penelitian ini menganalisis ekspansi kueri menggunakan metode analisis konteks lokal dengan menggunakan pembobotan TF RIDF. Berdasarkan hasil penelitian yang diperoleh dapat disimpulkan bahwa: 1 Ekspansi kueri menggunakan analisis konteks lokal dengan menggunakan pembobotan TF RIDF dapat meningkatkan kinerja sistem temu kembali, yakni dokumen yang relevan berada pada urutan awal pada penemukembalian. 2 Jumlah ekspansi kueri yang ditambahkan mempengaruhi kinerja sistem temu kembali. Semakin banyak konsep yang ditambahkan maka semakin bagus kinerja sistem sampai pada batas tertentu yaitu 4 konsep nilainya cenderung tetap. Jumlah dokumen dan passages peringkat teratas yang diambil tidak memberikan banyak perbedaan pada hasil kinerja sistem temu kembali. Saran Pada penelitian selanjutnya disarankan untuk menggunakan koleksi yang lebih besar untuk lebih mendekati penggunaan sesungguhnya. Penambahan frasa dan kata kerja sebagai kata yang akan digunakan untuk ekspansi untuk mengatasi keambiguan kata. Gambar 4 Grafik recall precision. Pada Gambar 4 terlihat perbedaan antar hasil pengujian sistem saat belum menggunakan ekspansi kueri dan setelah ekspansi kueri. Nilai AVP untuk sistem tanpa ekspansi adalah dengan recall sedangkan nilai AVP DAFTAR PUSTAKA Baeza-Yates R, Ribeiro-Neto B Modern Information Retrieval. New York: Addison- Wesley. Callan JP Passage-level evidence in document retrieval. Di dalam: Proceedings of the 17 th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval; Dublin, July New York: Springer-Verlag New York, Inc. hlm Diva LM Ekspansi kueri pada sistem temu kembali informasi berbahasa Indonesia menggunakan analisis konteks lokal.
16 8 [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Manning Christopher D, Raghavan Prabhakar, Schutze Hinrich An Introduction to Information Retrieval. Cambridge: Cambridge University Press. Nanas N, Uren V, Roeck AD A Comparative Study of Term Weighting Methods for Information Filtering. U.K: The Open University Knowledge Media Institute Milton Keynes. Rahayuni Ekspansi kueri pada sistem temu kembali informasi berbahasa Indonesia menggunakan thesaurus. [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Rusidi Ekspansi kueri dalam sistem temu kembali informasi berbahasa Indonesia menggunakan peluang bersyarat. [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Xu J, Croft WB Improving the Effectiveness of Informational Retrieval with Lokal Context Analysis. Jurnal ACM Transactions on Information Systems 18(1):
17 LAMPIRAN
18 10 Lampiran 1 Contoh dokumen pengujian <DOC> <DOCNO>kompas031100</DOCNO> <TITLE>Pertanian Tak Menjanjikan Petani Jepara Beralih ke Sektor Industri </TITLE> <AUTHOR>(son)</AUTHOR> <DATE>Jumat, 3 November 2000</DATE> <TEXT> <P>Jepara, Kompas</P> <P>Akibat harga gabah dan hasil pertanian lain tidak pernah sesuai dengan harapan, sementara upah buruh tani rendah, ribuan petani di Kabupaten Jepara, Jawa Tengah (Jateng) beralih ke sektor industri. Bahkan tenaga kerja industri mebel ukir Jepara yang ada saat ini, hampir semuanya berasal dari petani. Secara keseluruhan jumlah petani di Jepara berkisar orang.</p> <P>Tidak hanya itu, lahan pertanian di beberapa tempat terutama di Kota Jepara dan sekitarnya kini mulai terancam berkurang, karena dialihfungsikan menjadi tempat industri mebel ukir. Kondisi ini terjadi sejak lima tahun terakhir, yakni tahun 1995 hingga saat ini.</p> <P>Bupati Jepara Drs Soenarto, didampingi Kepala Kanwil (Kakanwil) Departemen Pertanian (Deptan) Jateng Ir Triyono, mengemukakan ini kepada wartawan yang mengikuti press tour bersama Sekretariat Pengendali Bimbingan Massal (Bimas), Deptan dan Kehutanan, Rabu (1/11) di Jepara.</P> <P>"Bagi sejumlah petani Jepara, sektor pertanian kini tidak lagi menjanjikan. Mereka kini lebih memilih bekerja di sektor industri mebel ketimbang menjadi petani. Apalagi sejak krisis ekonomi, ekspor mebel di Jepara meningkat," jelas Soenarto.</P> <P>Selama ini, kata Soenarto, produksi pertanian terutama padi selalu mengecewakan. Bahkan, antara biaya dan tenaga yang dikeluarkan petani dengan hasil yang diperoleh, selalu saja tidak sebanding. "Biaya yang dikeluarkan petani mulai dari tenaga kerja, bibit, pupuk dan obat-obatan terlalu besar, sementara ketika panen nilai jualnya rendah. Gabah kering panen (GKP) misalnya, tidak pernah lebih dari Rp 800 per kilogram atau jauh dari harga patokan pemerintah," katanya.</p> <P>Oleh karena itu, perlahan-lahan minat petani beralih bekerja di sektor industri. Apalagi, beberapa tahun terakhir terutama saat krisis ekonomi berlangsung, industri mebel ukir Jepara menjadi andalan ekspor Jateng. "Saat ini Jepara memiliki pengusaha mebel, 200 di antaranya eksportir. Ini menyebabkan, banyak tenaga kerja di sektor agraris ditarik ke sektor industri," tandasnya.</p> <P>Diakuinya, dorongan petani beralih ke sektor industri cukup besar. Sebab, bekerja di sektor pertanian membutuhkan waktu, tenaga dan biaya yang cukup besar, hasilnya pun tidak bisa diprediksi. Bekerja di sektor industri, hasilnya bisa dinikmati dalam waktu tidak terlalu panjang. Dia mencontohkan, untuk mengampelas (menghaluskan) mebel saja, sehari mendapat bayaran Rp per orang.</p> <P>Krida Pertanian</P> <P>Mengatasi persoalan ini, Soenarto menyatakan, sejak tahun 1997 pemerintah Jepara melaksanakan Gerakan Krida Pertanian. Salah satu gebrakan yang dilakukan adalah pencanangan gerakan pisangisasi (penanaman tananan pisang) di seluruh Jepara.</P> <P>"Saat ini Jepara sudah menghasilkan pisang, termasuk jenis chavendis. Kini sedang dipikirkan pemasarannya," katanya.</p> <P>Tekad Pemda Jepara menggerakkan sektor pertanian di Jepara didukung Satpel Bimas Deptan. "Tugas Satpel Bimas menggerakkan sektor pertanian di Jepara cukup berat karena pergeseran struktur ekonomi dari agrobisnis ke industri," jelas Soenarto.</P> <P>Sedangkan untuk mencegah supaya luas lahan pertanian tidak semakin banyak dialihfungsikan ke sektor industri, Bupati Jepara menginstruksikan pejabat terkait agar menyeleksi ketat izin pembangunan kawasan industri. "Selain proses per</p> <P>izinannya dipersulit, harus ada uji kelayakan," tandasnya.</p> </TEXT> </DOC>
19 11 Lampiran 2 Gugus kueri dan jawaban untuk dokumen pertanian Kueri nilai jual komoditas rendah persediaan padi memadai sawah kering kekurangan air Gugus Jawaban balipost030608, BisnisIndonesia , gatra030408, indosiar071103, indosiar , indosiar240604, indosiar300304, indosiar , jurnalhorti113, kompas , kompas031100, kompas101004, kompas161000, kompas171002, kompas200803, kompas240803, kompas250901, kompas , kompas , kompas , mediaindonesia060803, mediaindonesia170303, mediaindonesia250304, mediaindonesia310503, okezone , panturanews220611, pertaniansehat , pertaniansehat , pikiranrakyat , pikiranrakyat240404, pikiranrakyat300604, poskota , republika020804, republika , republika060503, republika , republika , republika140503, republika , republika , republika , republika , situshijau15, situshijau , situshijau280203, situshijau , situshijau , situshijau , suarakarya , suarakarya , suaramerdeka , suaramerdeka290303, suarapembaruan110903, suarapembaruan antarajawabarat211211, beritasore080711, bisnis_jabar191211, bisnisindonesia140911, deptan , eksposnews161211, gatra161711, gatra190902, gatra , gatra230408, gatra230802, globalnews190911, harian_aceh291011, incestordaily310711, indosiar221003, indosiar240703, kbrh211111, kompas160704, kompas221011, kompas260711, korankaltim260811, malukunews090811, mediaindonesia231111, menkokesra71211, okezone080711, okezone130711, okezone31701, poskota , radarbangka040811, republika061102, republika , republika , republika , republika , sinartani1075, suaramerdeka090911, suaramerdeka170602, tempointeraktif , tempointeraktif , tribunnews300711, vivanews122111, vivanews deptan , gatra060907, gatra070203, gatra190802, gatra210704, gatra270709, gatra301002, gatra , gatra310709, indosiar010903, indosiar040903, indosiar170603, indosiar180304, indosiar220503, indosiar240703, indosiar , indosiar , indosiar310504, kompas030704, korantempo3, mediaindonesia , mediaindonesia110703, mediaindonesia160603, mediaindonesia210709, mediaindonesia240503, mediaindonesia300909, mediaindonesia310503, okezone , okezone , okezone , okezone , okezone , okezone , okezone , radarbogor050608, radarbogor , republika , republika , republika , republika , republika , republika200603, republika , republika230903, republika270503, republika , republika , suarakarya , suarakarya , suarakarya , suaramerdeka130602, suaramerdeka190903, suaramerdeka290901, suarapembaruan110903, suarapembaruan190809, suarapembaruan , suarapembaruan , tempointeraktif
20 12 Lanjutan Kueri upaya peningkatan produksi pertanian produk asing murah produksi pertanian menurun Gugus Jawaban deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , gatra050508, gatra060206, gatra080102, gatra121108, gatra200103, gatra220604, gatra240203, gatra260408, indosiar030304, indosiar , indosiar180304, jurnalhorti210, jurnal , jurnal , jurnalhorti1, jurnalhorti87, kompas031100, kompas160704, kompas200802, kompas210502, kompas230209, kompas240103, kompas240302, kompas280502, kompas , kompas310703, kompas311203, kompas , mediaindonesia020809, mediaindonesia021209, mediaindonesia080210, mediaindonesia091109, mediaindonesia , mediaindonesia120609, mediaindonesia , mediaindonesia190210, mediaindonesia210210, mediaindonesia270309, mediaindonesia270809, okezone , okezone , okezone , pertaniansehat , pertaniansehat , pertaniansehat , republika , republika040303, republika050803, republika050903, republika , republika , republika , republika , republika100902, republika , republika , republika , republika , republika140703, republika150703, republika150903, republika151202, republika , republika , republika , republika , republika230903, republika , republika241203, republika , republika260803, republika , republika301002, republika , republika , republika , situshijau , situshijau070503, situshijau , situshijau , situshijau , situshijau , situshijau , situshijau no, suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka071102, suaramerdeka120104, suaramerdeka190903, suarapembaruan130103, suarapembaruan140303, suarapembaruan220802, suarapembaruan , surabayapost020210, surabayapost070110, tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , wartapenelitian analisdaiy211011, indosiar , kompas100702, kompas101002, kompas131211, kompas170104, kompas180502, kompas250901, kompas , kompas280602, lampungpost201011, mediaindonesia060803, mediaindonesia170303, okezone210111, poskota , republika060503, suaramerdeka130104, suarapembaruan100903, suarapembaruan110903, tempo deptan , gatra010307, gatra030203, gatra , gatra180103, gatra220802, gatra , gatra240203, indosiar010504, indosiar010803, indosiar270504, kompas030403, kompas050303, kompas060503, kompas120102, kompas170402, kompas171002, kompas180303, kompas211211, kompas240103, kompas260902, kompas , kompas270401, kompas , mediaindonesia050709, mediaindonesia090409, mediaindonesia , mediaindonesia281109, mediaindonesia300909, okezone , pikiranrakyat , pikiranrakyat , pikiranrakyat , poskota , republika , republika , republika , republika , republika , republika201102, republika , republika241203, republika281202, situshijau , tempointeraktif , situshijau , situshijau , situshijau280203, vivanews122111, suarakarya , suaramerdeka290901, suarapembaruan290803, surabayapost020310,
21 13 Lanjutan Kueri produksi pertanian menurun petani sulit mendapatkan humus sawah rusak berat mutu hasil pertanian rendah Gugus Jawaban tempointeraktif , tempointeraktif banjarmasinpost181211, gatra230609, harianhaluan291111, indosiar010704, indosiar060204, indosiar , indosiar200104, indosiar290604, kompas210504, kompas211211, kompas , liputan6_100611, mamorema01, mediaindonesia211211, metrotvnews221111, okezone , pertaniansehat , pertaniansehat , pikiranrakyat , republika050604, republika , republika , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka161101, surya121111, tribunnews51011, waspada gatra030706, gatra040108, gatra060907, gatra070203, gatra120210, gatra190802, gatra190902, gatra , gatra260803, gatra301002, gatra , indosiar010504, indosiar031203, indosiar040903, indosiar , indosiar130104, indosiar130504, indosiar160304, indosiar180304, indosiar240703, indosiar , kompas170504, kompas260902, mediaindonesia030603, mediaindonesia050204, mediaindonesia , mediaindonesia110309, mediaindonesia110703, mediaindonesia130210, mediaindonesia , mediaindonesia140203, mediaindonesia160603, mediaindonesia170209, mediaindonesia190503, okezone , okezone , okezone , okezone , okezone , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , radarbogor050608, republika , republika , republika , republika , republika , republika200603, republika230903, republika , republika , situshijau , situshijau , suarakarya , suarakarya , suaramerdeka131001, suaramerdeka190903, suarapembaruan120104, suarapembaruan , suarapembaruan , surabayapost100210, tempointeraktif , tempointeraktif Deptan , gatra011102, gatra180103, indosiar , jurnal , jurnalhorti103, jurnalhorti113, kompas050303, kompas100702, kompas101002, kompas161000, kompas180502, kompas220801, kompas290404, mediaindonesia030104, mediaindonesia170403, pikiranrakyat , republika , republika , republika , republika , situshijau01, situshijau , situshijau , situshijau , situshijau , situshijau15, situshijau , situshijau , situshijau , suarakarya , suaramerdeka , suarapembaruan100903
22 14 Lanjutan Kueri produksi pertanian meningkat kesejahteraan petani rendah wereng serang lahan pertanian bidang pertanian belum berkembang Gugus Jawaban deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , detikfinance , gatra010307, gatra100509, gatra121108, gatra230802, gatra310807, indosiar , kompas060503, kompas150104, kompas160704, kompas180701, mediaindonesia020809, mediaindonesia080210, mediaindonesia210210, mediaindonesia250809, mediaindonesia291209, pikiranrakyat , pikiranrakyat , republika080703, republika , republika , republika , republika , republika , republika281202, republika , suarakarya , surabayapost020310, surabayapost070110, surabayapost110210, surabayapost250110, tempointeraktif balipost030608, gatra230109, jurnal , kompas030403, kompas031003, kompas110504, kompas120204, kompas161000, kompas170903, kompas220399, kompas240803, kompas290404, mediaindonesia120209, panturanews220611, pertaniansehat , poskota270411, republika100804, republika , sinartani291211, suarakarya , suarakarya , suarapembaruan100903, suarapembaruan190809, tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif balipost290708, gatra011200, gatra030203, gatra , gatra120210, gatra190902, gatra , indosiar010504, indosiar010803, indosiar070504, indosiar , indosiar240604, indosiar270504, indosiar310304, kompas170903, kompas200803, kompas211211, mediaindonesia020310, mediaindonesia030603, mediaindonesia050204, mediaindonesia050309, mediaindonesia , mediaindonesia090409, mediaindonesia110309, mediaindonesia120110, mediaindonesia131209, mediaindonesia , mediaindonesia190503, mediaindonesia221209, mediaindonesia240110, okezone , okezone , okezone , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , radarbogor050608, republika , republika , republika , republika , republika , republika , republika , republika , situshijau , situshijau , situshijau , situshijau14, situshijau , suarakarya , suarakarya , suaramerdeka131001, suarapembaruan120104, surabayapost100210, surabayapost231209, tempointeraktif , tempointeraktif balipost030608, balipost050908, balipost301208, gatra230109, gatra290903, jurnal , kompas030403, kompas031003, kompas050303, kompas091003, kompas120204, kompas , kompas170104, kompas171002, kompas180504, kompas220399, kompas240803, kompas , mediaindonesia , mediaindonesia100203, mediaindonesia180504, mediaindonesia250803, metrotvnews , okezone280111, poskota270411, republika , republika , republika , republika , sinartani291211, suarakarya , suarakarya , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif
23 15 Lanjutan Kueri angsuran pertanian sedikit dana bidang pertanian rendah permintaan humus naik Gugus Jawaban ahmadheryawan251211, antaranews031110, beritadaerah081111, bisnisindonesia101211, bisnisjabar080911, detik100211, inilahjabar221211, kabarbisnis291211, kompas110201, kompas120204, kompas140209, kompas170911, kompas , korankaltim001, medanbisnis060911, mediaindonesia170712, mediaindonesia260711, metrotvnews181211, pikiranrakyat161211, republika110504, republika , seputarsulawesi081111, suaramerdeka090707, tempointeraktif , theglobejurnal290709, tribunnews151211, ujungpadangekspres091111, wartakota0001, wsp_agro01, yiela antaranews211111, banjarmasinpost180711, bataviase070710, gatra131011, kompas040111, kompas210502, lampungpost081211, mediaindonesia090903, metrotvnews261211, neraca180811, okezone280111, panturanews220611, partaimerdeka01, poskota270411, prakarsa_rakyat190811, republika110504, republika , republika , seputarindonesia051011, seputarindonesia271211, sinartani00002, sinartani291211, sinartani291211, tempo251211, tribunnews061211, waspada bataviase200511, gatra230609, kbr68h041211, kompas151211, kompas210504, kompas211211, kompas230209, kompas , lampungpost121111, metrotvnews221111, pertaniansehat , pikiranrakyat , pikiranrakyat , pikiranrakyat100310, pikiranrakyat , pikiranrakyat , poskota190511, radarmadiun01, rakyatmerdeka180711, republika , republika201102, suarakarya , suarakarya , suarakarya
24 16 Lampiran 3 Nilai AVP sistem pada berbagai jumlah dokumen, passages, dan konsep teratas Top Top Top document passages concept avp ,5458 0,2813 0,1251 0,0739 0,0349 0,0211 0, , ,5396 0,3304 0,2476 0,1826 0,1361 0,1042 0,0742 0,0287 0, , ,535 0,3673 0,246 0,1919 0,1404 0,1024 0,077 0,0287 0, , ,5361 0,3638 0,2357 0,192 0,1389 0,103 0,0774 0,0287 0, , ,5777 0,3673 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5351 0,3023 0,2366 0,1775 0,1359 0,1045 0,0746 0,0287 0, , ,5767 0,3399 0,2443 0,1911 0,1403 0,1025 0,077 0,0287 0, , ,5408 0,3513 0,236 0,1924 0,1393 0,1035 0,0777 0,0287 0, , ,5432 0,3556 0,2373 0,1929 0,1395 0,1035 0,0777 0,0287 0, , ,5727 0,3323 0,2375 0,1929 0,1395 0,1035 0,0777 0,0287 0, , ,5763 0,3408 0,2393 0,1931 0,1395 0,1035 0,0777 0,0287 0, , ,5763 0,3408 0,2393 0,1931 0,1395 0,1035 0,0777 0,0287 0, , ,5351 0,3026 0,2366 0,1775 0,1359 0,1045 0,0746 0,0287 0, , ,5719 0,3447 0,2437 0,19 0,1417 0,1028 0,077 0,0287 0, , ,5602 0,3452 0,235 0,1917 0,1393 0,1034 0,0777 0,0287 0, , ,5665 0,352 0,2358 0,1925 0,1394 0,1035 0,0777 0,0287 0, , ,5527 0,3406 0,2364 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5527 0,3421 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, ,1555
25 17 Lanjutan Top Top Top document passages concept avp ,564 0,3371 0,2425 0,1895 0,1426 0,1086 0,0772 0,0287 0, , ,5574 0,3447 0,2349 0,1917 0,1393 0,1034 0,0777 0,0287 0, , ,57 0,3594 0,2376 0,1928 0,1395 0,1035 0,0777 0,0287 0, , ,5777 0,3408 0,2364 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5134 0,2727 0,2087 0,1753 0,1353 0,1039 0,0743 0,0287 0, , ,5569 0,3016 0,2391 0,1899 0,1411 0,1083 0,0772 0,0287 0, , ,5678 0,3168 0,2349 0,1917 0,1393 0,1034 0,0777 0,0287 0, , ,57 0,3346 0,2376 0,1928 0,1395 0,1035 0,0777 0,0287 0, , ,5763 0,3408 0,2364 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5396 0,3304 0,2476 0,1826 0,1361 0,1042 0,0742 0,0287 0, , ,535 0,3673 0,246 0,1919 0,1404 0,1024 0,077 0,0287 0, , ,5361 0,3638 0,2357 0,192 0,1389 0,103 0,0774 0,0287 0, , ,5777 0,3673 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, ,1555
DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA
DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
Lebih terperinciEkspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal
Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j
3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan
Lebih terperinciEKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN
1 EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperincibeberapa tag-tag lain yang lebih spesifik di dalamnya.
metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista
Lebih terperinciHASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.
beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini
Lebih terperinciTUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA
TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
Lebih terperinciHASIL DAN PEMBAHASAN. sim(, )=
4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i
Lebih terperinciPOSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH
POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciLampiran 1 Antarmuka implementasi
LAMPIRAN 16 Lampiran 1 Antarmuka implementasi 17 17 Lampiran 2 Contoh dokumen XML dalam koleksi pengujian indosiar050704-001 SumKa Presiden Megawati Lakukan
Lebih terperinciSTUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH
STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium
Lebih terperinciPSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA
PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009
Lebih terperinciPERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR
PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 1 PERBANDINGAN
Lebih terperinciTabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita
6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional
Lebih terperinciPEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI
PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
Lebih terperinciEVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA
EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA Fridolin Febrianto Paiki Universitas Papua, Jl. Gunung Salju, Amban, Manokwari ff.paiki@unipa.ac.id
Lebih terperinciPENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI
PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciBAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
Lebih terperinciMESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI
MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciEKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA
EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT
Lebih terperinciHASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:
2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks
Lebih terperinciTEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA
TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciPENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI
PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI
Lebih terperinciPenerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia
Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas
Lebih terperinciSistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Lebih terperinciCROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU
CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciINDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciPenerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi
Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:
Lebih terperinciEKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI
EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciRELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR
RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR Oleh: Andika Wahyu Agusetyawan G64101007 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciKONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431
KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :
Lebih terperinciBernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract
IMPLEMENTASI SISTEM TEMU KEMBALI INFORMASI Studi Kasus: Dokumen Teks Berbahasa Indonesia (IMPLEMENTATION OF INFORMATION RETRIEVAL SYSTEM Case Study: Text Document in Indonesian Language) Bernadus Very
Lebih terperinciMAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA
MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA Aida Indriani ) ) Teknik Informatika STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso 8, Tarakan 77 Email
Lebih terperinciPENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI
18 PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI Karter D. Putung, Arie Lumenta, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi Manado, Indonesia. karterputung@gmail.com,
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciTEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI
TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI
Lebih terperinciEVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE
EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE Rila Mandala Kelompok Keahlian Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10 Bandung,
Lebih terperinciSistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient
Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,
Lebih terperinciQUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK
QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut
Lebih terperinciTEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH
TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING
Lebih terperinciTEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 1 Identitas Mata Kuliah Nama Mata Kuliah : Temu Kembali Informasi (TKI) Information Retrieval (IR) Kode Mata Kuliah : KOM431 Koordinator : Julio
Lebih terperinciUNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI
UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &
Lebih terperinciPENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL
Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,
Lebih terperinciHASIL DAN PEMBAHASAN. Praproses
5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk
Lebih terperinciHASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan.
4 dan Thelen (2000) karena disesuaikan terhadap kaidah bahasa Indonesia. Rule yang dibuat Sianturi (2008) dan digunakan oleh Sanur (2011) memiliki notasi S sebagai sentence atau passage serta Q sebagai
Lebih terperinciINFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER
INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan
Lebih terperinciXML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI
XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 XML RETRIEVAL UNTUK DOKUMEN
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada era ini perkembangan teknologi informasi sangat pesat. Hal ini ditandai dengan semakin populernya penggunaan internet dan perangkat lunak komputer sebagai
Lebih terperinciPemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi
Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami
Lebih terperinciIMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI
IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik
Lebih terperinciBAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
Lebih terperinciMETODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA
METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen
6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat
Lebih terperinciEKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G
EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G64103024 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT
Lebih terperinciQUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL
QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL Susetyo Adi Nugroho () Abstrak: Salah satu metode yang sering digunakan dalam mengukur relevansi dokumen
Lebih terperinciBAB II TINJAUAN PUSTAKA
7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem
Lebih terperinciStudi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine
Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya Terhadap Peningkatan Kinerja Image Search Engine Nugroho Herucahyono (13504038) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika,
Lebih terperinciBAB I. Pendahuluan. 1. Latar Belakang Masalah
BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan
Lebih terperinciRELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR
RELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR Julio Adisantoso, Ahmad Ridha, Andika Wahyu Agusetyawan Staf Departemen Ilmu Komputer, Fakultas Matematika
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian
Lebih terperinci1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah
1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari
Lebih terperinciABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document
Jurnal Ilmiah Widya Teknik Volume 15 Nomor 2 2016 ISSN 1412-7350 SISTEM PEMEROLEHAN INFORMASI UNDANG-UNDANG DAN KASUS MENGGUNAKAN STRUKTUR DATA INVERTED INDEX DENGAN PEMBOBOTAN TF-IDF Fredes Winda Oktaviani
Lebih terperinciRANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan
RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks
Lebih terperinciBAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN
28 BAB 3 PERANCANGAN Pada bab ini akan dijelaskan mengenai rancangan percobaan pada penelitian segmentasi dokumen ini. Pembahasan akan dimulai dengan penjelasan mengenai gambaran umum proses segmentasi
Lebih terperinciPELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI
PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan
Lebih terperinci2. Ketepatan untuk setiap jawaban.
dikembalikan sebagai top passage dari kueri pertanyaan yang diberikan. 5. Ekstraksi Jawaban Top passages yang diperoleh dilakukan perhitungan terhadap jarak kata. Entitas yang memiliki jarak terpendek
Lebih terperinciPRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)
PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Identifikasi Masalah Merumuskan Masalah Study Literatur Perancangan Struktur Menu Interface Analisa
Lebih terperinciROCCHIO CLASSIFICATION
DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi
Lebih terperinciLAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer
LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer CORPUS DOKUMEN TEKS BAHASA INDONESIA UNTUK PENGUJIAN EFEKTIVITAS TEMU KEMBALI INFORMASI Oleh: Ir. Julio Adisantoso, M.Kom.
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciImplementasi Metode Document Oriented Index Pruning pada Information Retrieval System
Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Hendri Priyambowo 1, Yanuar Firdaus A.W. S.T, M.T 2, Siti Sa adah S.T. M.T 3 123 Program Studi S1 Teknik Informatika,
Lebih terperinciEKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA
EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
Lebih terperinciKATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA
KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA Oleh: YUDHA PERMADI G64102064 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008
Lebih terperinciRELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE
RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE Sri Ulinar Romatua N B¹, Yanuar Firdaus A.w.², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Dengan semakin
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.
Lebih terperinciAPLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL
APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka
Lebih terperinciPERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL
PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL (Studi Kasus Perpustakaan Universitas Udayana) LEMBAR JUDUL KOMPETENSI RPL SKRIPSI NI MADE
Lebih terperinciAPLIKASI PENILAIAN UJIAN ESSAY OTOMATIS MENGGUNAKAN METODE COSINE SIMILARITY. Rahimi Fitri 1, Arifin Noor Asyikin 2
APLIKASI PENILAIAN UJIAN ESSAY OTOMATIS MENGGUNAKAN METODE COSINE SIMILARITY Rahimi Fitri 1, Arifin Noor Asyikin 2 mahaluddin@yahoo.com (1) Staf Pengajar Jurusan Teknik Elektro Politeknik Negeri Banjarmasin
Lebih terperinciPERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY
Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik
Lebih terperinciStemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic
Lebih terperinciPERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH
PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015
Lebih terperinciSISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS
SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS Surya Agustian 1, Imelda Sukma Wulandari 2 1,2 Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, UIN
Lebih terperinciSISTEM INFORMATION RETRIEVAL PENCARIAN KESAMAAN AYAT TERJEMAHAN AL QURAN BERBAHASA INDONESIA DENGAN QUERY EXPANSION DARI TAFSIRNYA
SISTEM INFORMATION RETRIEVAL PENCARIAN KESAMAAN AYAT TERJEMAHAN AL QURAN BERBAHASA INDONESIA DENGAN QUERY EXPANSION DARI TAFSIRNYA Broto Poernomo T.P. 1 dan Ir. Gunawan 2 1 Teknik Informtika Sekolah Tinggi
Lebih terperinciMengenal Information Retrieval
STBI-2011 Sistem Temu Balik Informasi 2011 Mengenal Information Retrieval Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress.com 2 3 Amazon.com 4 Amazon.com 5 6 7 8 9 Wordpress.com
Lebih terperinciSISTEM TEMU KEMBALI INFORMASI
SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database
Lebih terperinciIMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN
IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciSistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN
Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Dokumen Penyimpanan yang Terorganisasi Database Mahasiswa Database Buku ID Nama Buku Pengarang 001 Information Retrieval Ricardo baeza
Lebih terperinciEKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI
EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
Lebih terperinci