PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH

Ukuran: px
Mulai penontonan dengan halaman:

Download "PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH"

Transkripsi

1 PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

2 PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

3 ABSTRACT FANIA RAHMANAWATI KARIMAH. RIDF Weighting for Query Expansion on Information Retrieval System for Documents in Indonesian Using Lokal Context Analysis. Supervised by JULIO ADISANTOSO. Automatic query expansion is a technique for dealing with the fundamental issue of word mismatch between queries and documents in information retrieval. A number of approaches on query expansion have been studied, especially on techniques that analyze the corpus to discover word relationships (global technique) and those that analyze documents retrieved by initial query (local technique). Both techniques have their own advantages and limitations. Local context analysis is an automatic query expansion which is a combination of global and local techniques. The purpose of this research is to implement query expansion with local context analysis using TF (Term Frequency) RIDF (Residual Inverse Document Frequency) weighting method, a variation of IDF (Inverse Document Frequency) that assigns weights to terms according to the difference between the logs of the actual IDF and its prediction by Poisson model. The obtained performance of information retrieval was 15% average precision. The results also showed that the number of top-ranked documents and passages did not significantly affect the average precision. The more influential factor was the number of query expansions. Keyword: analysis context local, IDF, query expansion, RIDF, TF

4 Judul Skripsi Nama NRP : Pembobotan RIDF pada Mesin Pencari Bahasa Indonesia untuk Ekspansi Kueri Menggunakan Analisis Konteks Lokal : Fania Rahmanawati Karimah : G Menyetujui: Pembimbing Ir. Julio Adisantoso, M.Kom NIP Mengetahui: Ketua Departemen Ilmu Komputer, Dr. Ir. Agus Buono, M.Si, M.Kom NIP Tanggal Lulus:

5 PRAKATA Alhamdulilahirobbil alamin, segala puji syukur penulis panjatkan ke hadirat Allah subhanahu wata ala atas segala karunia-nya sehingga penulis dapat menyelesaikan skripsi. Penulis menyadari bahwa tugas akhir ini tidak akan terselesaikan tanpan bantuan dari berbagai pihak. Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada: 1 Orang tua tercinta, bapak Muhamad Rasyid dan ibu Mindarwati, adik yang saya sayangi Fatharani Kurniawati yang selalu memberikan doa, nasihat, semangat, dukungan dan kasih sayang yang luar biasa kepada penulis sehingga dapat menyelesaikan tugas akhir ini. 2 Bapak Ir. Julio Adisantoso, M.Kom selaku dosen pembimbing tugas akhir. Terima kasih atas kesabaran, bimbingan serta dukungan dalam penyelesaian tugas akhir ini. 3 Teman-teman satu bimbingan Meriska Defriani, Susi Handayani, Nofel Saputra, Putri Dewi P, Anita, Mery Marlina, Alfa Nugraha, Risky Utama dan Hafidzhia Dzikrul A terima kasih atas kebersamaan dan semangatnya dalam menyelesaikan tugas akhir ini. 4 Sahabat-sahabat Mitha Rachmawati, Siska Susanti, Brenda Kristi, Chichi, dan Ardini. 5 Teman-teman Ilkomerz Seluruh staf Departemen Ilmu Komputer IPB yang telah banyak membantu baik selama penelitian maupun selama perkuliahan. Penulis menyadari bahwa dalam penulisan tugas akhir ini masih terdapat banyak kekurangan dan kelemahan dalam berbagai hal karena keterbatasan kemampuan penulis. Penulis berharap adanya masukan berupa saran atau kritik yang bersifat membangun dari pembaca demi kesempurnaan tugas akhir ini. Semoga tugas akhir ini bermanfaat. Bogor, April 2013 Fania Rahmanawati Karimah

6 RIWAYAT HIDUP Penulis dilahirkan di Jakarta pada tanggal 5 April 1990 yang merupakan anak pertama dari dua bersaudara dengan ayah bernama Muhamad Rasyid dan Ibu bernama Mindarwati. Pada tahun 2008 lulus dari Sekolah Menengah Atas Negeri 68 Jakarta Pusat dan diterima di Program Studi Ilmu Komputer Institut Pertanian Bogor melalui jalur USMI (Undangan Seleksi Masuk IPB). Selama aktif sebagai mahasiswa, penulis pun turut aktif mengikuti beberapa kegiatan kepanitiaan di Departemen Ilmu Komputer, antara lain: IT TODAY 2010, Pesta Sains 2010, panitia MPD (Masa Perkenalan Departemen). Penulis pun aktif sebagai pengurus Divisi Kesekretariatan Himpunan Mahasiswa Ilmu Komputer. Penulis juga melakukan praktik kerja lapang di Lembaga Minyak dan Gas Bumi (LEMIGAS) Jakarta.

7 DAFTAR ISI Halaman DAFTAR TABEL... v DAFTAR GAMBAR... vi DAFTAR LAMPIRAN... vi PENDAHULUAN... 1 Latar Belakang... 1 Tujuan Penelitian... 1 Ruang Lingkup Penelitian... 1 METODE PENELITIAN... 1 Koleksi Dokumen... 2 Praproses Dokumen... 2 Temu Kembali Awal... 2 Pembentukan Passages... 3 Temu Kembali Passages... 3 Ekspansi Kueri... 3 Analisis Konteks Lokal... 4 Evaluasi... 4 Lingkungan Pengembangan Sistem... 4 HASIL DAN PEMBAHASAN... 5 Koleksi Dokumen Pengujian... 5 Praproses Dokumen... 5 Pembentukan Passages... 5 Temu Kembali Passages... 6 Pemilihan Konsep Ekspansi... 6 Formulasi Kueri Baru... 6 Pengujian Kinerja Sistem... 6 KESIMPULAN DAN SARAN... 7 Kesimpulan... 7 Saran... 7 DAFTAR PUSTAKA... 7 LAMPIRAN... 9 v

8 DAFTAR TABEL Halaman 1 Tabel contingensi recall-precision Koleksi dokumen pengujian Contoh istilah konsep Nilai AVP pada penambahan konsep Nilai AVP pada penambahan jumlah passages DAFTAR GAMBAR Halaman 1 Metode penelitian Contoh dokumen XML Contoh pembentukan passages Grafik recall precision DAFTAR LAMPIRAN Halaman 1 Contoh dokumen pengujian Gugus kueri dan jawaban untuk dokumen pertanian Nilai AVP sistem pada berbagai jumlah dokumen, passages, dan konsep teratas vi

9 1 PENDAHULUAN Latar Belakang Tujuan sistem temu kembali informasi adalah menemukan keberadaan dokumen yang dianggap relevan sesuai kebutuhan informasi pengguna. Pengguna akan merepresentasikan kebutuhan informasi dalam bentuk kueri. Menurut Rahayuni (2011) salah satu masalah yang sering dihadapi adalah pengguna tidak mampu merepresentasikan kebutuhan informasi yang diinginkan dalam bentuk kueri. Masalah lain yang sering muncul adalah pilihan kata yang digunakan seringkali berbeda dangan database dalam koleksi. Hal ini dapat diatasi dengan relevance feedback dan teknik ekspansi kueri. Dengan menggunakan teknik ekspansi kueri pengguna akan dibantu untuk menentukan istilah apa saja yang akan ditambahkan pada kueri awal. Kueri yang telah mengalami perluasan akan digunakan untuk melakukan pencarian selanjutnya. Diharapkan dari hasil ekspansi kueri dokumen yang relevan akan berada di posisi atas dan lebih banyak ditemukembalikan. Metode yang diharapkan bisa lebih meningkatkan kinerja sistem dalam ekspansi kueri adalah analisis konteks lokal. Metode ini merupakan penggabungan antara pendekatan global dan pendekatan lokal dalam memperluas kueri awal (Xu & Croft 2000). Penelitian juga dilakukan oleh Rahayuni (2011) menggunakan pendekatan global berbasis pemilihan kata untuk ekspansi kueri menggunakan ukuran kesamaan antar kata dengan istilah yang ada dalam thesaurus. Hal ini menyebabkan nilai Average Precision (AVP) sistem menjadi Rusidi (2008) melakukan penelitian menggunakan peluang bersyarat dan mengaplikasikan ekspansi kueri dalam sistem temu kembali informasi. Ekspansi kueri yang dilakukan yaitu menggunakan analisis lokal. Diva (2011) melakukan penelitian ekspansi kueri menggunakan teknik analisis konsep lokal. Dalam penelitian ini digunakan pembobotan BM25. Hal ini menyebabkan kinerja sistem kurang baik dengan nilai Average Precision (AVP) sebesar Oleh karena itu, penelitian ini akan menggunakan pembobotan RIDF dan memilihan kata berbasis konsep untuk ekspansi kueri pada mesin pencari bahasa Indonesia. Tujuan Penelitian Penelitian ini bertujuan mengimplementasikan teknik analisis konteks lokal pada ekspansi kueri di mesin pencari bahasa Indonesia. Ruang Lingkup Penelitian Ruang lingkup dalam penelitian ini antara lain: 1 Dokumen yang digunakan dalam penelitian adalah dokumen XML berbahasa Indonesia. 2 Kesalahan dalam pengetikan di dalam korpus tidak diperhatikan. 3 Dokumen yang relevan dengan kueri uji ditentukan berdasarkan koleksi yang ada di Laboratorium Information Retrieval. METODE PENELITIAN Tahapan penelitian ini dapat dilihat pada Gambar 1. Dokumen Praproses Dokumen dengan pembobotan BM25 Ya Dokumen Peringkat N Teratas Pembentukan Passages Praproses Passages dengan Pembobotan Tf Ridf Temu Kembali Passages menggunakan Cosine Similarity Passages Peringkat P Teratas Daftar Konsep Temu Kembali Awal Ekspansi Kueri? Konsep Peringkat c Teratas Tidak Gambar 1 Metode penelitian. Kueri Evaluasi Formulasi Kueri

10 2 Koleksi Dokumen Dokumen yang digunakan dalam penelitian ini berasal dari Laboratorium Temu Kembali Informasi Departemen Ilmu Komputer IPB. Contoh dokumen XML yang digunakan dapat dilihat pada Lampiran 1. Koleksi Dokumen terdiri atas 2095 dokumen pertanian merupakan artikel media umum. Evaluasi kinerja sistem menggunakan 20 kueri dan tersedia himpunan dokumen yang relevan dengan kueri (Lampiran 2). Praproses Dokumen Pada tahap ini dilakukan pemrosesan dokumen melalui proses indexing menggunakan Sphinx. Proses indexing diawali dengan proses tokenisasi yang bertujuan mengidentifikasi kata di dalam teks dengan cara membedakan karakter-karakter yang bersifat separator. Pembuangan stopword dilakukan untuk membuang kata-kata yang tidak diperlukan atau tidak memiliki makna dan terakhir adalah pembobotan dengan BM25 yang bertujuan menentukan tingkat kepentingan suatu istilah dalam dokumen. Pembobotan BM25 merupakan pembobotan yang menggabungkan bobot inverse document frequency dengan pengskalaan khusus untuk dokumen dan kueri. Pembobotan BM25 antara dokumen dan kueri yang diberikan terlihat pada persamaan berikut: dengan R : jumlah dokumen yang relevan dalam koleksi r t R r t df t r t : jumlah dokumen relevan dalam koleksi yang mengandung istilah t : jumlah dokumen relevan dalam koleksi yang tidak mengandung istilah t : jumlah dokumen yang tidak relevan dalam koleksi yang mengandung istilah t N df t R+ r : jumlah dokumen yang tidak relevan dalam koleksi yang tidak mengandung istilah t. Fungsi pembobotan tersebut diubah sehingga menjadi bobot inverse collection frequency tanpa informasi relevansi (R = r = 0) yang berfungsi seperti inverse document frequency: Selanjutnya fungsi tersebut digunakan untuk menentukan kesamaan kueri Q dan dokumen D i dengan formula: dengan N K ( ( )) : banyaknya dokumen pada koleksi : jumlah dokumen yang mengandung term t : frekuensi term kueri t pada dokumen i : frekuensi term kueri t pada kueri Q : panjang dokumen D i : rata-rata panjang dokumen dalam koleksi : faktor normalisasi b : parameter-parameter pengskalaan terhadap tf term dalam dokumen dan panjang dokumen. Nilai parameter yang digunakan adalah k 1 = 1.2 dan b = 0.75 (Manning et al. 2009). Temu Kembali Awal Setelah dilakukan praproses dokumen kemudian dilakukan proses temu kembali awal yang diimplementasikan dengan Sphinx Search. Dengan Sphinx, sebelum proses temu kembali awal diimplementasikan, proses yang terlebih dahulu dilakukan adalah pengindeksan pada dokumen XML hasil praproses. Pengindeksan menggunakan file konfigurasi yang sesuai. Temu kembali awal digunakan untuk mendapatkan dokumen-dokumen yang sesuai dengan kueri yang diberikan pengguna. Dokumen peringkat N teratas akan diambil untuk digunakan dalam tahapan ekspansi kueri menggunakan analisis konteks lokal dengan pembobotan kata TF RIDF.

11 3 Pembentukan Passages Passage merupakan bagian yang lebih kecil dari suatu dokumen. Menurut Callan (1994), passage dapat dibagi dalam tiga kelas: 1 Discourse passage merupakan passage yang dibentuk berdasarkan bagian-bagian dari suatu dokumen, dapat berupa kalimat atau paragraf. 2 Semantic passage merupakan passage yang dibentuk berdasarkan subjek atau konten dari dokumen. 3 Windows passage merupakan passage yang dibentuk berdasarkan jumlah kata yang digunakan. Pada penelitian ini passage yang digunakan adalah Discourse passage. Passage dibentuk dari kumpulan dua kalimat yang saling overlapping, yakni kalimat pertama digabung dengan kalimat kedua menjadi satu passage, kalimat kedua dan kalimat ketiga menjadi satu passage juga, dan begitu seterusnya untuk setiap dokumen peringkat teratas. Temu Kembali Passages Proses temu kembali passages dilakukan dengan tahap awal indexing dengan pembobotan TF-RIDF dan pemeringkatan passages menggunakan cosine similiarity. Bobot dalam term t di dalam sistem temu kembali informasi dihitung menggunakan ukuran TF-RIDF, dengan formula: W t,i =ridf t x tf t,i dengan W t,i adalah bobot kata t pada passagesi. Residual idf (RIDF) merupakan variasi dari idf yaitu menggunakan rasio observasi empiris dan estimasi. Nanas et al. (2004) mengungkapkan RIDF merupakan variasi dari IDF yang memberikan bobot untuk term berdasarkan perbedaan logaritma yang sesuai dengan IDF sebelumnya memakai model Poisson. (1) dengan Y = 0,1,2,3,, dan µ adalah mean distribusi Poisson, mean, dan variansinya adalalah E[y] = var[y] = µ Peluang banyaknya peubah acak Y dalam periode waktu t diberikan oleh:. (2) Persamaan 2 digunakan untuk menghitung peluang peubah acak Y. Cara yang paling umum menghitung RIDF adalah dengan dua persamaan. Persamaan pertama adalah nilai rata-rata kemunculan term per dokumen dan persamaan kedua yaitu 1- p(0;µt). Dengan demikian nilai RIDF kata t adalah RIDF t =obeserved idf t predicted idf t RIDF t = idf t + log 2 (1-p(0;µ)) = (1+ log 2 (N/ df t )) + log 2 (1- p (0; µ)) = (1+ log 2 (N/ df t )) + log 2 (1- exp(- cf t /N)) sedangkan N adalah jumlah dokumen dalam korpus. Ukuran kemiripan cosine similiarity digunakan untuk memeringkat passages dalam koleksi dengan kueri awal yang diberikan pengguna. Cosine similarity merupakan salah satu metode yang digunakan untuk mengukur kemiripan antara dokumen dan kueri. Metode ini mengukur kemiripan berdasarkan vektor istilah kueri (q) dan vektor istilah dokumen (d). Rumus cosine similarity adalah: dengan adalah panjang vektor (Manning et al. 2009). Ekspansi Kueri Dalam relevance feedback pengguna memberikan input tambahan pada koleksi dokumen yang diberikan dengan memberi tanda pada dokumen yang dianggap relevan. Selanjutnya input ini digunakan untuk memperbaiki kueri yang telah diberikan pengguna. Pada ekspansi kueri pengguna memberi input tambahan pada kueri awal berupa kata atau frasa (Manning et al. 2009). Terdapat tiga jenis ekspansi kueri yaitu: 1 Manual Query Expansion (MQE) Dalam metode ini pengguna memodifikasi kueri secara manual tanpa bantuan sistem. 2 Automatic Query Expansion (AQE) Metode ini akan memodifikasi kueri tanpa bantuan pengguna, melainkan dilakukan otomatis melalui sistem. Menurut Baeza- Yates dan Ribeiro-Neto (1999) terdapat beberapa teknik dalam AQE, yaitu: Analisis Global yang prinsip dasarnya memanfaatkan konteks suatu kata untuk menentukan kesamaannya dengan kata yang lain, Analisis Lokal menggunakan dokumen yang ditemukembalikan pengguna untuk mendapat kueri baru, dan analisis konteks lokal yang merupakan gabungan teknik analisis global dan lokal. 3 Interactive Query Expansion (IQE)

12 4 Metode ini membutuhkan interaksi antara pengguna dengan sistem untuk melakukan proses ekspansi kueri. Pertanyaan yang sering muncul adalah bagaimana pemilihan istilah dan berapa jumlah istilah yang digunakan untuk ekspansi kueri. Salah satunya adalah memilih istilah dengan mengambil beberapa yang terbaik atau memasukkan seluruh istilah dokumen relevan (relevance feedback) atau memasukkan seluruh istilah indeks koleksi. Analisis Konteks Lokal Menurut Xu & Croft (2000) analisis konsep lokal adalah teknik yang mengombinasikan analisis lokal dan analisis global pada ekspansi kueri. Langkah-langkahnya adalah: 1 Gunakan sistem temu kembali informasi standar untuk me-retrieved n passagess peringkat teratas menggunakan kueri awal dengan cara memecah dokumen ke dalam passages, kemudian passages diberi peringkat dengan cara yang sama ketika memberi peringkat pada dokumen (Analisis Lokal). 2 Selanjutnya konsep pada passages peringkat n teratas juga diberi peringkat (Analisis Global) menggunakan formula bel(q,c) yaitu: bel(q,c)= sedangkan c adalah konsep, ft ij adalah jumlah kemunculan t i pada p j dan fc ij adalah jumlah kemunculan c pada p j, N adalah jumlah passages pada koleksi dan N i adalah jumlah passages yang memiliki t i dan N c adalah jumlah passages yang memiliki c dan adalah 0.1 untuk menghindari zero bel value. 3 Semua konsep pada peringkat m teratas berdasarkan bel(q, c) ditambahkan pada kueri awal. Evaluasi Manning et al. (2009) menyatakan terdapat dua hal mendasar yang paling sering digunakan untuk mengukur kinerja temu-kembali secara efektif adalah recall dan precision (R-P). Perhitungan recall-precision didasarkan pada tabulasi silang seperti pada Tabel 1. Tabel 1 Tabel kontingensi recall-precision Retrieved Non retrieved Relevant true positives (tp) false negatives (fn) Nonrelevant false positives (fp) true negatives (tn) Oleh karena itu recall-precision didefinisikan sebagai: P = tp/(tp+fp) R = tp/(tp+fn) Menurut Baeza-Yates dan Ribeiro-Neto (1999) algoritma temu-kembali yang dievaluasi menggunakan beberapa kueri berbeda akan menghasilkan nilai R-P yang berbeda untuk masing-masing kueri. Average Precision (AVP) diperlukan untuk menghitung rata-rata tingkat precision pada berbagai tingkat recall, yaitu 0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, dan 1.0. Perhitungan AVP dapat diformulasikan sebagai berikut: ( ) ( ) adalah AVP pada level recall r. N q adalah jumlah kueri yang digunakan dan P i (r) adalah precision pada level recall r untuk kueri ke-i. Lingkungan Pengembangan Sistem Lingkungan implementasi yang digunakan adalah sebagai berikut: Perangkat lunak dan bahasa pemrograman: Windows 7 Professional 64-bit sebagai sistem operasi. C# sebagai bahasa pemrograman untuk pembuatan library. ASP.NET MVC sebagai web framework untuk pembuatan aplikasi website. Visual Studio 2010 sebagai IDE (Integrated Development Environment). SQL Server 2008 R2 sebagai database penyimpanan data. Notepad++ v8.5 sebagai editor. Sphinx sebagai platform temu kembali informasi. Spesifikasi perangkat keras: Processor Intel Core i GHz. RAM 6 GB. Hard disk dengan kapasitas 500 GB.

13 5 HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Dokumen yang digunakan dalam pengujian pada penelitian ini berasal dari Laboratorium Temu Kembali Informasi, Ilmu Komputer IPB dengan jumlah 2095 dokumen. Dokumen tersebut merupakan kumpulan berita tentang pertanian dari surat kabar online. Deskripsi dari dokumen dapat dilihat pada Tabel 2. Contoh salah satu dokumen pertanian yang digunakan dalam penelitian ini seperti yang tercantum pada Gambar 2. Tabel 2 Koleksi dokumen pengujian Keterangan Ukuran (byte) Ukuran seluruh dokumen Ukuran rata-rata dokumen Ukuran dokumen terbesar Ukuran dokumen terkecil 412 <DOC> <DOCNO>gatra011102</DOCNO> <TITLE>Agroindustri</TITLE> <AUTHOR>Ani, Anti</AUTHOR> <DATE> 1 November 2002 </DATE> < TEXT >Selain industry argowisata yang telah </ TEXT > </DOC> Gambar 2 Contoh dokumen XML. Dokumen ditandai dengan tag-tag sebagai berikut: <DOC></DOC>,tag ini mewakili keseluruhan dokumen dan melingkupi tagtag lain yang lebih spesifik <DOCNO></DOCNO>, tag ini menunjukkan ID dari dokumen <TITLE></TITLE>, tag ini menunjukkan judul dari dokumen <DATE></DATE>, tag ini menunjukkan tanggal dari berita atau penulisan <AUTHOR></AUTHOR>, tag ini menunjukkan penulis dari berita tersebut. <TEXT></TEXT>, tag ini menunjukkan isi dari dokumen. Praproses Dokumen Pemrosesan dokumen dilakukan melalui beberapa tahapan yaitu: tokenisasi, pembuangan stopword, dan pembobotan menggunakan rumus TF RIDF. Sebelum dilakukan tokenisasi, seluruh huruf pada koleksi dokumen diubah menjadi huruf kecil dengan menggunakan fungsi strtolower. Dokumen koleksi diproses secara sekuensial per karakter dari awal hinga menghasilkan sebuah token. Tahapan untuk memperoleh token adalah sebagai berikut: 1 Sistem menggolongkan karakter menjadi empat jenis, yaitu : a whitespace, berarti karakter ini merupakan karakter pemisah token. b alpha, berarti karakter ini merupakan huruf. c numeric, berarti karakter ini merupakan angka. d other, berarti karakter ini tidak termasuk jenis-jenis di atas. 2 Sistem mengubah jenis karakter numeric dan other menjadi whitespace. 3 Sistem melakukan pemisahan kata berdasarkan whitespace. 4 Kata yang dianggap token adalah yang mempunyai panjang lebih dari dua. Kenudian dilakukan pembuangan sejumlah kata umum yang tidak berpotensi mencirikan suatu dokumen (stopword). Daftar kata buangan (stopword) menggunakan hasil penelitian Rahayuni (2011). Pembentukan Passages Dokumen XML hasil praproses koleksi seluruh dokumen kemudian diindeks pada Sphinx. Pengindeksan dilakukan sesuai dengan file konfigurasi yang telah dibuat. Pada file konfigurasi, dokumen XML hasil praproses dokumen disimpan dengan nama Corpus2095.xml yang selanjutnya diindeks menggunakan Sphinx Search dan disimpan dalam file bernama IndexingCorpus2095. Pada file konfigurasi Sphinx, xmlpipe_field berfungsi mendefinisikan tag-tag yang terdapat pada file XML. Hal tersebut dapat mempermudah pengaksesantag tertentu. Tahap indexing menggunakan Sphinx Search. Kemudian setelah tahap temu kembali selesai akan diambil dokumen-dokumen peringkat teratas untuk dijadikan passages. Bagian dokumen yang diambil untuk dijadikan passages terdiri atas bagian judul (ditandai dengan tag title) dan paragraf (ditandai dengan tag content). Pada Gambar 3 dapat terlihat contoh pembentukan passages.

14 6 Passages 1 Akibat banjir tersebut, para petani gagal tanam. Ratusan hektar tanaman jeruk petani yang puso akibat banjir Desember 2003 lalu tidak bisa ditanami kembali karena areal kebun jeruk tersebut tergenang air. Passages 2 Ratusan hektar tanaman jeruk petani yang puso akibat banjir Desember 2003 lalu tidak bisa ditanami kembali karena areal kebun jeruk tersebut tergenang air. Banjir tersebut juga membuat para petani tidak bisa menanami lahan mereka tanaman jagung dan padi. Gambar 3 Contoh pembentukan passages. Temu Kembali Passages Passages yang telah terbentuk kemudian akan ditemu kembalikan. Top p passages hasil temu kembali akan menjadi sebuah dokumen untuk menentukan konsep pada formulasi kueri yang baru. Untuk itu dilakukan tokenisasi kembali untuk mendapatkan semua term unik pada semua passages. Setelah didapatkan term unik, dicari frekuensi kemunculan term unik tersebut di semua passages kemudian term diberi bobot sesuai dengan TF RIDF. Berikutnya dengan menggunakan pembobotan TF RIDF dan fungsi kesamaannya dicari nilai kemiripan antara passages dan kueri pengguna sehingga didapatkan passages peringkat m teratas. Pemilihan Konsep Ekspansi Dari passages peringkat teratas diambil kata benda disebut konsep (calon kueri perluasan). Term kueri yang diberikan pengguna dihitung kemunculannya pada setiap passage peringkat teratas dengan semua konsep yang ada menggunakan persamaan bel value. Kemudian dilakukan pencarian nilai kemiripan konsep dengan semua term yang ada pada kueri menggunakan persamaan bel(q,c). Hasil dari tahap ini berupa konsep-konsep yang telah terurut berdasarkan kemiripannya dengan keseluruhan kueri, yang nanti digunakan sebagai term kueri perluasan. Tabel 3 menunjukkan contoh istilah konsep yang akan digunakan dalam ekspansi kueri. Tabel 3 Contoh istilah konsep Kueri persediaan padi memadai nilai jual komoditas rendah upaya peningkatan produksi pertanian sawah rusak berat dana bidang pertanian rendah 7 Istilah Ekspansi *mentan, *optimis, *Indonesia, *ekspor, *beras, *jakarta, *apriyantono *agraris, *harga, *produsen, *buah, *tani, *produk, *jajar *tsunami, *kosong, *susilo, *tingkat, *presiden, *komitmen, *bencana *kira, *tanam, *pimpin, *asal, *mundur, *luas, *lingkung *sektor, *universitas, *pakar, *gantung, *bicara, *satu, *kecil Formulasi Kueri Baru Kueri perluasan yang didapatkan pada tahap sebelumnya digabungkan dengan kueri awal yang diberikan oleh pengguna. Pada penelitian ini, banyak konsep yang ditambahkan sehingga mendapatkan hasil yang optimal adalah 4 konsep. Hasil dari tahap ini adalah kueri baru sebagai hasil ekspansi. Pengujian Kinerja Sistem Pengaruh jumlah konsep yang ditambahkan pada kueri awal diuji pada sistem dengan menggunakan pasangan kueri dan dokumen relevan yang telah disiapkan. Banyaknya konsep yang ditambahkan pada kueri awal diduga mempengaruhi kinerja hasil temu kembali. Dalam penelitian ini digunakan penambahan konsep untuk kemudian dilihat nilai AVP dari setiap penambahan konsep. Dari tabel 4 terlihat bahwa untuk penambahan konsep semakin banyak jumlahnya maka akan menghasilkan nilai AVP yang semakin tinggi. Nilai AVP tertinggi ketika jumlah konsep adalah 4 dan 5. Ketika jumlah konsep yang ditambahkan lebih dari 7 maka nilai AVP sistem akan cenderung tetap.

15 7 Tabel 4 Nilai AVP pada penambahan konsep Penambahan Jumlah Nilai AVP Konsep Pengaruh penambahan jumlah passages dapat dilihat pada Tabel 5. Dapat terlihat bahwa penambahan passages tidak mempengaruhi nilai AVP sistem secara signifikan. Untuk nilai AVP hasil pengujian sistem pada berbagai kombinasi jumlah penambahan dokumen peringkat teratas, jumlah passages, dan jumlah konsep dapat dilihat pada Lampiran 3. Tabel 5 Nilai AVP pada penambahan jumlah passages Penambahan Jumlah AVP Passages sistem setelah ekspansi kueri adalah dengan recall Berdasarkan evaluasi yang dilakukan untuk nilai AVP optimal didapatkan dari kombinasi jumlah dokumen peringkat teratas sebanyak satu, jumlah konsep yang ditambahkan sebanyak empat dan jumlah passages sebanyak satu. KESIMPULAN DAN SARAN Kesimpulan Penelitian ini menganalisis ekspansi kueri menggunakan metode analisis konteks lokal dengan menggunakan pembobotan TF RIDF. Berdasarkan hasil penelitian yang diperoleh dapat disimpulkan bahwa: 1 Ekspansi kueri menggunakan analisis konteks lokal dengan menggunakan pembobotan TF RIDF dapat meningkatkan kinerja sistem temu kembali, yakni dokumen yang relevan berada pada urutan awal pada penemukembalian. 2 Jumlah ekspansi kueri yang ditambahkan mempengaruhi kinerja sistem temu kembali. Semakin banyak konsep yang ditambahkan maka semakin bagus kinerja sistem sampai pada batas tertentu yaitu 4 konsep nilainya cenderung tetap. Jumlah dokumen dan passages peringkat teratas yang diambil tidak memberikan banyak perbedaan pada hasil kinerja sistem temu kembali. Saran Pada penelitian selanjutnya disarankan untuk menggunakan koleksi yang lebih besar untuk lebih mendekati penggunaan sesungguhnya. Penambahan frasa dan kata kerja sebagai kata yang akan digunakan untuk ekspansi untuk mengatasi keambiguan kata. Gambar 4 Grafik recall precision. Pada Gambar 4 terlihat perbedaan antar hasil pengujian sistem saat belum menggunakan ekspansi kueri dan setelah ekspansi kueri. Nilai AVP untuk sistem tanpa ekspansi adalah dengan recall sedangkan nilai AVP DAFTAR PUSTAKA Baeza-Yates R, Ribeiro-Neto B Modern Information Retrieval. New York: Addison- Wesley. Callan JP Passage-level evidence in document retrieval. Di dalam: Proceedings of the 17 th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval; Dublin, July New York: Springer-Verlag New York, Inc. hlm Diva LM Ekspansi kueri pada sistem temu kembali informasi berbahasa Indonesia menggunakan analisis konteks lokal.

16 8 [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Manning Christopher D, Raghavan Prabhakar, Schutze Hinrich An Introduction to Information Retrieval. Cambridge: Cambridge University Press. Nanas N, Uren V, Roeck AD A Comparative Study of Term Weighting Methods for Information Filtering. U.K: The Open University Knowledge Media Institute Milton Keynes. Rahayuni Ekspansi kueri pada sistem temu kembali informasi berbahasa Indonesia menggunakan thesaurus. [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Rusidi Ekspansi kueri dalam sistem temu kembali informasi berbahasa Indonesia menggunakan peluang bersyarat. [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Xu J, Croft WB Improving the Effectiveness of Informational Retrieval with Lokal Context Analysis. Jurnal ACM Transactions on Information Systems 18(1):

17 LAMPIRAN

18 10 Lampiran 1 Contoh dokumen pengujian <DOC> <DOCNO>kompas031100</DOCNO> <TITLE>Pertanian Tak Menjanjikan Petani Jepara Beralih ke Sektor Industri </TITLE> <AUTHOR>(son)</AUTHOR> <DATE>Jumat, 3 November 2000</DATE> <TEXT> <P>Jepara, Kompas</P> <P>Akibat harga gabah dan hasil pertanian lain tidak pernah sesuai dengan harapan, sementara upah buruh tani rendah, ribuan petani di Kabupaten Jepara, Jawa Tengah (Jateng) beralih ke sektor industri. Bahkan tenaga kerja industri mebel ukir Jepara yang ada saat ini, hampir semuanya berasal dari petani. Secara keseluruhan jumlah petani di Jepara berkisar orang.</p> <P>Tidak hanya itu, lahan pertanian di beberapa tempat terutama di Kota Jepara dan sekitarnya kini mulai terancam berkurang, karena dialihfungsikan menjadi tempat industri mebel ukir. Kondisi ini terjadi sejak lima tahun terakhir, yakni tahun 1995 hingga saat ini.</p> <P>Bupati Jepara Drs Soenarto, didampingi Kepala Kanwil (Kakanwil) Departemen Pertanian (Deptan) Jateng Ir Triyono, mengemukakan ini kepada wartawan yang mengikuti press tour bersama Sekretariat Pengendali Bimbingan Massal (Bimas), Deptan dan Kehutanan, Rabu (1/11) di Jepara.</P> <P>"Bagi sejumlah petani Jepara, sektor pertanian kini tidak lagi menjanjikan. Mereka kini lebih memilih bekerja di sektor industri mebel ketimbang menjadi petani. Apalagi sejak krisis ekonomi, ekspor mebel di Jepara meningkat," jelas Soenarto.</P> <P>Selama ini, kata Soenarto, produksi pertanian terutama padi selalu mengecewakan. Bahkan, antara biaya dan tenaga yang dikeluarkan petani dengan hasil yang diperoleh, selalu saja tidak sebanding. "Biaya yang dikeluarkan petani mulai dari tenaga kerja, bibit, pupuk dan obat-obatan terlalu besar, sementara ketika panen nilai jualnya rendah. Gabah kering panen (GKP) misalnya, tidak pernah lebih dari Rp 800 per kilogram atau jauh dari harga patokan pemerintah," katanya.</p> <P>Oleh karena itu, perlahan-lahan minat petani beralih bekerja di sektor industri. Apalagi, beberapa tahun terakhir terutama saat krisis ekonomi berlangsung, industri mebel ukir Jepara menjadi andalan ekspor Jateng. "Saat ini Jepara memiliki pengusaha mebel, 200 di antaranya eksportir. Ini menyebabkan, banyak tenaga kerja di sektor agraris ditarik ke sektor industri," tandasnya.</p> <P>Diakuinya, dorongan petani beralih ke sektor industri cukup besar. Sebab, bekerja di sektor pertanian membutuhkan waktu, tenaga dan biaya yang cukup besar, hasilnya pun tidak bisa diprediksi. Bekerja di sektor industri, hasilnya bisa dinikmati dalam waktu tidak terlalu panjang. Dia mencontohkan, untuk mengampelas (menghaluskan) mebel saja, sehari mendapat bayaran Rp per orang.</p> <P>Krida Pertanian</P> <P>Mengatasi persoalan ini, Soenarto menyatakan, sejak tahun 1997 pemerintah Jepara melaksanakan Gerakan Krida Pertanian. Salah satu gebrakan yang dilakukan adalah pencanangan gerakan pisangisasi (penanaman tananan pisang) di seluruh Jepara.</P> <P>"Saat ini Jepara sudah menghasilkan pisang, termasuk jenis chavendis. Kini sedang dipikirkan pemasarannya," katanya.</p> <P>Tekad Pemda Jepara menggerakkan sektor pertanian di Jepara didukung Satpel Bimas Deptan. "Tugas Satpel Bimas menggerakkan sektor pertanian di Jepara cukup berat karena pergeseran struktur ekonomi dari agrobisnis ke industri," jelas Soenarto.</P> <P>Sedangkan untuk mencegah supaya luas lahan pertanian tidak semakin banyak dialihfungsikan ke sektor industri, Bupati Jepara menginstruksikan pejabat terkait agar menyeleksi ketat izin pembangunan kawasan industri. "Selain proses per</p> <P>izinannya dipersulit, harus ada uji kelayakan," tandasnya.</p> </TEXT> </DOC>

19 11 Lampiran 2 Gugus kueri dan jawaban untuk dokumen pertanian Kueri nilai jual komoditas rendah persediaan padi memadai sawah kering kekurangan air Gugus Jawaban balipost030608, BisnisIndonesia , gatra030408, indosiar071103, indosiar , indosiar240604, indosiar300304, indosiar , jurnalhorti113, kompas , kompas031100, kompas101004, kompas161000, kompas171002, kompas200803, kompas240803, kompas250901, kompas , kompas , kompas , mediaindonesia060803, mediaindonesia170303, mediaindonesia250304, mediaindonesia310503, okezone , panturanews220611, pertaniansehat , pertaniansehat , pikiranrakyat , pikiranrakyat240404, pikiranrakyat300604, poskota , republika020804, republika , republika060503, republika , republika , republika140503, republika , republika , republika , republika , situshijau15, situshijau , situshijau280203, situshijau , situshijau , situshijau , suarakarya , suarakarya , suaramerdeka , suaramerdeka290303, suarapembaruan110903, suarapembaruan antarajawabarat211211, beritasore080711, bisnis_jabar191211, bisnisindonesia140911, deptan , eksposnews161211, gatra161711, gatra190902, gatra , gatra230408, gatra230802, globalnews190911, harian_aceh291011, incestordaily310711, indosiar221003, indosiar240703, kbrh211111, kompas160704, kompas221011, kompas260711, korankaltim260811, malukunews090811, mediaindonesia231111, menkokesra71211, okezone080711, okezone130711, okezone31701, poskota , radarbangka040811, republika061102, republika , republika , republika , republika , sinartani1075, suaramerdeka090911, suaramerdeka170602, tempointeraktif , tempointeraktif , tribunnews300711, vivanews122111, vivanews deptan , gatra060907, gatra070203, gatra190802, gatra210704, gatra270709, gatra301002, gatra , gatra310709, indosiar010903, indosiar040903, indosiar170603, indosiar180304, indosiar220503, indosiar240703, indosiar , indosiar , indosiar310504, kompas030704, korantempo3, mediaindonesia , mediaindonesia110703, mediaindonesia160603, mediaindonesia210709, mediaindonesia240503, mediaindonesia300909, mediaindonesia310503, okezone , okezone , okezone , okezone , okezone , okezone , okezone , radarbogor050608, radarbogor , republika , republika , republika , republika , republika , republika200603, republika , republika230903, republika270503, republika , republika , suarakarya , suarakarya , suarakarya , suaramerdeka130602, suaramerdeka190903, suaramerdeka290901, suarapembaruan110903, suarapembaruan190809, suarapembaruan , suarapembaruan , tempointeraktif

20 12 Lanjutan Kueri upaya peningkatan produksi pertanian produk asing murah produksi pertanian menurun Gugus Jawaban deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , gatra050508, gatra060206, gatra080102, gatra121108, gatra200103, gatra220604, gatra240203, gatra260408, indosiar030304, indosiar , indosiar180304, jurnalhorti210, jurnal , jurnal , jurnalhorti1, jurnalhorti87, kompas031100, kompas160704, kompas200802, kompas210502, kompas230209, kompas240103, kompas240302, kompas280502, kompas , kompas310703, kompas311203, kompas , mediaindonesia020809, mediaindonesia021209, mediaindonesia080210, mediaindonesia091109, mediaindonesia , mediaindonesia120609, mediaindonesia , mediaindonesia190210, mediaindonesia210210, mediaindonesia270309, mediaindonesia270809, okezone , okezone , okezone , pertaniansehat , pertaniansehat , pertaniansehat , republika , republika040303, republika050803, republika050903, republika , republika , republika , republika , republika100902, republika , republika , republika , republika , republika140703, republika150703, republika150903, republika151202, republika , republika , republika , republika , republika230903, republika , republika241203, republika , republika260803, republika , republika301002, republika , republika , republika , situshijau , situshijau070503, situshijau , situshijau , situshijau , situshijau , situshijau , situshijau no, suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka071102, suaramerdeka120104, suaramerdeka190903, suarapembaruan130103, suarapembaruan140303, suarapembaruan220802, suarapembaruan , surabayapost020210, surabayapost070110, tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , wartapenelitian analisdaiy211011, indosiar , kompas100702, kompas101002, kompas131211, kompas170104, kompas180502, kompas250901, kompas , kompas280602, lampungpost201011, mediaindonesia060803, mediaindonesia170303, okezone210111, poskota , republika060503, suaramerdeka130104, suarapembaruan100903, suarapembaruan110903, tempo deptan , gatra010307, gatra030203, gatra , gatra180103, gatra220802, gatra , gatra240203, indosiar010504, indosiar010803, indosiar270504, kompas030403, kompas050303, kompas060503, kompas120102, kompas170402, kompas171002, kompas180303, kompas211211, kompas240103, kompas260902, kompas , kompas270401, kompas , mediaindonesia050709, mediaindonesia090409, mediaindonesia , mediaindonesia281109, mediaindonesia300909, okezone , pikiranrakyat , pikiranrakyat , pikiranrakyat , poskota , republika , republika , republika , republika , republika , republika201102, republika , republika241203, republika281202, situshijau , tempointeraktif , situshijau , situshijau , situshijau280203, vivanews122111, suarakarya , suaramerdeka290901, suarapembaruan290803, surabayapost020310,

21 13 Lanjutan Kueri produksi pertanian menurun petani sulit mendapatkan humus sawah rusak berat mutu hasil pertanian rendah Gugus Jawaban tempointeraktif , tempointeraktif banjarmasinpost181211, gatra230609, harianhaluan291111, indosiar010704, indosiar060204, indosiar , indosiar200104, indosiar290604, kompas210504, kompas211211, kompas , liputan6_100611, mamorema01, mediaindonesia211211, metrotvnews221111, okezone , pertaniansehat , pertaniansehat , pikiranrakyat , republika050604, republika , republika , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka161101, surya121111, tribunnews51011, waspada gatra030706, gatra040108, gatra060907, gatra070203, gatra120210, gatra190802, gatra190902, gatra , gatra260803, gatra301002, gatra , indosiar010504, indosiar031203, indosiar040903, indosiar , indosiar130104, indosiar130504, indosiar160304, indosiar180304, indosiar240703, indosiar , kompas170504, kompas260902, mediaindonesia030603, mediaindonesia050204, mediaindonesia , mediaindonesia110309, mediaindonesia110703, mediaindonesia130210, mediaindonesia , mediaindonesia140203, mediaindonesia160603, mediaindonesia170209, mediaindonesia190503, okezone , okezone , okezone , okezone , okezone , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , radarbogor050608, republika , republika , republika , republika , republika , republika200603, republika230903, republika , republika , situshijau , situshijau , suarakarya , suarakarya , suaramerdeka131001, suaramerdeka190903, suarapembaruan120104, suarapembaruan , suarapembaruan , surabayapost100210, tempointeraktif , tempointeraktif Deptan , gatra011102, gatra180103, indosiar , jurnal , jurnalhorti103, jurnalhorti113, kompas050303, kompas100702, kompas101002, kompas161000, kompas180502, kompas220801, kompas290404, mediaindonesia030104, mediaindonesia170403, pikiranrakyat , republika , republika , republika , republika , situshijau01, situshijau , situshijau , situshijau , situshijau , situshijau15, situshijau , situshijau , situshijau , suarakarya , suaramerdeka , suarapembaruan100903

22 14 Lanjutan Kueri produksi pertanian meningkat kesejahteraan petani rendah wereng serang lahan pertanian bidang pertanian belum berkembang Gugus Jawaban deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , detikfinance , gatra010307, gatra100509, gatra121108, gatra230802, gatra310807, indosiar , kompas060503, kompas150104, kompas160704, kompas180701, mediaindonesia020809, mediaindonesia080210, mediaindonesia210210, mediaindonesia250809, mediaindonesia291209, pikiranrakyat , pikiranrakyat , republika080703, republika , republika , republika , republika , republika , republika281202, republika , suarakarya , surabayapost020310, surabayapost070110, surabayapost110210, surabayapost250110, tempointeraktif balipost030608, gatra230109, jurnal , kompas030403, kompas031003, kompas110504, kompas120204, kompas161000, kompas170903, kompas220399, kompas240803, kompas290404, mediaindonesia120209, panturanews220611, pertaniansehat , poskota270411, republika100804, republika , sinartani291211, suarakarya , suarakarya , suarapembaruan100903, suarapembaruan190809, tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif balipost290708, gatra011200, gatra030203, gatra , gatra120210, gatra190902, gatra , indosiar010504, indosiar010803, indosiar070504, indosiar , indosiar240604, indosiar270504, indosiar310304, kompas170903, kompas200803, kompas211211, mediaindonesia020310, mediaindonesia030603, mediaindonesia050204, mediaindonesia050309, mediaindonesia , mediaindonesia090409, mediaindonesia110309, mediaindonesia120110, mediaindonesia131209, mediaindonesia , mediaindonesia190503, mediaindonesia221209, mediaindonesia240110, okezone , okezone , okezone , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , radarbogor050608, republika , republika , republika , republika , republika , republika , republika , republika , situshijau , situshijau , situshijau , situshijau14, situshijau , suarakarya , suarakarya , suaramerdeka131001, suarapembaruan120104, surabayapost100210, surabayapost231209, tempointeraktif , tempointeraktif balipost030608, balipost050908, balipost301208, gatra230109, gatra290903, jurnal , kompas030403, kompas031003, kompas050303, kompas091003, kompas120204, kompas , kompas170104, kompas171002, kompas180504, kompas220399, kompas240803, kompas , mediaindonesia , mediaindonesia100203, mediaindonesia180504, mediaindonesia250803, metrotvnews , okezone280111, poskota270411, republika , republika , republika , republika , sinartani291211, suarakarya , suarakarya , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif

23 15 Lanjutan Kueri angsuran pertanian sedikit dana bidang pertanian rendah permintaan humus naik Gugus Jawaban ahmadheryawan251211, antaranews031110, beritadaerah081111, bisnisindonesia101211, bisnisjabar080911, detik100211, inilahjabar221211, kabarbisnis291211, kompas110201, kompas120204, kompas140209, kompas170911, kompas , korankaltim001, medanbisnis060911, mediaindonesia170712, mediaindonesia260711, metrotvnews181211, pikiranrakyat161211, republika110504, republika , seputarsulawesi081111, suaramerdeka090707, tempointeraktif , theglobejurnal290709, tribunnews151211, ujungpadangekspres091111, wartakota0001, wsp_agro01, yiela antaranews211111, banjarmasinpost180711, bataviase070710, gatra131011, kompas040111, kompas210502, lampungpost081211, mediaindonesia090903, metrotvnews261211, neraca180811, okezone280111, panturanews220611, partaimerdeka01, poskota270411, prakarsa_rakyat190811, republika110504, republika , republika , seputarindonesia051011, seputarindonesia271211, sinartani00002, sinartani291211, sinartani291211, tempo251211, tribunnews061211, waspada bataviase200511, gatra230609, kbr68h041211, kompas151211, kompas210504, kompas211211, kompas230209, kompas , lampungpost121111, metrotvnews221111, pertaniansehat , pikiranrakyat , pikiranrakyat , pikiranrakyat100310, pikiranrakyat , pikiranrakyat , poskota190511, radarmadiun01, rakyatmerdeka180711, republika , republika201102, suarakarya , suarakarya , suarakarya

24 16 Lampiran 3 Nilai AVP sistem pada berbagai jumlah dokumen, passages, dan konsep teratas Top Top Top document passages concept avp ,5458 0,2813 0,1251 0,0739 0,0349 0,0211 0, , ,5396 0,3304 0,2476 0,1826 0,1361 0,1042 0,0742 0,0287 0, , ,535 0,3673 0,246 0,1919 0,1404 0,1024 0,077 0,0287 0, , ,5361 0,3638 0,2357 0,192 0,1389 0,103 0,0774 0,0287 0, , ,5777 0,3673 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5351 0,3023 0,2366 0,1775 0,1359 0,1045 0,0746 0,0287 0, , ,5767 0,3399 0,2443 0,1911 0,1403 0,1025 0,077 0,0287 0, , ,5408 0,3513 0,236 0,1924 0,1393 0,1035 0,0777 0,0287 0, , ,5432 0,3556 0,2373 0,1929 0,1395 0,1035 0,0777 0,0287 0, , ,5727 0,3323 0,2375 0,1929 0,1395 0,1035 0,0777 0,0287 0, , ,5763 0,3408 0,2393 0,1931 0,1395 0,1035 0,0777 0,0287 0, , ,5763 0,3408 0,2393 0,1931 0,1395 0,1035 0,0777 0,0287 0, , ,5351 0,3026 0,2366 0,1775 0,1359 0,1045 0,0746 0,0287 0, , ,5719 0,3447 0,2437 0,19 0,1417 0,1028 0,077 0,0287 0, , ,5602 0,3452 0,235 0,1917 0,1393 0,1034 0,0777 0,0287 0, , ,5665 0,352 0,2358 0,1925 0,1394 0,1035 0,0777 0,0287 0, , ,5527 0,3406 0,2364 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5527 0,3421 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, ,1555

25 17 Lanjutan Top Top Top document passages concept avp ,564 0,3371 0,2425 0,1895 0,1426 0,1086 0,0772 0,0287 0, , ,5574 0,3447 0,2349 0,1917 0,1393 0,1034 0,0777 0,0287 0, , ,57 0,3594 0,2376 0,1928 0,1395 0,1035 0,0777 0,0287 0, , ,5777 0,3408 0,2364 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5134 0,2727 0,2087 0,1753 0,1353 0,1039 0,0743 0,0287 0, , ,5569 0,3016 0,2391 0,1899 0,1411 0,1083 0,0772 0,0287 0, , ,5678 0,3168 0,2349 0,1917 0,1393 0,1034 0,0777 0,0287 0, , ,57 0,3346 0,2376 0,1928 0,1395 0,1035 0,0777 0,0287 0, , ,5763 0,3408 0,2364 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5396 0,3304 0,2476 0,1826 0,1361 0,1042 0,0742 0,0287 0, , ,535 0,3673 0,246 0,1919 0,1404 0,1024 0,077 0,0287 0, , ,5361 0,3638 0,2357 0,192 0,1389 0,103 0,0774 0,0287 0, , ,5777 0,3673 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, , ,5777 0,3423 0,2366 0,1928 0,1393 0,1034 0,0777 0,0287 0, ,1555

DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA

DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j 3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN 1 EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

beberapa tag-tag lain yang lebih spesifik di dalamnya.

beberapa tag-tag lain yang lebih spesifik di dalamnya. metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista

Lebih terperinci

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya. beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini

Lebih terperinci

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

Lebih terperinci

HASIL DAN PEMBAHASAN. sim(, )=

HASIL DAN PEMBAHASAN. sim(, )= 4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i

Lebih terperinci

POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH

POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Lampiran 1 Antarmuka implementasi

Lampiran 1 Antarmuka implementasi LAMPIRAN 16 Lampiran 1 Antarmuka implementasi 17 17 Lampiran 2 Contoh dokumen XML dalam koleksi pengujian indosiar050704-001 SumKa Presiden Megawati Lakukan

Lebih terperinci

STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH

STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium

Lebih terperinci

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009

Lebih terperinci

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 1 PERBANDINGAN

Lebih terperinci

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita 6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional

Lebih terperinci

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA Fridolin Febrianto Paiki Universitas Papua, Jl. Gunung Salju, Amban, Manokwari ff.paiki@unipa.ac.id

Lebih terperinci

PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI

PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI

MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA

TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI

PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:

Lebih terperinci

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR

RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR Oleh: Andika Wahyu Agusetyawan G64101007 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :

Lebih terperinci

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract IMPLEMENTASI SISTEM TEMU KEMBALI INFORMASI Studi Kasus: Dokumen Teks Berbahasa Indonesia (IMPLEMENTATION OF INFORMATION RETRIEVAL SYSTEM Case Study: Text Document in Indonesian Language) Bernadus Very

Lebih terperinci

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA Aida Indriani ) ) Teknik Informatika STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso 8, Tarakan 77 Email

Lebih terperinci

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI 18 PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI Karter D. Putung, Arie Lumenta, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi Manado, Indonesia. karterputung@gmail.com,

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI

Lebih terperinci

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE Rila Mandala Kelompok Keahlian Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10 Bandung,

Lebih terperinci

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,

Lebih terperinci

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut

Lebih terperinci

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING

Lebih terperinci

TEMU KEMBALI INFORMASI

TEMU KEMBALI INFORMASI JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 1 Identitas Mata Kuliah Nama Mata Kuliah : Temu Kembali Informasi (TKI) Information Retrieval (IR) Kode Mata Kuliah : KOM431 Koordinator : Julio

Lebih terperinci

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &

Lebih terperinci

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,

Lebih terperinci

HASIL DAN PEMBAHASAN. Praproses

HASIL DAN PEMBAHASAN. Praproses 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk

Lebih terperinci

HASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan.

HASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan. 4 dan Thelen (2000) karena disesuaikan terhadap kaidah bahasa Indonesia. Rule yang dibuat Sianturi (2008) dan digunakan oleh Sanur (2011) memiliki notasi S sebagai sentence atau passage serta Q sebagai

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan

Lebih terperinci

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 XML RETRIEVAL UNTUK DOKUMEN

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada era ini perkembangan teknologi informasi sangat pesat. Hal ini ditandai dengan semakin populernya penggunaan internet dan perangkat lunak komputer sebagai

Lebih terperinci

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami

Lebih terperinci

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA

METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen 6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat

Lebih terperinci

EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G

EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G64103024 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL Susetyo Adi Nugroho () Abstrak: Salah satu metode yang sering digunakan dalam mengukur relevansi dokumen

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem

Lebih terperinci

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya Terhadap Peningkatan Kinerja Image Search Engine Nugroho Herucahyono (13504038) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika,

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

RELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR

RELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR RELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR Julio Adisantoso, Ahmad Ridha, Andika Wahyu Agusetyawan Staf Departemen Ilmu Komputer, Fakultas Matematika

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian

Lebih terperinci

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah 1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari

Lebih terperinci

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document Jurnal Ilmiah Widya Teknik Volume 15 Nomor 2 2016 ISSN 1412-7350 SISTEM PEMEROLEHAN INFORMASI UNDANG-UNDANG DAN KASUS MENGGUNAKAN STRUKTUR DATA INVERTED INDEX DENGAN PEMBOBOTAN TF-IDF Fredes Winda Oktaviani

Lebih terperinci

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks

Lebih terperinci

BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN

BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN 28 BAB 3 PERANCANGAN Pada bab ini akan dijelaskan mengenai rancangan percobaan pada penelitian segmentasi dokumen ini. Pembahasan akan dimulai dengan penjelasan mengenai gambaran umum proses segmentasi

Lebih terperinci

PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI

PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan

Lebih terperinci

2. Ketepatan untuk setiap jawaban.

2. Ketepatan untuk setiap jawaban. dikembalikan sebagai top passage dari kueri pertanyaan yang diberikan. 5. Ekstraksi Jawaban Top passages yang diperoleh dilakukan perhitungan terhadap jarak kata. Entitas yang memiliki jarak terpendek

Lebih terperinci

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Identifikasi Masalah Merumuskan Masalah Study Literatur Perancangan Struktur Menu Interface Analisa

Lebih terperinci

ROCCHIO CLASSIFICATION

ROCCHIO CLASSIFICATION DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi

Lebih terperinci

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer CORPUS DOKUMEN TEKS BAHASA INDONESIA UNTUK PENGUJIAN EFEKTIVITAS TEMU KEMBALI INFORMASI Oleh: Ir. Julio Adisantoso, M.Kom.

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Hendri Priyambowo 1, Yanuar Firdaus A.W. S.T, M.T 2, Siti Sa adah S.T. M.T 3 123 Program Studi S1 Teknik Informatika,

Lebih terperinci

EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA

EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011

Lebih terperinci

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA Oleh: YUDHA PERMADI G64102064 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008

Lebih terperinci

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE Sri Ulinar Romatua N B¹, Yanuar Firdaus A.w.², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Dengan semakin

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.

Lebih terperinci

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka

Lebih terperinci

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL (Studi Kasus Perpustakaan Universitas Udayana) LEMBAR JUDUL KOMPETENSI RPL SKRIPSI NI MADE

Lebih terperinci

APLIKASI PENILAIAN UJIAN ESSAY OTOMATIS MENGGUNAKAN METODE COSINE SIMILARITY. Rahimi Fitri 1, Arifin Noor Asyikin 2

APLIKASI PENILAIAN UJIAN ESSAY OTOMATIS MENGGUNAKAN METODE COSINE SIMILARITY. Rahimi Fitri 1, Arifin Noor Asyikin 2 APLIKASI PENILAIAN UJIAN ESSAY OTOMATIS MENGGUNAKAN METODE COSINE SIMILARITY Rahimi Fitri 1, Arifin Noor Asyikin 2 mahaluddin@yahoo.com (1) Staf Pengajar Jurusan Teknik Elektro Politeknik Negeri Banjarmasin

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015

Lebih terperinci

SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS

SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS Surya Agustian 1, Imelda Sukma Wulandari 2 1,2 Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, UIN

Lebih terperinci

SISTEM INFORMATION RETRIEVAL PENCARIAN KESAMAAN AYAT TERJEMAHAN AL QURAN BERBAHASA INDONESIA DENGAN QUERY EXPANSION DARI TAFSIRNYA

SISTEM INFORMATION RETRIEVAL PENCARIAN KESAMAAN AYAT TERJEMAHAN AL QURAN BERBAHASA INDONESIA DENGAN QUERY EXPANSION DARI TAFSIRNYA SISTEM INFORMATION RETRIEVAL PENCARIAN KESAMAAN AYAT TERJEMAHAN AL QURAN BERBAHASA INDONESIA DENGAN QUERY EXPANSION DARI TAFSIRNYA Broto Poernomo T.P. 1 dan Ir. Gunawan 2 1 Teknik Informtika Sekolah Tinggi

Lebih terperinci

Mengenal Information Retrieval

Mengenal Information Retrieval STBI-2011 Sistem Temu Balik Informasi 2011 Mengenal Information Retrieval Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress.com 2 3 Amazon.com 4 Amazon.com 5 6 7 8 9 Wordpress.com

Lebih terperinci

SISTEM TEMU KEMBALI INFORMASI

SISTEM TEMU KEMBALI INFORMASI SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Dokumen Penyimpanan yang Terorganisasi Database Mahasiswa Database Buku ID Nama Buku Pengarang 001 Information Retrieval Ricardo baeza

Lebih terperinci

EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI

EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci