POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH

Ukuran: px
Mulai penontonan dengan halaman:

Download "POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH"

Transkripsi

1 POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

2

3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Positional Relevance Model untuk Pseudo Relevance Feedback pada Sistem Temu Kembali Berbahasa Indonesia adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Agustus 2013 Sapariansyah NIM G

4 ABSTRAK SAPARIANSYAH. Positional Relevance Model untuk Pseudo Relevance Feedback pada Sistem Temu Kembali Berbahasa Indonesia. Dibimbing oleh SONY HARTONO WIJAYA. Dalam pencarian suatu dokumen, pengguna terkadang sulit untuk menentukan kueri yang tepat dalam menemukan informasi yang relevan. Salah satu cara untuk mengatasi masalah tersebut adalah dengan cara memperbaiki kueri yang digunakan oleh pengguna. Tujuan penelitian ini adalah mengimplementasikan dan menganalisis kinerja penggunaan positional relevance model (PRM) sebagai pseudo relevance feedback (PRF) untuk meningkatkan relevansi hasil pencarian dokumen pada sistem temu kembali. Penelitian ini menggunakan metode PRM berdasarkan pada aspek kedekatan dan posisi suatu kata di dalam dokumen. Evaluasi dilakukan dengan menghitung recall dan precision. Hasil pengujian dan analisis sistem terlihat bahwa terjadi peningkatan precision sebesar 4.38% dan recall sebesar 11%. Kata kunci: feedback, positional relevance model, pseudo relevance feedback ABSTRACT SAPARIANSYAH. Positional Relevance Model for Pseudo Relevance Feedback on Indonesian Language Retrieval System. Supervised by SONY HARTONO WIJAYA. In document retrieval, it is difficult to user to choose a proper query in order to get relevant information. This problem can be solved by reformulating the query. This research tried to improve the relevance of retrieval result by implementing positional relevance model (PRM) for pseudo relevance feedback (PRF) based on the proximity aspect and the position of a word in the document. The evaluation was conducted by calculating recall and precision. The results show that an 4.38% increase in precision and an 11% increase in recall have been obtained. Keywords: feedback, positional relevance model, pseudo relevance feedback

5 POSITIONAL RELEVANCE MODEL UNTUK PSEUDO RELEVANCE FEEDBACK PADA SISTEM TEMU KEMBALI BERBAHASA INDONESIA SAPARIANSYAH Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

6 Penguji: 1 Ir Julio Adisantoso, MKom 2 Aziz Kustiyo, SSi MKom

7 Judul Skripsi : Positional Relevance Model untuk Pseudo Relevance Feedback pada Sistem Temu Kembali Berbahasa Indonesia Nama : Sapariansyah NIM : G Disetujui oleh Sony Hartono Wijaya, SKom MKom Pembimbing Diketahui oleh Dr Ir Agus Buono, MSi MKom Ketua Departemen Tanggal Lulus:

8 PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta ala atas segala karunia-nya sehingga penulis dapat menyelesaikan tugas akhir ini. Shalawat serta salam selalu tercurah kepada Nabi Muhammad Shallallahu alaihi wa sallam beserta para sahabatnya. Judul tugas akhir yang dipilih dalam penelitian ini adalah Positional Relevance Model untuk Pseudo Relevance Feedback pada Sistem Temu Kembali Berbahasa Indonesia. Penulis menyadari bahwa penelitian ini tidak akan selesai tanpa bantuan beberapa pihak. Penulis ingin menyampaikan ucapan terima kasih kepada: 1 Orang tua tercinta, Bapak Salim dan Ibu Sugiyem, yang selalu memberikan doa, nasihat, semangat, dukungan, dan kasih sayang yang luar biasa kepada penulis sehingga dapat menyelesaikan tugas akhir ini, 2 Bapak Sony Hartono Wijaya, SKom MKom selaku dosen pembimbing. Terima kasih atas kesabaran, arahan, bimbingan serta dukungan dalam penyelesaian tugas akhir ini, 3 Bapak Ir Julio Adisantoso, MKom dan Bapak Aziz Kustiyo, SSi MKom selaku dosen penguji yang telah memberikan masukan terhadap tugas akhir yang penulis kerjakan, 4 Sahabat-sahabat kontrakan Berly s House. Terima kasih atas kebersamaannya, semangat, dan dukungan. Semoga kita dapat bertemu kembali menjadi orangorang yang sukses, 5 Teman-teman satu bimbingan Ozi Priawadi, Fadilla Andre Mulyanto, M Ginanjar Ramadhan, dan Yuzar Marsyah serta Ilkomerz46 atas kebersamaan, bantuan, dukungan, dan semangat baik dalam masa kuliah maupun dalam menyelesaikan tugas akhir ini, dan 6 Seluruh staf Departemen Ilmu Komputer IPB yang telah banyak membantu baik selama penelitian maupun perkuliahan. Penulis menyadari bahwa dalam penulisan tugas akhir ini masih terdapat banyak kekurangan dan kelemahan dalam berbagai hal karena keterbatasan kemampuan penulis. Penulis berharap adanya saran ataupun kritik yang bersifat membangun dari pembaca demi kesempurnaan tugas akhir ini. Semoga tugas akhir ini bermanfaat. Bogor, Agustus 2013 Sapariansyah

9 DAFTAR ISI DAFTAR TABEL vii DAFTAR GAMBAR vii DAFTAR LAMPIRAN vii PENDAHULUAN 1 Latar Belakang 1 Perumusan Masalah 1 Tujuan Penelitian 1 Manfaat Penelitian 2 Ruang Lingkup Penelitian 2 METODE 2 Koleksi Dokumen/Korpus 3 Indexing 3 Temu Kembali Awal 4 Dokumen Peringkat n Teratas 4 Praproses PRM 4 Penghitungan PRM 4 Formulasi Kueri Baru 6 Evaluasi 6 Lingkungan Implementasi 7 HASIL DAN PEMBAHASAN 7 Koleksi Dokumen/korpus 7 Indexing 8 Temu Kembali Awal 8 Dokumen Peringkat n Teratas 9 Praproses PRM 9 Perhitungan PRM 9 Formulasi Kueri Baru 10 Evaluasi 10 SIMPULAN DAN SARAN 14 Simpulan 14

10 Saran 14 DAFTAR PUSTAKA 15 LAMPIRAN 16

11 DAFTAR TABEL 1 Pengaruh jumlah pengambilan dokumen n teratas terhadap nilai AVP pada sistem menggunakan PRF (PRM) 11 2 Pengaruh parameter terhadap nilai AVP pada sistem temu kembali menggunakan PRF (PRM) 11 3 Pengaruh perluasan kueri terhadap nilai AVP pada sistem temu kembali menggunakan PRF (PRM) 12 4 Pengaruh parameter terhadap nilai AVP pada sistem temu kembali menggunakan PRM 13 DAFTAR GAMBAR 1 Metodologi penelitian 2 2 Contoh dokumen XML 3 3 Konfigurasi indexing pada Sphinx 3 4 Hasil indexing menggunakan Sphinx. Jumlah dokumen yang diindeks berjumlah 2095 dokumen dengan kapasitas 6.3 MB 8 5 Contoh stopwords disusun secara alfabetis 8 6 Contoh 5 dokumen teratas yang disimpan ke dalam basis data 8 7 Contoh array token yang sudah dilakukan tahapan praproses PRM 9 8 Contoh array dari term unik yang diurutkan secara alfabetis 9 9 Contoh isi fail hasil penghitungan PRM yang diurutkan berdasarkan nilainya secara menurun Grafik R-P untuk temu kembali menggunakan PRF (PRM) dan tanpa PRF 13 DAFTAR LAMPIRAN 1 Contoh dokumen pertanian 17 2 Daftar stopword 18 3 Kandidat term ekspansi (kiri ke kanan, nilai PRM menurun, = 5, = 0.8, 1 feedback) 21 4 Gugus kueri dan jawaban pada dokumen pertanian 22 5 Tabel hasil pengujian analisis kinerja sistem yang optimal menggunakan PRF (PRM). Paramater = 5, jumlah dokumen feedback = 1, parameter = 0.8, dan penambahan term sebanyak 1 term 28 6 Tabel hasil pengujian analisis kinerja sistem tanpa menggunakan PRF 29 7 Tabel perbandingan nilai AVP sistem tanpa menggunakan PRM dan menggunakan PRM* untuk masing-masing kueri pengujian 30 8 Antarmuka implementasi 31

12

13 PENDAHULUAN Latar Belakang Masalah utama pencarian suatu dokumen di dalam koleksi dokumen digital yang sangat besar adalah pengguna tidak memiliki pengetahuan mengenai koleksi dokumen. Hal ini menyebabkan pengguna sulit memformulasikan informasi yang dicari dalam bentuk kueri. Selain itu, pengguna juga membutuhkan waktu yang cukup lama untuk memformulasikan ulang kueri sebelumnya untuk menemukembalikan dokumen yang relevan (Baeza-Yates dan Ribeiro-Neto 1999). Dalam temu kembali informasi, salah satu pendekatan untuk mengatasi masalah ini yaitu dengan menggunakan metode lokal (Manning et al. 2008). Metode lokal merupakan teknik untuk menyesuaikan kueri terhadap dokumen yang berasal dari inisialisasi awal kueri sebelumnya. Salah satu metode lokal yang digunakan adalah pseudo relevance feedback (PRF). PRF menggunakan dokumen n teratas saat inisialisasi awal yang diasumsikan relevan untuk membentuk kueri yang baru. Pengguna dapat memperbaiki kueri awal tanpa memperluas interaksi dengan sistem temu kembali. Berbeda dengan relevance feedback yang mengharuskan pengguna untuk melakukan interaksi lebih banyak terhadap sistem temu kembali, terutama saat pemilihan dokumen yang dianggap relevan. Penelitian terkait sebelumnya yang menggunakan metode secara lokal yaitu penelitian yang dilakukan oleh Anbiana (2009). Penelitian tersebut menggunakan teknik pseudo relevance feedback dengan menggunakan segmentasi dokumen. Kinerja sistem yang dihasilkan mengalami penurunan nilai AVP sebesar Hal ini disebabkan oleh terambilnya dokumen yang tidak relevan sehingga kueri perluasan bukan merupakan kata penciri dokumen. Penelitian terkait yang lain dilakukan oleh Lv dan Zhai (2010) adalah menggunakan positional relevance model (PRM) untuk teknik PRF pada dokumen berbahasa Inggris. Pengujian penelitian ini menunjukkan bahwa penggunaan PRM untuk PRF dapat meningkatkan hasil pencarian dalam temu kembali dokumen dibandingkan tanpa menggunakan PRM. Oleh karena itu, penelitian ini menggunakan PRM pada teknik PRF untuk diterapkan pada dokumen teks berbahasa Indonesia. Perumusan Masalah Adapun yang menjadi rumusan masalah dalam penelitian ini adalah apakah penggunaan PRM pada PRF dapat diimplementasikan untuk meningkatkan relevansi hasil pencarian sistem temu kembali pada dokumen berbahasa Indonesia. Tujuan Penelitian Tujuan penelitian ini adalah mengimplementasikan dan menganalisis kinerja penggunaan positional relevance model untuk meningkatkan relevansi hasil pencarian pada sistem temu kembali informasi berbahasa Indonesia.

14 2 Manfaat Penelitian Penelitian ini diharapkan dapat meningkatkan hasil pencarian dokumen yang relevan pada sistem pencari (search engine). Di samping itu, peningkatan relevansi dokumen akan memberikan informasi yang akurat kepada para pengguna mesin pencari. Ruang Lingkup Penelitian Dokumen yang digunakan adalah dokumen teks berbahasa Indonesia dengan format XML. Dokumen yang diteliti berisi tentang pertanian. Iterasi yang dilakukan dalam proses PRF pada penelitian ini yaitu satu kali dan proses indexing tanpa menggunakan stemming. METODE Penelitian ini dilakukan dalam beberapa tahapan, yaitu: pengumpulan dokumen/korpus, indexing, temu kembali awal, pengambilan dokumen n teratas praproses PRM, perhitungan PRM, formulasi kueri baru, dan evaluasi hasil temu kembali (Gambar 1). Koleksi dokumen/korpus Indexing Kueri Temu kembali awal Formulasi kueri baru Evaluasi Tidak PRF Ya Dokumen peringkat n teratas Praproses PRM Gambar 1 Metodologi penelitian Perhitungan PRM

15 3 Koleksi Dokumen/Korpus Koleksi dokumen yang digunakan dalam penelitian ini adalah dokumendokumen teks berbahasa Indonesia. Dokumen tersebut merupakan kumpulan berita-berita di bidang pertanian yang berasal dari surat kabar online. Dokumen tersebut tersedia di Laboratorium Temu Kembali Informasi, Departemen Ilmu Komputer FMIPA IPB. Dokumen yang digunakan sudah tersegmentasi dalam format XML (Gambar 2). <DOC> <DOCNO>...</DOCNO> <TITLE>...</TITLE> <AUTHOR>...</AUTHOR> <TEXT>...</TEXT> </DOC> Gambar 2 Contoh dokumen XML Indexing Tahapan pengindeksan terdiri atas tokenisasi dan pembuangan stopword, tanpa proses stemming. Tokenisasi merupakan proses pembentukan token yang berasal dari dokumen. Token merupakan serangkaian karakter di dalam dokumen yang dikelompokkan secara bersamaan sebagai unit semantik (Manning et al. 2008). Tahap selanjutnya adalah pembuangan stopword. Stopword merupakan kata yang memiliki frekuensi kemunculan paling tinggi di dalam koleksi dokumen (Manning et al. 2008). Kedua tahapan tersebut diimplementasikan dengan menggunakan Sphinx. Pengaturan parameter indexing dapat dilihat pada Gambar 3. index prm { source path } docinfo min_word_len = 3 charset_type = utf-8 enable_star = 0 = srcxml = c:/sphinx_xml/data/prm = extern html_strip = 0 stopwords = c:/sphinx_xml/stopword.txt Gambar 3 Konfigurasi indexing pada Sphinx

16 4 Temu Kembali Awal Langkah selanjutnya adalah pencarian dokumen untuk suatu kueri tertentu. Sebelum dilakukan proses pencarian, ada beberapa konfigurasi yang harus dilakukan pada Sphinx antara lain: 1 SetMatchMode: ekspresi pencocokan kueri. Penelitian ini menggunakan SPH_MATCH_ANY yaitu minimal satu kata pada kueri terdapat di dalam dokumen hasil pencarian, 2 SetRankingMode: metode pembobotan (ranking) dokumen yang telah ditemu-kembalikan. Nilai bobot diurut secara menaik. Penelitian ini menggunakan SPH_RANK_BM25 dalam proses pembobotan dokumen. Dokumen hasil temu kembali dari Sphinx kemudian disimpan dalam basis data untuk dijadikan masukan pada pembuatan PRM. Dokumen Peringkat n Teratas Hasil temu kembali dari Sphinx diambil dokumen n teratas untuk dilakukan tahapan praproses PRM. Jumlah dokumen teratas yang diambil di antaranya 1, 2, 3, 4, dan 5 dokumen. Selanjutnya, dokumen ini akan disebut dokumen feedback. Praproses PRM Dokumen n teratas (dokumen feedback) dilakukan tahapan tokenisasi sebagai berikut: penghapusan tanda baca dan simbol (., ~`!@#$%^&*()+-=[]{};:"< > /? \ ''), serta angka (0-9), setiap term diubah menjadi cetak kecil, tokenisasi, pemilihan kandidat term dengan dibatasi 3 karakter, pembuangan stopword pada kandidat term, dan pembentukan term unik (vocabulary) untuk seluruh dokumen feedback. Penghitungan PRM Term unik yang berasal pada tahapan praproses PRM kemudian dihitung nilai PRM-nya. Setiap term dihitung peluang bersamanya terhadap suatu kueri tertentu untuk seluruh dokumen feedback. PRM adalah suatu teknik yang menggabungkan informasi posisi dan kedekatan suatu term di dalam dokumen, sehingga term yang posisinya dekat dengan kueri di dalam dokumen feedback memiliki bobot yang lebih tinggi dibandingkan dengan term yang jauh posisinya dengan kueri. Persamaan untuk menghitung PRM adalah sebagai berikut (Lv dan Zhai 2010):

17 5 ( ), (, ), i, i (1) i dengan: D : dokumen ke-n D : jumlah term pada dokumen ke-n w : term unik Q : kueri i : posisi term ke-i di dalam suatu dokumen F : jumlah dokumen feedback P(w D,i) merupakan peluang term w pada posisi term ke-i di dalam dokumen D. P(w D,i) bernilai sama dengan 1, jika term w terdapat di posisi ke-i di dalam dokumen D, selainnya bernilai 0. Sedangkan, P(Q D,i) adalah peluang kueri Q pada posisi term ke-i pada dokumen D. Berikut perhitungan untuk P(Q D,i): (, i) [( ), i ( )] (2) dengan: : parameter smoothing [0, 1] q j : kueri ke-j m : panjang kueri C : model bahasa koleksi. Metode smoothing yang digunakan adalah Jelinek-Mercer (Lv dan Zhai 2010). Penggunaan metode smoothing untuk mengatasi peluang term yang bernilai 0. P(q j C) merupakan peluang term kueri ke-j di dalam koleksi dokumen. Perhitungan P(q j C) dilakukan dengan cara membagi jumlah frekuensi term kueri ke-j di dalam koleksi dokumen dengan jumlah token yang terdapat di koleksi dokumen. P(q j D,i) dihitung menggunakan kernel Gaussian. Persamaan untuk menghitung P(q j D,i) adalah: (, )e ( i ) (, i) c(q k, j) bernilai 1 jika term q k terdapat pada posisi j di dalam dokumen, selainnya bernilai 0 (Lv dan Zhai 2009). Lebar jangkauan pada kernel Gaussian dipengaruhi oleh nilai. Semakin besar nilai, maka jangkauan daerah yang diperhitungkan terhadap titik pusat (posisi kueri di dalam dokumen) juga semakin besar. Sebaliknya, semakin kecil nilai, maka jangkauan daerah yang diperhitungkan terhadap titik pusat menjadi semakin kecil. Sehingga posisi term yang berada di luar jangkauan memiliki nilai peluang yang kecil dibandingkan nilai peluang yang berada di dalam daerah jangkauan tersebut. Jika nilai mendekati tak hingga, maka aspek jarak dan kedekatan term diabaikan (Lv dan Zhai 2010). Hal ini mengakibatkan nilai P(q k D, i) bernilai 0.

18 6 Formulasi Kueri Baru Hasil akhir dari PRM adalah nilai peluang untuk tiap term yang diurutkan secara menurun. Term yang ditambahkan ke kueri awal adalah term yang berada pada urutan teratas dan bukan merupakan term yang terdapat pada kueri awal. Semakin besar nilai peluang sebuah term, maka term tersebut semakin dekat dengan kueri awal. Hasil kueri ekspansi tersebut kemudian digunakan dalam proses temu kembali selanjutnya. Formulasi kueri baru bertujuan untuk memperbaiki kueri yang diberikan pengguna sehingga menemukembalikan dokumen-dokumen relevan yang lebih baik. Evaluasi Tahap akhir proses temu kembali dilakukan evaluasi melalui pengukuran recall-precision untuk mengukur tingkat keefektifan sistem-temu kembali. Recall adalah fraksi dokumen-dokumen relevan yang ditemu-kembalikan, sedangkan precision adalah fraksi dari dokumen yang berhasil ditemu-kembalikan dan dianggap relevan (Manning et al. 2008). Persamaan untuk menghitung recall dan precision: 1 Recall 2 Precision dengan: tp : true positives merupakan jumlah dokumen yang ditemu-kembalikan dan relevan, fp : false positives merupakan jumlah dokumen yang ditemu-kembalikan dan tidak relevan, dan fn : false negatives merupakan jumlah dokumen yang tidak ditemu-kembalikan dan relevan. Hasil penghitungan recall dan precision untuk tiap recall dihitung menggunakan interpolasi maksimum pada setiap titik recall 0.0 hingga 1.0. Baeza-Yates dan Ribeiro-Neto (1999) menyatakan bahwa evaluasi pada sistem temu kembali biasanya menggunakan beberapa kueri, sehingga untuk kueri yang berbeda akan menghasilkan nilai recall dan precision yang berbeda pula. Average Precision (AVP) digunakan untuk mengevaluasi kinerja sistem temu-kembali untuk seluruh kueri yang diuji dengan menghitung rata-rata nilai precision pada tiap level recall yang dirumuskan sebagai berikut: i dengan: (r) : nilai rata-rata precision pada level recall r, N q : jumlah kueri yang diuji, P i (r) : nilai precision pada level recall r untuk kueri ke-i. i

19 Evaluasi dilakukan untuk mengetahui pengaruh jumlah pengambilan dokumen peringkat n teratas, pengaruh parameter terhadap hasil temu kembali, pengaruh penambahan term pada kueri awal terhadap hasil temu kembali, pengaruh nilai terhadap hasil temu kembali, dan kinerja sistem menggunakan PRF (PRM) dan tanpa PRF. 7 Lingkungan Implementasi Lingkungan implementasi yang digunakan dalam penelitian ini adalah: Perangkat lunak: Windows 7 Ultimate 64-bit sebagai sistem operasi, XAMPP sebagai web service, PHP sebagai bahasa pemrograman pembuatan library, HTML dan CSS sebagai bahasa pemrograman pembuatan user interface, MySQL sebagai DBMS, Sublime Text 2 sebagai text editor dalam penulisan kode program, dan Sphinx sebagai platform temu kembali informasi. Perangkat keras: Prosesor Intel Core i7 2.0 GHz, RAM 8 GB, dan HDD 640 GB. HASIL DAN PEMBAHASAN Koleksi Dokumen/Korpus Penelitian ini menggunakan koleksi dokumen yang berjumlah 2095 dokumen tentang pertanian dan berbahasa Indonesia. Dua ribu dokumen diperoleh dari Laboratorium Temu Kembali Informasi Departemen Ilmu Komputer dan 95 dokumen merupakan dokumen tambahan dari penelitian Pancawan (2012). Dokumen tersebut berasal dari situs web Indonesia, antara lain: 1 Gatra, 2 Indosiar, 3 Kompas, 4 Media Indonesia, 5 Republika, 6 Situs Hijau, 7 Suara Karya, 8 Suara Merdeka, dan lain-lain. Salah satu contoh dokumen yang digunakan dalam penelitian ini seperti tercantum pada Lampiran 1. Dokumen tersebut kemudian digabung menjadi satu fail berformat XML.

20 8 Indexing Proses indexing dilakukan menggunakan Sphinx untuk temu kembali awal. Sumber dokumen yang dilakukan indexing adalah fail berformat XML. Hasil indexing menggunakan Sphinx dapat dilihat pada Gambar 4. Gambar 4 Hasil indexing menggunakan Sphinx. Jumlah dokumen yang diindeks berjumlah 2095 dokumen dengan kapasitas 6.3 MB Jumlah karakter yang diindeks minimal 3 karakter. Kata-kata pada dokumen dilakukan pembuangan stopword yang terdapat pada stopword.txt. Stopword yang digunakan berjumlah 732 kata yang berasal dari penelitian Diva (2012). Contoh stopword dapat dilihat pada Gambar 5. Daftar stopword lebih detil dapat dilihat pada Lampiran 2. acapkali ada adakah adakan adalah adanya adapun aduh agak agaknya... Gambar 5 Contoh stopwords disusun secara alfabetis Temu Kembali Awal Temu kembali awal menggunakan pembobotan BM25 untuk mendapatkan dokumen-dokumen yang sesuai dengan kueri yang diberikan. Dokumen hasil temu kembali diurutkan berdasarkan tingkat relevansinya. Kemudian, 20 dokumen teratas disimpan ke dalam basis data sebagai masukan pada proses selanjutnya (Gambar 6). Gambar 6 Contoh 5 dokumen teratas yang disimpan ke dalam basis data

21 9 Dokumen Peringkat n Teratas Penentuan dokumen peringkat n teratas diambil dari basis data. Pengambilan dokumen tersebut menggunakan SQL dengan kueri SELECT text FROM retrieve ORDER BY id ASC LIMIT {jumlah_feedback}. Hasil kueri tersebut bertujuan untuk mengambil n dokumen teratas. Praproses PRM Hasil pengambilan dokumen dari n teratas terlebih dahulu dilakukan tahapan praproses PRM, yaitu melakukan penghapusan tanda baca, simbol, dan angka serta mengubah term menjadi cetak kecil menggunakan fungsi preg_replace dengan bentuk eks resi reguler /[\d\w\s]+/. roses tokenisasi menggunakan fungsi preg_split dengan bentuk ekspresi reguler /[\s]/ di mana tia term akan dipisahkan berdasarkan spasi. Hasil tokenisasi berupa token-token berbentuk array (Gambar 7). Teks awal: Institut ertanian Bogor I B Array ( [0] => institut [1] => pertanian [2] => bogor [3] => ipb ) Gambar 7 Contoh array token yang sudah dilakukan tahapan praproses PRM Term hasil tokenisasi dilakukan penghapusan stopword menggunakan fungsi array_diff. Hasil akhir berupa array token tanpa stopword. Term unik (vocabulary) berasal dari gabungan token dari beberapa dokumen feedback menggunakan fungsi array_count_values. Contoh array dari term unik dapat dilihat pada Gambar 8. abdul abiotik abiotis acid acuan adiwilaga agama agustus ahli aktivitas akurat alat alfa alfred... Gambar 8 Contoh array dari term unik yang diurutkan secara alfabetis Perhitungan PRM Term unik yang berasal dari tahapan sebelumnya kemudian dihitung nilai PRM-nya dengan menggunakan rumus pada Persamaan 1 dan 2. Hasil penghitungan nilai PRM untuk tiap term disimpan ke dalam fail berformat plain text. Hasil percobaan menunjukkan bahwa nilai PRM yang lebih dekat posisinya dengan kueri, nilai peluangnya lebih besar dibandingkan dengan term yang jauh posisinya dari kueri. Contoh isi fail hasil perhitungan PRM untuk kueri kesejahteraan petani rendah da at dilihat ada Gambar 9.

22 10 petani>> e-5 indonesia>> e-5 kesejahteraan>> e-5 memprihatinkan>> e-5 tingkat>> e-5... Gambar 9 Contoh isi fail hasil penghitungan PRM yang diurutkan berdasarkan nilainya secara menurun Formulasi Kueri Baru Formulasi kueri baru diambil dari term yang memiliki nilai PRM teratas. Misal kueri awal adalah kese ahteraan etani rendah, 5 term teratas yang diurutkan se ara menurun berdasarkan nilai RM kiri ke kanan adalah etaniindonesia-kesejahteraan-memprihatinkan-tingkat. Selan utnya, term tersebut ditambahkan pada kueri awal. Contoh kueri awal yang diekspansi: Ekspansi 1 term: kese ahteraan etani rendah indonesia, Ekspansi 2 term: kese ahteraan etani rendah indonesia mem rihatinkan. Detil 5 term teratas untuk tiap kueri dapat dilihat di Lampiran 3. Kueri baru tersebut kemudian ditemu-kembalikan menggunakan Sphinx sebagai hasil dari temu kembali akhir. Evaluasi Evaluasi sistem dilakukan dengan cara membandingkan hasil keluaran dari Sphinx tanpa PRF dan menggunakan PRF (PRM). Hasil evaluasi dilakukan dengan menggunakan 20 kueri beserta gugus jawabannya (Lampiran 4). Panjang kueri yang diberikan adalah 3 dan 4 kata yang masing-masing berjumlah 10 kueri. Evaluasi dilakukan untuk mendapatkan nilai recall dan precision dari sistem terhadap pengujian pasangan kueri dan dokumen relevan. Kemudian dihitung interpolasi maksimum untuk mencari nilai AVP dari sistem. Pengaruh jumlah pengambilan dokumen n teratas terhadap hasil temu kembali Pada tahap awal pengujian dilakukan penentuan jumlah dokumen feedback yang optimal. Oleh karena itu, parameter dan panjang kata yang ditambahkan pada kueri awal dijadikan konstan, yaitu 0.1 dan 1 term, serta paramater diantaranya: 5, 10, 15, 20, dan 25. Sedangkan jumlah pengambilan dokumen teratas diantaranya 1, 2, 3, 4, dan 5 dokumen. Berdasarkan batasan pengambilan dokumen n teratas saat pengujian sistem, nilai AVP tertinggi lebih banyak terjadi saat jumlah dokumen feedback yang digunakan hanya 1 dokumen (Tabel 1) untuk setiap parameter yang diuji. Hal ini menunjukkan bahwa 1 dokumen teratas hasil temu kembali awal mampu merepresentasikan topik yang terdapat pada kueri awal. Selain itu, semakin banyak dokumen feedback, nilai AVP semakin menurun. Selanjutnya, jumlah

23 dokumen feedback tersebut ditetapkan sebagai nilai konstan dalam pengujian sistem temu kembali berikutnya. Tabel 1 Pengaruh jumlah pengambilan dokumen n teratas terhadap nilai AVP pada sistem menggunakan PRF (PRM) Dokumen Sigma ( ) feedback Pengaruh paramater (sigma) terhadap hasil temu kembali Untuk mengetahui pengaruh nilai sigma terhadap kinerja sistem temu kembali menggunakan PRF (PRM), maka dilakukan evaluasi terhadap nilai diantaranya: 5, 10, 15, 20, dan 25. Agar terlihat pengaruh pada parameter, maka jumlah dokumen feedback dibuat tetap yaitu 1 dokumen, paramater dari 0.1 sampai 0.9 dengan interval sebesar 0.1, dan jumlah term yang ditambahkan hanya 1 term. Pengaruh parameter terhadap kinerja sistem temu kembali menggunakan PRF (PRM) dapat dilihat pada Tabel 2. Tabel 2 Pengaruh parameter terhadap nilai AVP pada sistem temu kembali menggunakan PRF (PRM) Sebagian besar nilai AVP terbesar diperoleh saat parameter bernilai 5 untuk setiap parameter yang diuji. Nilai tersebut menyatakan bahwa pengambilan term yang menjadi kandidat untuk ekspansi kueri yang baru merupakan term yang posisinya sangat dekat dengan term pada kueri. Dengan memperkecil paramater tersebut, jangkauan term yang terambil terhadap posisi kueri (titik pusat) menjadi semakin mengecil. Sehingga term-term yang berada di luar daerah jangkauan tersebut memiliki nilai peluang yang kecil dibandingkan term yang terletak di dalam daerah jangkauan. Di samping itu, kenaikan parameter mengakibatkan nilai AVP semakin menurun. Dengan memperbesar parameter, jangkauan term yang terambil sebagai kandidat untuk ekspansi kueri menjadi semakin melebar. Sehingga term-term yang tidak berhubungan dengan topik pada

24 12 kueri ikut terambil. Reformulasi kueri baru yang berasal dari term-term tersebut mengakibatkan terambilnya dokumen-dokumen yang tidak relevan, sehingga dapat menurunkan nilai recall dan precision. Pengaruh perluasan kueri baru terhadap hasil temu kembali Perluasan kueri baru yang dihasilkan pada sistem-temu kembali menggunakan PRF (PRM) dapat memengaruhi nilai AVP. Oleh karena itu, parameter dibuat tetap yaitu 5, 10, dan 15, parameter sebesar 0.1, jumlah dokumen feedback menjadi 1 dokumen, dan jumlah term yang ditambahkan pada kueri awal diantaranya: 1, 2, 3, 4, dan 5 term. Pengaruh jumlah term yang ditambahkan pada kueri awal dapat dilihat pada Tabel 3. Tabel 3 Pengaruh perluasan kueri terhadap nilai AVP pada sistem temu kembali menggunakan PRF (PRM) Ekspansi Sigma Term Tabel 3 menunjukkan bahwa penambahan term baru terhadap kueri awal mengakibatkan nilai AVP semakin menurun. Hal ini disebabkan oleh adanya term yang tidak berhubungan dengan topik yang terdapat pada kueri awal. Penambahan term tersebut menyebabkan posisi dokumen yang relevan menjadi turun dan dokumen yang dianggap tidak relevan menempati posisi atas. Pengaruh parameter terhadap hasil temu kembali Untuk mengetahui pengaruh parameter terhadap sistem temu kembali, maka jumlah dokumen feedback dibuat tetap yaitu 1 dokumen, parameter bernilai 5, dan jumlah term yang ditambahkan pada kueri awal sebanyak 1 dan 2 term. Pengujian dilakukan dengan mengatur parameter dari 0.0 (minimum) sampai 1.0 (maksimum) dengan interval sebesar 0.1. Pengaruh parameter dapat dilihat pada Tabel 4. Saat parameter bernilai 0.0, perhitungan model bahasa koleksi diabaikan atau dengan kata lain perhitungan PRM lebih ditekankan pada posisi term tertentu di dalam suatu dokumen. Tetapi, saat parameter bernilai 1.0, perhitungan posisi term di dalam dokumen diabaikan. Tabel 4 menunjukkan bahwa perhitungan PRM yang lebih menekankan posisi term di dalam dokumen memiliki hasil yang kurang baik dibandingkan dengan menekankan perhitungan PRM pada model bahasa koleksi. Namun, saat parameter berada di antara batas minimum dan maksimum, nilai AVP mencapai nilai tertinggi.

25 13 Tabel 4 Pengaruh parameter terhadap nilai AVP pada sistem temu kembali menggunakan PRM Ekspansi 1 term 2 term Kinerja sistem temu kembali menggunakan PRF (PRM) dan tanpa PRF Hasil pengujian menunjukkan bahwa kinerja optimal sistem temu kembali menggunakan PRF (PRM) terjadi saat jumlah dokumen feedback yang digunakan sebesar 1 dokumen, parameter dan masing-masing bernilai 5 dan 0.8, dan jumlah penambahan term pada kueri awal sebanyak 1 term. Untuk mengetahui kinerja sistem temu kembali, pengujian dilakukan dengan membandingkan sistem temu kembali menggunakan PRF (PRM) dengan sistem temu kembali tanpa menggunakan PRF. Hasil pengujian menggunakan PRF (PRM) dan tanpa PRF dapat dilihat pada Gambar 10 yang menunjukkan bahwa kinerja sistem menggunakan PRF (PRM) lebih baik dibandingkan dengan tanpa PRF. Precision PRF (PRM) Tanpa PRF Recall Gambar 10 Grafik R-P untuk temu kembali menggunakan PRF (PRM) dan tanpa PRF

26 14 Kinerja sistem temu kembali menggunakan PRF (Lampiran 5) menghasilkan nilai AVP sebesar ( ) dan nilai recall sebesar 0.96 (+0.11). Hal ini menunjukkan bahwa pencarian dokumen menggunakan PRF (PRM) mampu menemukembalikan 96% dokumen relevan di dalam koleksi dengan tingkat relevansi sebesar 20%. Namun, 7 dari 20 kueri yang dilakukan pengujian mengalami penurunan nilai AVP, 1 kueri memiliki nilai yang tetap, dan kueri lainnya mengalami kenaikan nilai AVP (Lampiran 7). Rata-rata penurunan nilai AVP adalah sebesar dan kenaikan sebesar Penurunan nilai AVP terjadi pada kueri awal dengan panjang 4 kata. Sedangkan kinerja sistem temu kembali tanpa menggunakan PRF (Lampiran 6) menghasilkan nilai AVP sebesar dan nilai recall yang dihasilkan sebesar Hal ini menunjukkan bahwa pencarian dokumen tanpa menggunakan PRF (PRM) rata-rata menemukembalikan 85% dokumen relevan dengan tingkat relevansi sebesar 16%. SIMPULAN DAN SARAN Simpulan Hasil penelitian menunjukkan bahwa penggunaan PRM untuk PRF dapat meningkatkan kinerja sistem temu kembali. Peningkatan kinerja sistem menggunakan PRM sebesar 4.38%. Saran Penelitian ini dapat dikembangkan lebih lanjut dalam beberapa perbaikan, yaitu: 1 Penggunaan stemming dalam tahap praproses dokumen, 2 Penggunaan passage dokumen sebagai dokumen feedback.

27 15 DAFTAR PUSTAKA Anbiana ED Pseudo-relevance feedback pada temu kembali menggunakan segmentasi dokumen [skripsi]. Bogor (ID): Institut Pertanian Bogor. Baeza-Yates R, Ribeiro-Neto B Modern Information Retrieval. New York (US): Addison Wesley. Diva LM Ekspansi kueri pada sistem temu kembali informasi berbahasa indonesia menggunakan analisis konteks lokal [skripsi]. Bogor (ID): Institut Pertanian Bogor. Manning CD, Raghavan P, Schütze H An Introduction to Information Retrieval. Cambridge (GB): Cambridge Univ Pr. Pancawan MR Ekspansi kueri pada sistem temu kembali informasi dengan tesaurus dan bobot irisan [skripsi]. Bogor (ID): Institut Pertanian Bogor. Lv Y, Zhai CX Positional language models for information retrieval. Di dalam: Proceedings of the 32nd International ACM SIGIR Conference on Research and Development in Information Retrieval; 2009 Jul 19-23; Boston, Amerika Serikat. Boston (US): ACM. hlm Lv Y, Zhai CX Positional relevance model for psudo-relevance feedback. Di dalam: Proceedings of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval; 2010 Jul 19-23; Geneva, Swiss. Geneva (CH): ACM. hlm

28 16 LAMPIRAN

29 17 Lampiran 1 Contoh dokumen pertanian <DOC> <DOCNO>ahmadheryawan251211</DOCNO> <TITLE>Pemprov Jabar Dorong Pembentukan Bank Pertanian</TITLE> <AUTHOR></AUTHOR> <DATE></DATE> <TEXT> Pemerintah Provinsi Jawa Barat akan mendorong pemerintah pusat untuk mendirikan bank yang khusus mengelola sektor pertanian. Pasalnya, penyaluran kredit perbankan terhadap sektor pertanian sangat rendah. "Kami mendorong agar pemerintah pusat pusat membangun bank khusus pertanian," ujar Gubernur Jawa Barat Ahmad Heryawan usai acara Bankers Dinner di Kantor BI Bandung, Jalan Braga Kota Bandung, Rabu (21/12/2011) malam. Menurutnya, pendirian bank pertanian sudah sangat mendesak. Dia mencotohkan, Vietnam telah memiliki bank pertanian sehingga sektor pertanian di negara tersebut maju dan berkembang. "Memang harus ada bank yang khusus memberikan keberpihakan kepada sektor pertanian. Jadi, bank pertanian nantinya tidak hitung-hitungan keuntungan seperti bank-bank konvensional lainnya," paparnya. Dia menjelaskan sektor pertanian kurang mendapat kucuran bantuan kredit dari perbankan karena para pelaku usaha kerap terbentur dengan suku bunga yang tinggi. Selain itu, para pelaku sekot pertanian sering terbentur masalah agunan. "Di seluruh Indonesia, penyaluran terhadap sektor pertanian sangat rendah karena suku bunga tinggi dan pemakaian sistem agunan," pungkasnya. Penyaluran Kredit Pertanian Jabar Masih Rendah Pangsa pasar kredit pertanian hanya sebesar Rp2,3 triliun atau sekitar 3% dari total kredit. Padahal kontribusi sektor pertanian terhadap perekonomian Jawa Barat mencapai 12%. "Memang penyaluran kreditnya masih rendah hanya sekitar Rp2,3 triliun," ujar ujar Pemimpin BI Bandung Lucky Fathul Aziz Hadibrata usai acara Bankers' Dinner di Kantor BI Bandung, Jalan Braga Kota Bandung, Rabu (21/12/2011) malam. Meski begitu, Lucky menjelaskan penyaluran kredit sektor pertanian di Jabar pada tahun ini sekitar 3% dari total kredit, lebih tinggi dibandingkan tahun lalu yang hanya 2%. Untuk itu, pihaknya akan terus mendorong perbankan agar memberikan keberpihakan terhadap sektor pertanian. "Kita akan minta komitmen terhadap perbankan agar mempunyai strategi riil terhadap pertanian," jelasnya. Selain itu, pihaknya juga menargetkan peningkatan pertumbuhan pertanian yang saat ini 23% menjadi 28% pada Tidak hanya itu, BI Bandung juga berharap penyaluran kredit terhadap pertanian meningkat menjadi Rp5 triliun. "Target kita kedepan, pertumbuhan pertanian mencapai 28% dan penyaluran kreditnya double, sekitar Rp5 triliun," pungkasnya. </TEXT> </DOC>

30 18 Lampiran 2 Daftar stopword acapkali ada adakah adakan adalah adanya adapun aduh agak agaknya agar aja akalan akan akankah akhir akhirnya akibat akibatkan akibatnya aku ala alangkah alasan alasannya alih alihkan amat amatlah ambil anda andai anggap anggapan antar antara antaranya apa apabila apakah apalagi apalah apanya apapun arti artian artinya asalan asalkan asumsi asumsinya atas atasnya atau ataukah ataupun awal bagai bagaikan bagaimana bagaimanakah bagaimanapun bagi baginya bagus bagusnya bahkan bahwa baik baiknya balik banding bandingkan banyak banyaknya barangkali baru bawah bawahnya beberapa begini beginilah begitu begitulah begitupula begitupun belakang belakangan belum belumlah benar benarkah benarnya berada berakhir berakhirnya berakibat berakibatkan beralasan beralih beralihnya beranggapan berapa berapanya berapapun berarti berasumsi berbagai berbagi berbanding berbeda berdampak berdasarkan berhadapan berharap berhubung berhubungan beri berikan berikanlah berikut berikutnya berjumlah berkat berkenaan berkesan berkesempatan berkesimpulan berlalu berlalunya berlama berlangsung bermula bersama bersamaan bertepatan beruntun berupa besarnya beserta besok besoknya betapa biar biarlah biasa biasanya bicarakan bicaranya bila bilamana bilang bisa bisakah bisanya boleh boro buat buatnya bukan bukankah bukanlah bukannya buktikan cara cerita ceritanya contoh contohkan contohnya cukup cuma daerah dahulu dalam dan dapat dapatkah dapatkan dapatlah dari darinya daripada dekat dekatnya demi demikian demikianlah dengan dengannya depan depannya dia dialah dialami dialihkan diambil diambilkan diambilnya dianggap diantara diantaranya diapakan dibagi dibagikan dibeberapa diberbagai diberi diberikan diberinya dibiarkan dibiasakan dibilang dicontoh dicontohkan dicontohkannya didapat didapati didapatkan didapatnya didasarkan digolongkan digunakan diharapkan dijadikan dijadikannya dikarenakan dikasih dikata dikatakan dikatakannya dikategorikan dikembangkan diketahui diketahuinya dilaksanakan dilakukan dimana dimulai dimulailah dimulainya dimungkinkan dipaparkan dipersilahkan disaat disebabkan disejumlah diseluruh disertai disertakan disimpulkan disitulah ditanggapi ditanya ditanyakan dituturkan diucapkan dkk dll dsb dua dulu dulunya empat enggak engkau esok gimana habis habisan habiskan habisnya hal hampir hanya hanyalah hari harus haruskah haruslah harusnya hendak hendaklah hendaknya hingga how ialah ingin ini inilah inipun itu itulah itupun iya jadi jadikan jadilah jadinya jangan jarang jauh jelaskan jika jikalau juga jumlah jumlahnya justru juta kabupaten kadang kalau kalaupun kali kalian kami kamu kan kapan karena karenanya kata katakan katakanlah katanya kau kayak kayaknya kebanyakan kebetulan kebiasaan kecil kecuali kemana kemanakah kembali kemudian kemungkinan kemungkinannya kenapa kenapakah

31 19 Lampiran 2 Lanjutan kepada kepadanya kepala ketika ketimbang khususnya kini kita kondisi kurang lagi lagian lagipula lain lainnya laksana lakukan lalu lalui lama lanjut lantaran lantas lebih lepas lewat lokasi maka makin mampu mampukah mampunya mana manakala manalagi manapun masa masih masihkah masing masuk masyarakat mau maupun melainkan melakukan melalui melihat memang memaparkan membagi membagikan memberi memberikan memberinya membiarkan membolehkan membuat memeperoleh memiliki meminta memperbolehkannya mempersilahkan mempunyai memungkinkan menanggapi menanggapinya menanyakan mencapai mencontohkan mendapat mendapati mendapatkan mendapatkannya menerus mengada mengaku mengalami mengalihkan mengambil mengambilnya menganggap menganggapnya mengapa mengatakan mengembangkan mengenai menggunakan mengungkapkan meningkat meningkatkan menjadi menjadikan menjadikannya menjelang menjelaskan menuju menunjukkan menurut menurutnya menuturkan menyatakan menyebabkan menyebutkan menyia mereka merupakan meski meskipun mesti mestinya misal misalkan misalnya mudah mula mulai mulainya mulanya muncul mungkin mungkinkah namun nanti negara nilai nyaris nyiakan oleh orang pada padahal padanannya paling panjangnya papar paparan paparkan paparnya para pasti pastilah pastinya pelak pelbagai pemaparan pembagian pembagiannnya pendapat pengalihan pengambil pengambilan pengandaian per peralihan percuma peri perihal perlahan perlu pernah persen pertamanya pinggir pula pulalah pun rata relevankah rendah saat saatnya saatnyalah saja salah sama sambil sambutannya sampai sana sang sangat sangatlah satunya saya sayangnya seakan seandainya seantero sebab sebabkan sebabnya sebagai sebagaimana sebagainya sebagian sebaik sebaiknya sebaliknya sebanyak sebelum sebelumnya sebenarnya seberapa seberat sebesar sebetulnya sebuah secara sedalam sedang sedangkan sedapat sedemikian sedikit sedikitnya segera sehabis seharusnya seharusnyalah sehingga sehubungan sejak sejauhmana sejumlah sekalian sekaligus sekalipun sekarang sekata sekedar sekeliling seketika sekian sekitar selagi selain selalu selama selanjutnya selesai selesaikah seluruh seluruhnya semakin semampunya semenjak sementara semestinya semisal semoga semua semuanya semula seolah seorang seorangpun sepadan sepanjang separah sepasang sepele sependapat seperti sepertinya seputar seraya serba serentak sering seringkali seringkalinya seringlah seringnya serta sertanya sesaat sesama sesamamu sesedikit seseorang sesuai sesuatu sesuatunya sesudah sesudahnya sesukanya sesungguhnya setelah setelahnya seterusnya setiap setidak setidaknya seusai sewaktu seyogyanya sia sialnya siap siapa siapakah siapapun silahkan singkatnya sini sinilah situ sosok sosoknya suatu sudah sulit sungguh sungguhpun supaya tak tambahnya tanggapan tanggapannya tanggapnya tanpa tapi tatkala telah tempat tengah tentang tentu tentunya tepatnya terbagi terbalik terbiasa terbilang terdapat tergolong terhadap terjadi terjadilah terjadinya terkadang

32 20 Lampiran 2 Lanjutan terkait terkecuali terlalu terlebih termasuk ternyata tersebut tertentu terus tetap tetapi tiap tiba tidak tidaklah tidaknya tiga tinggi tutur tuturnya ucap ucapan ucapannya ucapkan ucapnya ujar ujarnya umpamanya umum umumnya ungkap ungkapan ungkapkan ungkapnya untuk usah usahlah usai usianya waktu waktulah waktunya walau walaupun warga yaitu yakni yang

33 Lampiran 3 Kandidat term ekspansi (kiri ke kanan, nilai PRM menurun, = 5, = 0.8, 1 feedback) Topik Angsuran pertanian sedikti Area pertanian semakin berkurang Bidang pertanian belum berkembang Daftar term Pertanian wilayah kelompok kegiatan petani Pertanian hektare area luas bali Pertanian agatho organis hijau revolusi Dana bidang pertanian rendah Sektor pertanian dana satu indonesia Kesejahteraan petani rendah Mutu hasil pertanian rendah Nilai jual komoditas rendah Permintaan humus naik Persediaan padi memadai Petani sulit mendapatkan humus Produk asing murah Petani indonesia kesejahteraan memprihatinkan tingkat Hasil laut pertanian ekonomi produk Komoditas harga pertanian jual sendiri Pupuk permintaan petani distribusi sukabumi Beras dunia indonesia impor persediaan Bogor menteri petani pro pembangunan Produk harga sisi asing pertanian Produksi pertanian meningkat Produksi pertanian ton indonesia turun Produksi pertanian menurun Produktivitas pertanian rendah Sawah hancur terendam air Sawah kering kekurangan air Sawah rusak berat Tarif humus tinggi Upaya peningkatan produksi pertanian Wereng serang lahan pertanian Produksi pertanian ton indonesia turun Pertanian produktivitas cisadane tahun cidurian Terendam sawah air tanahnya bagian Kecamatan air sukabumi petani kekurangan Berat rusak puso air bencana Pertanian tarif non ekspor tujuan Produksi pertanian peningkatan pendukung komoditas Lahan sukoharjo hama batang penggerek 21

34 22 Lampiran 4 Gugus kueri dan jawaban pada dokumen pertanian Kueri nilai jual komoditas rendah persediaan padi memadai sawah hancur terendam air sawah kering kekurangan air Gugus jawaban balipost030608, BisnisIndonesia , gatra030408, indosiar071103, indosiar , indosiar240604, indosiar300304, indosiar , jurnalhorti113, kompas , kompas031100, kompas101004, kompas161000, kompas171002, kompas200803, kompas240803, kompas250901, kompas , kompas , kompas , mediaindonesia060803, mediaindonesia170303, mediaindonesia250304, mediaindonesia310503, okezone , panturanews220611, pertaniansehat , pertaniansehat , pikiranrakyat , pikiranrakyat240404, pikiranrakyat300604, poskota , republika020804, republika , republika060503, republika , republika , republika140503, republika , republika , republika , republika , situshijau15, situshijau , situshijau280203, situshijau , situshijau , situshijau , suarakarya , suarakarya , suaramerdeka , suaramerdeka290303, suarapembaruan110903, suarapembaruan antarajawabarat211211, beritasore080711, bisnis_jabar191211, bisnisindonesia140911, deptan , eksposnews161211, gatra161711, gatra190902, gatra , gatra230408, gatra230802, globalnews190911, harian_aceh291011, incestordaily310711, indosiar221003, indosiar240703, kbrh211111, kompas160704, kompas221011, kompas260711, korankaltim260811, malukunews090811, mediaindonesia231111, menkokesra71211, okezone080711, okezone130711, okezone31701, poskota , radarbangka040811, republika061102, republika , republika , republika , republika , sinartani1075, suaramerdeka090911, suaramerdeka170602, tempointeraktif , tempointeraktif , tribunnews300711, vivanews122111, vivanews gatra011200, gatra040108, gatra070203, gatra200210, indosiar020104, indosiar , indosiar031203, indosiar , indosiar130104, indosiar130504, indosiar140204, indosiar160304, indosiar180304, kompas170504, kompas210403, mediaindonesia , mediaindonesia130210, mediaindonesia140203, mediaindonesia170209, mediaindonesia180110, mediaindonesia200110, okezone , okezone , okezone , okezone , pertaniansehat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , radarbogor020110, situshijau , suarakarya , suarakarya , suaramerdeka251001, surabayapost29010, tempointeraktif deptan , gatra060907, gatra070203, gatra190802, gatra210704, gatra270709, gatra301002, gatra , gatra310709, indosiar010903, indosiar040903, indosiar170603, indosiar180304, indosiar220503, indosiar240703, indosiar , indosiar , indosiar310504, kompas030704, korantempo3, mediaindonesia , mediaindonesia110703, mediaindonesia160603, mediaindonesia210709, mediaindonesia240503, mediaindonesia300909, mediaindonesia310503, okezone , okezone , okezone , okezone , okezone , okezone , okezone , radarbogor050608, radarbogor , republika ,

35 23 Lampiran 4 Lanjutan Kueri area pertanian semakin berkurang tarif humus tinggi upaya peningkatan produksi pertanian Gugus jawaban republika , republika , republika , republika , republika200603, republika , republika230903, republika270503, republika , republika , suarakarya , suarakarya , suarakarya , suaramerdeka130602, suaramerdeka190903, suaramerdeka290901, suarapembaruan110903, suarapembaruan190809, suarapembaruan , suarapembaruan , tempointeraktif balipost050908, balipost301208, deptan , deptan , gatra100509, gatra230503, jurnal , kompas020603, kompas030403, kompas031100, kompas101001, kompas120702, kompas , kompas150104, kompas170504, kompas170903, kompas171002, kompas180303, kompas181202, kompas220399, kompas230899, kompas240503, kompas260203, kompas , kompas , kompas290404, kompas290508, kompas290803, kompas310703, korantempo3, mediaindonesia010310, mediaindonesia , mediaindonesia050104, mediaindonesia050709, mediaindonesia120609, mediaindonesia170210, mediaindonesia180210, mediaindonesia , mediaindonesia191209, mediaindonesia230104, mediaindonesia281109, mediaindonesia301009, okezone , okezone , okezone , republika030304, republika , republika080703, republika090902, republika , republika120803, republika , republika , republika , republika , republika , republika , republika , republika241203, republika , satudunia , situshijau , suarakarya , suarakarya , suaramerdeka , suarapembaruan040603, suarapembaruan060602, sumutpos , tempo251211, tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif harianhaluan291111, indosiar060204, indosiar240604, indosiar270504, indosiar290604, kbr68h041211, kompas100901, kompas110302, kompas210504, kompas211211, kompas241203, kompas , kompas , liputan6_100611, mamorema01, metrotvnews221111, okezone , panturanews220611, pertaniansehat , pikiranrakyat , pikiranrakyat , pikiranrakyat , republika160703, situshijau15, suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka161101, waspada deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , gatra050508, gatra060206, gatra080102, gatra121108, gatra200103, gatra220604, gatra240203, gatra260408, indosiar030304, indosiar , indosiar180304, jurnalhorti210, jurnal , jurnal , jurnalhorti1, jurnalhorti87, kompas031100, kompas160704, kompas200802, kompas210502, kompas230209, kompas240103, kompas240302, kompas280502, kompas , kompas310703, kompas311203, kompas , mediaindonesia020809, mediaindonesia021209,

36 24 Lampiran 4 Lanjutan Kueri produk asing murah produksi pertanian menurun Gugus jawaban mediaindonesia080210, mediaindonesia091109, mediaindonesia , mediaindonesia120609, mediaindonesia , mediaindonesia190210, mediaindonesia210210, mediaindonesia270309, mediaindonesia270809, okezone , okezone , okezone , pertaniansehat , pertaniansehat , pertaniansehat , republika , republika040303, republika050803, republika050903, republika , republika , republika , republika , republika100902, republika , republika , republika , republika , republika140703, republika150703, republika150903, republika151202, republika , republika , republika , republika , republika230903, republika , republika241203, republika , republika260803, republika , republika301002, republika , republika , republika , situshijau , situshijau070503, situshijau , situshijau , situshijau , situshijau , situshijau , situshijau no, suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka071102, suaramerdeka120104, suaramerdeka190903, suarapembaruan130103, suarapembaruan140303, suarapembaruan220802, suarapembaruan , surabayapost020210, surabayapost070110, tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , wartapenelitian analisdaiy211011, indosiar , kompas100702, kompas101002, kompas131211, kompas170104, kompas180502, kompas250901, kompas , kompas280602, lampungpost201011, mediaindonesia060803, mediaindonesia170303, okezone210111, poskota , republika060503, suaramerdeka130104, suarapembaruan100903, suarapembaruan110903, tempo deptan , gatra010307, gatra030203, gatra , gatra180103, gatra220802, gatra , gatra240203, indosiar010504, indosiar010803, indosiar270504, kompas030403, kompas050303, kompas060503, kompas120102, kompas170402, kompas171002, kompas180303, kompas211211, kompas240103, kompas260902, kompas , kompas270401, kompas , mediaindonesia050709, mediaindonesia090409, mediaindonesia , mediaindonesia281109, mediaindonesia300909, okezone , pikiranrakyat , pikiranrakyat , pikiranrakyat , poskota , republika , republika , republika , republika , republika , republika201102, republika , republika241203, republika281202, situshijau , situshijau , situshijau , situshijau280203, suarakarya , suaramerdeka290901, suarapembaruan290803, surabayapost020310, tempointeraktif , tempointeraktif , tempointeraktif , vivanews122111

37 25 Lampiran 4 Lanjutan Kueri produktivitas pertanian rendah petani sulit mendapatkan humus sawah rusak berat Gugus jawaban balipost301208, deptan , deptan , deptan , gatra010307, gatra180103, gatra240203, indosiar180304, jurnal , jurnal , kompas030403, kompas091003, kompas101004, kompas110302, kompas140802, kompas171208, kompas180701, kompas220399, kompas , kompas , kompas270401, kompas280602, mediaindonesia050709, mediaindonesia090409, mediaindonesia190210, mediaindonesia220303, mediaindonesia250304, mediaindonesia250809, mediaindonesia301009, okezone , okezone , okezone , okezone280111, pertaniansehat , pertaniansehat , pikiranrakyat , republika , republika , republika150703, republika151202, republika , republika , republika , republika , seputarindonesia , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau , situshijau280203, situshijau , situshijau , situshijau no, suarakarya , tempointeraktif banjarmasinpost181211, gatra230609, harianhaluan291111, indosiar010704, indosiar060204, indosiar , indosiar200104, indosiar290604, kompas210504, kompas211211, kompas , liputan6_100611, mamorema01, mediaindonesia211211, metrotvnews221111, okezone , pertaniansehat , pertaniansehat , pikiranrakyat , republika050604, republika , republika , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suarakarya , suaramerdeka161101, surya121111, tribunnews51011, waspada gatra030706, gatra040108, gatra060907, gatra070203, gatra120210, gatra190802, gatra190902, gatra , gatra260803, gatra301002, gatra , indosiar010504, indosiar031203, indosiar040903, indosiar , indosiar130104, indosiar130504, indosiar160304, indosiar180304, indosiar240703, indosiar , kompas170504, kompas260902, mediaindonesia030603, mediaindonesia050204, mediaindonesia , mediaindonesia110309, mediaindonesia110703, mediaindonesia130210, mediaindonesia , mediaindonesia140203, mediaindonesia160603, mediaindonesia170209, mediaindonesia190503, okezone , okezone , okezone , okezone , okezone , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , radarbogor050608, republika , republika , republika , republika , republika , republika200603, republika230903, republika , republika , situshijau , situshijau , suarakarya , suarakarya , suaramerdeka131001, suaramerdeka190903, suarapembaruan120104, suarapembaruan , suarapembaruan , surabayapost100210, tempointeraktif , tempointeraktif situshijau , suarakarya ,suaramerdeka031101

38 26 Lampiran 4 Lanjutan Kueri mutu hasil pertanian rendah produksi pertanian meningkat kesejahteraan petani rendah wereng serang lahan pertanian Gugus jawaban Deptan , gatra011102, gatra180103, indosiar , jurnal , jurnalhorti103, jurnalhorti113, kompas050303, kompas100702, kompas101002, kompas161000, kompas180502, kompas220801, kompas290404, mediaindonesia030104, mediaindonesia170403, pikiranrakyat , republika , republika , republika , republika , situshijau01, situshijau , situshijau , situshijau , situshijau , situshijau15, situshijau , situshijau , situshijau , suarakarya , suaramerdeka , suarapembaruan , situshijau , situshijau , suarakarya , suarakarya , suarakarya , suaramerdeka120104, suaramerdeka290901, suarapembaruan deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , deptan , detikfinance , gatra010307, gatra100509, gatra121108, gatra230802, gatra310807, indosiar , kompas060503, kompas150104, kompas160704, kompas180701, mediaindonesia020809, mediaindonesia080210, mediaindonesia210210, mediaindonesia250809, mediaindonesia291209, pikiranrakyat , pikiranrakyat , republika080703, republika , republika , republika , republika , republika , republika281202, republika , suarakarya , surabayapost020310, surabayapost070110, surabayapost110210, surabayapost250110, tempointer aktif balipost030608, gatra230109, jurnal , kompas030403, kompas031003, kompas110504, kompas120204, kompas161000, kompas170903, kompas220399, kompas240803, kompas290404, mediaindonesia120209, panturanews220611, pertaniansehat , poskota270411, republika100804, republika , sinartani291211, suarakarya , suarakarya , suarapembaruan100903, suarapembaruan190809, tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif balipost290708, gatra011200, gatra030203, gatra , gatra120210, gatra190902, gatra , indosiar010504, indosiar010803, indosiar070504, indosiar , indosiar240604, indosiar270504, indosiar310304, kompas170903, kompas200803, kompas211211, mediaindonesia020310, mediaindonesia030603, mediaindonesia050204, mediaindonesia050309, mediaindonesia , mediaindonesia090409, mediaindonesia110309, mediaindonesia120110, mediaindonesia131209, mediaindonesia , mediaindonesia190503, mediaindonesia221209, mediaindonesia240110, okezone , okezone , okezone , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , pikiranrakyat , radarbogor050608, republika , republika , republika , republika , republika , republika , republika ,

39 27 Lampiran 4 Lanjutan Kueri bidang pertanian belum berkembang angsuran pertanian sedikit dana bidang pertanian rendah permintaan humus naik Gugus jawaban republika , situshijau , situshijau , situshijau , situshijau14, situshijau , suarakarya , suarakarya , suaramerdeka131001, suarapembaruan120104, surabayapost100210, surabayapost231209, tempointeraktif , tempointeraktif balipost030608, balipost050908, balipost301208, gatra230109, gatra290903, jurnal , kompas030403, kompas031003, kompas050303, kompas091003, kompas120204, kompas , kompas170104, kompas171002, kompas180504, kompas220399, kompas240803, kompas , mediaindonesia , mediaindonesia100203, mediaindonesia180504, mediaindonesia250803, metrotvnews , okezone280111, poskota270411, republika , republika , republika , republika , sinartani291211, suarakarya , suarakarya , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif , tempointeraktif ahmadheryawan251211, antaranews031110, beritadaerah081111, bisnisindonesia101211, bisnisjabar080911, detik100211, inilahjabar221211, kabarbisnis291211, kompas110201, kompas120204, kompas140209, kompas170911, kompas , korankaltim001, medanbisnis060911, mediaindonesia170712, mediaindonesia260711, metrotvnews181211, pikiranrakyat161211, republika110504, republika , seputarsulawesi081111, suaramerdeka090707, tempointeraktif , theglobejurnal290709, tribunnews151211, ujungpadangekspres091111, wartakota0001, wsp_agro01, yiela antaranews211111, banjarmasinpost180711, bataviase070710, gatra131011, kompas040111, kompas210502, lampungpost081211, mediaindonesia090903, metrotvnews261211, neraca180811, okezone280111, panturanews220611, partaimerdeka01, poskota270411, prakarsa_rakyat190811, republika110504, republika , republika , seputarindonesia051011, seputarindonesia271211, sinartani00002, sinartani291211, sinartani291211, tempo251211, tribunnews061211, waspada bataviase200511, gatra230609, kbr68h041211, kompas151211, kompas210504, kompas211211, kompas230209, kompas , lampungpost121111, metrotvnews221111, pertaniansehat , pikiranrakyat , pikiranrakyat , pikiranrakyat100310, pikiranrakyat , pikiranrakyat , poskota190511, radarmadiun01, rakyatmerdeka180711, republika , republika201102, suarakarya , suarakarya , suarakarya

40 Topik Recall angsuran pertanian sedikit area pertanian semakin berkurang bidang pertanian belum berkembang dana bidang pertanian rendah kesejahteraan petani rendah mutu hasil pertanian rendah nilai jual komoditas rendah permintaan humus naik persediaan padi memadai petani sulit mendapatkan humus produk asing murah produksi pertanian meningkat produksi pertanian menurun produktivitas pertanian rendah sawah hancur terendam air sawah kering kekurangan air sawah rusak berat tarif humus tinggi upaya peningkatan produksi pertanian wereng serang lahan pertanian Lampiran 5 Tabel hasil pengujian analisis kinerja sistem yang optimal menggunakan PRF (PRM). Paramater = 5, jumlah dokumen feedback = 1, parameter = 0.8, dan penambahan term sebanyak 1 term 28

41 Topik Recall angsuran pertanian sedikit area pertanian semakin berkurang bidang pertanian belum berkembang dana bidang pertanian rendah kesejahteraan petani rendah mutu hasil pertanian rendah nilai jual komoditas rendah permintaan humus naik persediaan padi memadai petani sulit mendapatkan humus produk asing murah produksi pertanian meningkat produksi pertanian menurun produktivitas pertanian rendah sawah hancur terendam air sawah kering kekurangan air sawah rusak berat tarif humus tinggi upaya peningkatan produksi pertanian wereng serang lahan pertanian Lampiran 6 Tabel hasil pengujian analisis kinerja sistem tanpa menggunakan PRF 29 29

42 30 Lampiran 7 Tabel perbandingan nilai AVP sistem tanpa menggunakan PRM dan menggunakan PRM* untuk masing-masing kueri pengujian AVP Topik Tanpa PRF PRF (PRM) Selisih angsuran pertanian sedikit area pertanian semakin berkurang bidang pertanian belum berkembang dana bidang pertanian rendah kesejahteraan petani rendah mutu hasil pertanian rendah nilai jual komoditas rendah permintaan humus naik persediaan padi memadai petani sulit mendapatkan humus produk asing murah produksi pertanian meningkat produksi pertanian menurun produktivitas pertanian rendah sawah hancur terendam air sawah kering kekurangan air sawah rusak berat tarif humus tinggi upaya peningkatan produksi pertanian wereng serang lahan pertanian Keterangan: : mengalami penurunan nilai AVP * Pengujian dilakukan dengan parameter dan masing-masing bernilai 0.8 dan 5, jumlah dokumen feedback sebanyak 1 dokumen, dan term yang ditambahkan sebanyak 1 term.

43 Lampiran 8 Antarmuka implementasi 31

dok023.txt, dok110.txt, dok161.txt, dok196.txt, dok248.txt, dok259.txt

dok023.txt, dok110.txt, dok161.txt, dok196.txt, dok248.txt, dok259.txt LAMPIRAN 13 Lampiran 1 Daftar kueri uji dan dokumen yang relevan Kueri Uji cabai merah buah tropika padi budidaya anggrek Dokumen Relevan dok053.txt, dok059.txt, dok061.txt, dok100.txt, dok124.txt, dok153.txt,

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j 3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan

Lebih terperinci

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya. beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini

Lebih terperinci

DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA

DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA DIRECT TERM FEEDBACK UNTUK TEMU-KEMBALI INFORMASI BAHASA INDONESIA MENGGUNAKAN MODEL BAHASA ANITA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

Lebih terperinci

beberapa tag-tag lain yang lebih spesifik di dalamnya.

beberapa tag-tag lain yang lebih spesifik di dalamnya. metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista

Lebih terperinci

PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH

PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH PEMBOBOTAN RIDF PADA MESIN PENCARI BAHASA INDONESIA UNTUK EKSPANSI KUERI MENGGUNAKAN ANALISIS KONTEKS LOKAL FANIA RAHMANAWATI KARIMAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

Lampiran 1 Contoh koleksi dokumen. <DOC> <DOCNO>gatra </DOCNO> <TITLE>Semarang Kembangkan Sapi Potong Gemuk</TITLE> <AUTHOR>Tma,

Lampiran 1 Contoh koleksi dokumen. <DOC> <DOCNO>gatra </DOCNO> <TITLE>Semarang Kembangkan Sapi Potong Gemuk</TITLE> <AUTHOR>Tma, LAMPIRAN 11 12 Lampiran 1 Contoh koleksi dokumen. gatra230103-002 Semarang Kembangkan Sapi Potong Gemuk Tma, Ant 23 Januari 2003

Lebih terperinci

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN 1 EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :

Lebih terperinci

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

Lampiran 1 Antarmuka implementasi

Lampiran 1 Antarmuka implementasi LAMPIRAN 16 Lampiran 1 Antarmuka implementasi 17 17 Lampiran 2 Contoh dokumen XML dalam koleksi pengujian indosiar050704-001 SumKa Presiden Megawati Lakukan

Lebih terperinci

HASIL DAN PEMBAHASAN. sim(, )=

HASIL DAN PEMBAHASAN. sim(, )= 4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i

Lebih terperinci

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium

Lebih terperinci

LAMPIRAN. kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk

LAMPIRAN. kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk LAMPIRAN kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk Lampiran 1 Contoh tabel perhitungan uji Cohcran Pekerja Perlakuan Mesin A Mesin B Mesin C Jumlah nilai baris (R i ) 1 0 0 1 1 2 0 1 0 1 3 1 1 0 2 4 1 1 1 3 5 1

Lebih terperinci

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI

Lebih terperinci

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 1 PERBANDINGAN

Lebih terperinci

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita 6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional

Lebih terperinci

PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI

PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI

PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen 6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat

Lebih terperinci

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH

STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI

MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI MESIN PENCARI DOKUMEN BAHASA INDONESIA MENGGUNAKAN LATENT SEMANTIC INDEXING DENGAN PEMBOBOTAN GLOBAL SUSI HANDAYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester

Lebih terperinci

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan

Lebih terperinci

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA Oleh: YUDHA PERMADI G64102064 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008

Lebih terperinci

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING

Lebih terperinci

RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR

RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR RELEVANCE FEEDBACK PADA TEMU KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR Oleh: Andika Wahyu Agusetyawan G64101007 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas

Lebih terperinci

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu

Lebih terperinci

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut

Lebih terperinci

Search Engines. Information Retrieval in Practice

Search Engines. Information Retrieval in Practice Search Engines Information Retrieval in Practice All slides Addison Wesley, 2008 Search Engine Architecture Arsitektur dari mesin pencari ditentukan oleh 2 persyaratan efektivitas (kualitas hasil) efisiensi

Lebih terperinci

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan pengetahuan dan kehidupan manusia sungguh dipercepat dengan kemudahan akses terhadap begitu banyak informasi. Pada beberapa waktu yang lalu akses terhadap

Lebih terperinci

HASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan.

HASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan. 4 dan Thelen (2000) karena disesuaikan terhadap kaidah bahasa Indonesia. Rule yang dibuat Sianturi (2008) dan digunakan oleh Sanur (2011) memiliki notasi S sebagai sentence atau passage serta Q sebagai

Lebih terperinci

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Dokumen Penyimpanan yang Terorganisasi Database Mahasiswa Database Buku ID Nama Buku Pengarang 001 Information Retrieval Ricardo baeza

Lebih terperinci

PENGEMBANGAN SISTEM TEMU KEMBALI INFORMASI DIGITAL FULLTEXT ARTIKEL JURNAL DI PDII LIPI

PENGEMBANGAN SISTEM TEMU KEMBALI INFORMASI DIGITAL FULLTEXT ARTIKEL JURNAL DI PDII LIPI PENGEMBANGAN SISTEM TEMU KEMBALI INFORMASI DIGITAL FULLTEXT ARTIKEL JURNAL DI PDII LIPI Sjaeful Afandi 1*, Firman Ardiansyah 2, Blasius Soedarsono 3 1 Magister Profesional Teknologi Informasi untuk Perpustakaan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract IMPLEMENTASI SISTEM TEMU KEMBALI INFORMASI Studi Kasus: Dokumen Teks Berbahasa Indonesia (IMPLEMENTATION OF INFORMATION RETRIEVAL SYSTEM Case Study: Text Document in Indonesian Language) Bernadus Very

Lebih terperinci

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 XML RETRIEVAL UNTUK DOKUMEN

Lebih terperinci

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer CORPUS DOKUMEN TEKS BAHASA INDONESIA UNTUK PENGUJIAN EFEKTIVITAS TEMU KEMBALI INFORMASI Oleh: Ir. Julio Adisantoso, M.Kom.

Lebih terperinci

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA Fridolin Febrianto Paiki Universitas Papua, Jl. Gunung Salju, Amban, Manokwari ff.paiki@unipa.ac.id

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan

Lebih terperinci

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE Rila Mandala Kelompok Keahlian Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10 Bandung,

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

Identifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN

Identifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN 5 Identifikasi Tipe Pertanyaan Ada beberapa tipe pertanyaan yang digunakan dalam Bahasa Indonesia, yaitu: 1 APA, yang menanyakan suatu pengertian, tujuan, manfaat, kata benda, baik abstrak maupun konkret

Lebih terperinci

TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA

TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian

Lebih terperinci

METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA

METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB RIYAN ADI LESMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENGEMBANGAN WORDNET BAHASA

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

BAB 3 PERANCANGAN SISTEM

BAB 3 PERANCANGAN SISTEM BAB 3 PERANCANGAN SISTEM Bab ini menguraikan perancangan sistem yang dikembangkan meliputi arsitektur sistem, perancangan pembuat unit pengindeksan dan perancangan antarmuka. 3.1 Arsitektur Sistem Gambar

Lebih terperinci

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,

Lebih terperinci

Rata-rata token unik tiap dokumen

Rata-rata token unik tiap dokumen Percobaan Tujuan percobaan ini adalah untuk mengetahui kinerja algoritme pengoreksian ejaan Damerau Levenshtein. Akan dilihat apakah algoritme tersebut dapat memberikan usulan kata yang cukup baik untuk

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Identifikasi Masalah Merumuskan Masalah Study Literatur Perancangan Struktur Menu Interface Analisa

Lebih terperinci

PEMBOBOTAN DALAM PROSES PENGINDEKSAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN FRAMEWORK INDRI HENDREX HERDI

PEMBOBOTAN DALAM PROSES PENGINDEKSAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN FRAMEWORK INDRI HENDREX HERDI PEMBOBOTAN DALAM PROSES PENGINDEKSAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN FRAMEWORK INDRI HENDREX HERDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN PENDEKATAN BOOLEAN LEONARDO SIAGIAN

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN PENDEKATAN BOOLEAN LEONARDO SIAGIAN EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN PENDEKATAN BOOLEAN LEONARDO SIAGIAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL

TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL MICHAEL SENNA SAPUTRA NIM. 1008605062 PROGRAM STUDI TEKNIK

Lebih terperinci

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: KHOZINATUL

Lebih terperinci

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka

Lebih terperinci

PENGEMBANGAN SISTEM TEMU KEMBALI INFORMASI ARTIKEL JURNAL DIGITAL DI PDII LIPI SJAEFUL AFANDI

PENGEMBANGAN SISTEM TEMU KEMBALI INFORMASI ARTIKEL JURNAL DIGITAL DI PDII LIPI SJAEFUL AFANDI PENGEMBANGAN SISTEM TEMU KEMBALI INFORMASI ARTIKEL JURNAL DIGITAL DI PDII LIPI SJAEFUL AFANDI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI TUGAS AKHIR DAN SUMBER INFORMASI

Lebih terperinci

MANAJEMEN RISIKO DI PERUSAHAAN BETON (STUDI KASUS UNIT READYMIX PT BETON INDONESIA) MUAMMAR TAWARUDDIN AKBAR

MANAJEMEN RISIKO DI PERUSAHAAN BETON (STUDI KASUS UNIT READYMIX PT BETON INDONESIA) MUAMMAR TAWARUDDIN AKBAR MANAJEMEN RISIKO DI PERUSAHAAN BETON (STUDI KASUS UNIT READYMIX PT BETON INDONESIA) MUAMMAR TAWARUDDIN AKBAR SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi Penelitian adalah sekumpulan peraturan, kegiatan, dan prosedur yang digunakan oleh pelaku suatu disiplin ilmu. Metodologi juga merupakan analisis teoritis mengenai

Lebih terperinci

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL Susetyo Adi Nugroho () Abstrak: Salah satu metode yang sering digunakan dalam mengukur relevansi dokumen

Lebih terperinci

HASIL DAN PEMBAHASAN. B fch a. d b

HASIL DAN PEMBAHASAN. B fch a. d b 7 dengan nilai σ yang digunakan pada tahap pelatihan sebelumnya. Selanjutnya dilakukan perhitungan tingkat akurasi SVM terhadap citra yang telah diprediksi secara benar dan tidak benar oleh model klasifikasi.

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN Pada bab ini dipaparkan latar belakang penelitian, rumusan masalah, tujuan penelitian, ruang lingkup penelitian, tahapan penelitian, dan sistematika penulisan laporan. 1.1 Latar Belakang

Lebih terperinci

HASIL DAN PEMBAHASAN. Praproses

HASIL DAN PEMBAHASAN. Praproses 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Sumber informasi atau referensi sudah merupakan hal yang tidak asing lagi bagi seorang peneliti, terutamanya bagi para mahasiswa yang sedang melakukan penelitian untuk

Lebih terperinci

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA Aida Indriani ) ) Teknik Informatika STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso 8, Tarakan 77 Email

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

1. Pendahuluan. 1.1 Latar belakang

1. Pendahuluan. 1.1 Latar belakang 1. Pendahuluan 1.1 Latar belakang Pada saat ini, kebutuhan setiap individu terhadap Internet semakin meningkat. Hal ini terlihat dari semakin banyaknya fasilitas yang ditawarkan dari dunia Internet itu

Lebih terperinci

APLIKASI PENGOLAHAN DATA OPERASIONAL KENDARAAN PADA CV. ANEKA USAHA BERBASIS WEB LAPORAN AKHIR

APLIKASI PENGOLAHAN DATA OPERASIONAL KENDARAAN PADA CV. ANEKA USAHA BERBASIS WEB LAPORAN AKHIR APLIKASI PENGOLAHAN DATA OPERASIONAL KENDARAAN PADA CV. ANEKA USAHA BERBASIS WEB LAPORAN AKHIR Disusun Dalam Rangka Memenuhi Syarat Menyelesaikan Pendidikan Diploma III Jurusan Manajemen Informatika Politeknik

Lebih terperinci

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document Jurnal Ilmiah Widya Teknik Volume 15 Nomor 2 2016 ISSN 1412-7350 SISTEM PEMEROLEHAN INFORMASI UNDANG-UNDANG DAN KASUS MENGGUNAKAN STRUKTUR DATA INVERTED INDEX DENGAN PEMBOBOTAN TF-IDF Fredes Winda Oktaviani

Lebih terperinci

Mengenal Information Retrieval

Mengenal Information Retrieval STBI-2011 Sistem Temu Balik Informasi 2011 Mengenal Information Retrieval Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress.com 2 3 Amazon.com 4 Amazon.com 5 6 7 8 9 Wordpress.com

Lebih terperinci

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah 1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

4 HASIL DAN PEMBAHASAN

4 HASIL DAN PEMBAHASAN 4 HASIL DAN PEMBAHASAN Penelitian ini dibuat menggunakan bahasa pemrograman PHP untuk tahapan praproses data, implementasi algoritme DIG dan pembangkitan metafile penyusun struktur digraf. Representasi

Lebih terperinci

PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI

PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan

Lebih terperinci

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal

Lebih terperinci

KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA

KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

RELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR

RELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR RELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR Julio Adisantoso, Ahmad Ridha, Andika Wahyu Agusetyawan Staf Departemen Ilmu Komputer, Fakultas Matematika

Lebih terperinci

RDF RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA DENGAN PEMBOBOTAN PER KONTEKS REZA KEMAL ZAEN

RDF RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA DENGAN PEMBOBOTAN PER KONTEKS REZA KEMAL ZAEN RDF RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA DENGAN PEMBOBOTAN PER KONTEKS REZA KEMAL ZAEN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015 PERNYATAAN

Lebih terperinci

PEMBUATAN RESULT SNIPPET PADA MESIN PENCARI BERBAHASA INDONESIA DENGAN MENGGUNAKAN PSEUDO-RELEVANCE FEEDBACK MUHAMMAD GINANJAR RAMADHAN

PEMBUATAN RESULT SNIPPET PADA MESIN PENCARI BERBAHASA INDONESIA DENGAN MENGGUNAKAN PSEUDO-RELEVANCE FEEDBACK MUHAMMAD GINANJAR RAMADHAN PEMBUATAN RESULT SNIPPET PADA MESIN PENCARI BERBAHASA INDONESIA DENGAN MENGGUNAKAN PSEUDO-RELEVANCE FEEDBACK MUHAMMAD GINANJAR RAMADHAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci