beberapa tag-tag lain yang lebih spesifik di dalamnya.

Ukuran: px
Mulai penontonan dengan halaman:

Download "beberapa tag-tag lain yang lebih spesifik di dalamnya."

Transkripsi

1 metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista Bussiness SP2 sebagai sistem operasi, 2. Strawberry-perl 5... sebagai interpreter bahasa pemrograman perl yang digunakan, 3. Apache xampp-win sebagai web server, 4. Notepad , dan 5. Microsoft Excell 27 sebagai aplikasi yang digunakan untuk melakukan perhitungan dalam evaluasi sistem. Perangkat keras yang digunakan untuk penelitian meliputi:. Intel(R) Core(TM) 2 Duo 2. RAM 2 GB, 3. Harddisk dengan kapasitas 6 GB. HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Penelitian ini menggunakan 2 buah dokumen yang berasal dari Laboratorium Temu Kembali Ilmu Komputer IPB. Deskripsi dari dokumen ini dapat dilihat pada Tabel. Tabel Deskripsi dokumen pengujian Uraian Ukuran keseluruhan dokumen Nilai (byte) Ukuran rata-rata dokumen 3236 Ukuran dokumen terbesar Ukuran dokumen terkecil 42 Contoh dari dokumen pengujian dapat dilihat pada Lampiran 2. Dokumen ini merupakan dokumen plain-text yang memilki struktur XML di dalamnya. Isi dari dokumen dikelompokan ke dalam tag-tag sebagai berikut: <DOC></DOC>, tag ini mewakili keseluruhan dokumen. Tag ini melingkupi beberapa tag-tag lain yang lebih spesifik di dalamnya. <DOCNO></DOCNO>, tag ini menunjukkan ID dari dokumen. ID yang ada merupakan kombinasi dari nama sumber berita, tanggal berita, urutan berita dengan sumber dan tanggal yang sama. <DATE></DATE>, menunjukkan tanggal dari berita <AUTHOR></AUTHOR>, menunjukkan penulis dari berita tersebut. <TEXT></TEXT>, tag ini menunjukkan isi dari dokumen. Pengembangan Sistem. Pengindeksan Modul paling awal yang dikerjakan dalam pengembangan sistem ini ialah modul pengindeksan dokumen. Pengindeksan dokumen yang dilakukan meliputi proses tokenisasi, pembuangan stopword, dan pembobotan dengan menggunakan metode pembobotan tf-idf. Tokenisasi merupakan proses yang dilakukan untuk memecah isi dokumen menjadi token-token. Proses tokenisasi dilakukan berdasarkan langkah-langkah berikut: Proses tokenisasi tidak dilakukan pada seluruh bagian dokumen, tetapi hanya pada bagian yang diapit oleh tag-tag <TITLE><TITLE> dan <TEXT></TEXT>. Gambar 2 menunjukkan ilustrasi bagianbagian dokumen yang diproses. Semua huruf dalam dokumen diubah menjadi huruf kecil. Penyeragaman ini dilakukan agar token yang sama namun memiliki besar kecil huruf yang berbeda tidak dianggap menjadi token-token yang berbeda. Karakter-karakter yang akan yang akan dijadikan sebagai pemisah token didefinisikan dengan ekspresi regular berikut: [\s+\/%,.\"\];()*<>&\':=`?\[!@]+ Selanjutnya pembuangan stopword dilakukan pada hasil tokenisasi dokumen. Hal ini bertujuan untuk menghilangkan kata-kata yang dianggap tidak penting seperti: kata sambung, kata keterangan, kata depan, kata ganti, kata dengan partikel (-lah, -kah, -pun), dan kata-kata tidak penting lainnya yang mempunyai frekuensi kemunculan tinggi. Kata-kata tersebut dianggap tidak penting karena dianggap kurang bisa mencirikan dokumen yang mengandungnya. Sebagai 5

2 contoh: kata adalah merupakan kata yang tidak penting. Kata ini mungkin terdapat hampir di setiap dokumen sehingga tak dapat mencirikan dokumen tertentu. <DOC> <DOCNO>situshijau863-2</DOCNO> <TITLE> Ditunggu, PP Pembebasan </TITLE> <DATE>Kamis, 5 Februari 2</DATE> <AUTHOR>Ely</AUTHOR> <TEXT> Pemerintah hendaknya segera </TEXT> </DOC> bagian dokumen yang digunakan untuk proses tokenisasi Gambar 2 Bagian dokumen yang diproses Setelah dilakukan tokenisasi berikut pembuangan stopword, token-token yang dihasilkan akan diberi bobot tertentu. Metode pembobotan yang digunakan ialah metode pembobotan tf-idf. Pembobotan dilakukan dengan menggunakan lima fungsi utama dari program pengindeksan yang diberi nama Indexing.pl. Kelima fungsi utama tersebut antara lain: Fungsi untuk mendapatkan frekuensi tiap token di dalam setiap dokumen (TF). Fungsi untuk mendapatkan jumlah dokumen yang mengandung token tertentu (DF). Fungsi untuk mendapatkan nilai IDF (Inverse document frequency) dari setiap token. Nilai IDF ini didapatkan dengan menggunakan rumus: idf t = log df t N dengan df t merupakan nilai df (jumlah dokumen yang mengandung token tertentu) dan N merupakan jumlah dokumen yang ada dalam koleksi. Fungsi untuk mendapatkan nilai tf-idf dari setiap token. Nilai tf-idf ini didapatkan dengan menggunakan rumus: tf-idf t = tf t * idf t dengan tf merupakan frekuensi kemunculan kata dalam dokumen dan idf merupakan nilai invers document frequency dari kata tersebut. Fungsi untuk mengetahui panjang dari masing-masing dokumen. Nilai ini diperlukan karena dokumen pengujian dimodelkan menjadi ruang vektor (vektor space model). Nilai-nilai yang dihasilkan setiap fungsi disimpan dalam bentuk file hash dengan ekstension.dat. Dalam pemrograman perl file ini dapat langsung digunakan dengan menggunakan fungsi retrieve (). Hash yang sebelumnya sudah dibuat akan disimpan di-memory. Jadi lebih mudah dan cepat untuk menggunakan hash berukuran besar dalam program yang berbeda. Sebagai contoh, jika ingin mendapatkan nilai IDF dari suatu kata, maka dapat digunakan cuplikan program yang ada pada Modul. Modul # retrieve hasil pengindeksan my $indexingresult = retrieve( Stored File/IndexingResult.dat ) or die $!; # nilai IDF hasil pengindeksan my %idfterm = ${$IndexingResult->{ idf }}; # nilai Idf untuk kata tani $tani_idf = $idfterm{ tani } ; 2. Penerjemahan Kamus Dwibahasa Penerjemahan kamus dwibahasa dilakukan dengan tujuan mendapatkan istilah lain dengan makna yang sama atau berkaitan dengan kueri awal. Penerjemahan dilakukan dengan mengikuti Algoritme. Algoritme Untuk setiap kata dalam kueri lakukan: Ambil hasil terjemahan dari kamus Indonesia-Inggris. Untuk setiap kata hasil penerjamahan, lakukan: Ambil hasil terjemahan dari kamus Inggris- Indonesia. 6

3 Algoritme merupakan algoritme yang sama yang digunakan oleh Sitohang (29) dalam mendapatkan istilah ekspansi bagi penelitiannya. Selain menggunakan algoritme yang sama, penelitian ini juga menggunakan kamus yang sama untuk melakukan penerjemahan kueri awal. Penerjemahan kueri akan dilakukan sebanyak pencarian yang dilakukan. Dengan demikian eksekusi kueri pada database juga akan dilakukan dalam jumlah yang sama. Penggunaan database untuk penerjemahan ini akan memperbanyak waktu yang dibutuhkan untuk melakukan pencarian. Jadi perlu dicari bentuk penerjemahan yang lebih baik untuk mengoptimalkan waktu pencarian. Untuk membuatnya lebih efisien, penggunaan database akan digantikan dengan hash. Hal ini hampir serupa dengan penggunaan hash pada modul pengindeksan. Untuk melakukan penerjemahan hal yang perlu dilakukan hanyalah mengakses alamat dari hash tersebut. Contoh yang sederhana dari penggunaan hash ini dapat dilihat pada cuplikan program berikut: $transpetani= $hk{ petani }; Cuplikan program ini akan mengembalikan hasil penerjemahan dengan kamus dwibahasa ke variabel $transpetani. Cara ini dianggap lebih efisien daripada harus melakukan eksekusi kueri pada tiap kata yang ingin diterjemahkan. Untuk mengubah bentuk kamus yang berupa database menjadi bentuk hash digunakan sebuah program sederhana gethashkamus.pl. Program ini melakukan penerjemahan berdasarkan Algoritme. Hasil penerjemahan diberikan dalam bentuk array seperti ilustrasi pada Modul 2. Modul 2 $hk{menyandang}[]= mengangkat $hk{menyandang}[]= membawa $hk{menyandang}[]= memenangkan $hk{menyandang}[]= menggotong $hk{menyandang}[]= menerima $hk{menyandang}[]= meloloskan Hasil penerjemahan serupa yang dilakukan pada beberapa kata dalam kueri uji dapat dilihat pada Lampiran Penghitungan Peluang Bersyarat Istilah-istilah baru yang didapatkan dari proses penerjemahan tidaklah dapat digunakan semuanya. Penambahan istilah ekspansi yang terlalu banyak hanya akan mengurangi kinerja sistem temu kembali. Untuk itu diperlukan suatu ukuran untuk dapat memilih istilah ekspansi yang dapat digunakan. Ukuran yang digunakan dalam penelitian ini ialah peluang bersyarat kemunculan bersama antara kueri dan istilah ekspansinya. Peluang bersyarat ini akan menggambarkan suatu keterkaitan antara kata dalam kueri awal dan hasil terjemahannya. Ilustrasi penentuan nilai peluang bersyarat antara kata hujan dengan istilah hasil terjemahannya dapat dilihat pada Modul 3. Modul 3 $hexp{hujan}{awan}=.9 $hexp{hujan}{megnhujani}= $hexp{hujan}{menghujan}= $hexp{hujan}{musim}=.336 Selanjutnya akan dipilih tiga istilah dengan nilai peluang bersyarat tertinggi serta nilai peluang bersyaratnya >. Hasilnya disimpan dalam sebuah file yang berisi hash dengan struktur yang dapat diilustrasikan pada Modul 4. Modul 4 $hexp{hujan}[]= musim $hexp{hujan}[]= awan 4. Pencarian Dokumen Proses pencarian dokumen dilakukan sesuai dengan pilihan tindakan ekspansi yang dipilih oleh pengguna. Terdapat empat pilihan tindakan ekspansi di dalam sistem ini, di antaranya: pencarian tanpa melakukan ekspansi pada kueri, satu istilah ekspansi, dua istilah ekspansi, dan tiga istilah ekspansi. Masing-masing angka di atas menunjukkan jumlah istilah ekspansi yang ditambahkan pada tiap kata dalam kueri awal. Hasil dari proses pencarian dokumen merupakan dokumen-dokumen yang dianggap memiliki kemiripan dengan kueri yang diberikan atau memiliki nilai ukuran kesamaan >. Pemeringkatan dokumen hasil pencarian juga dilakukan dan disajikan berdasarkan urutan menurun dari nilai ukuran kesamaannya. 7

4 Pengujian Kinerja Sistem. Pengujian Presisi Pencarian Dokumen Proses evaluasi dalam penelitian ini menggunakan 3 kueri uji yang telah ada sebelumnya berikut dokumen-dokumen yang relevan dengannya. Pencarian dengan kueri uji ini dilakukan dengan tujuan mendapatkan nilai recall dan precision dari sistem. Nilainilai ini diukur dari setiap dokumen yang dihasilkan dari proses pencarian atau yang memiliki ukuran kesamaan >. Setelah didapatkan nilai-nilai recall dan precisionnya, interpolasi dilakukan untuk mendapatkan nilai average precision yang akan menggambarkan bagaimana kinerja dari sistem secara keseluruhan. Pada tahap awal akan dihitung hasil pengujian untuk pencarian dokumen tanpa melakukan ekspansi (). Gambar 3 merupakan grafik recall dan precision untuk hasil pencarian tanpa ekspansi dari ke-3 kueri uji yang ada.,9,8,7,6,5,4,4,5,6,7,8,9 Gambar 3 Grafik Nilai recall dan precision dari pencarian tanpa ekspansi () Nilai recall dan precision dari pencarian tanpa ekspansi ini akan digunakan sebagai pembanding oleh pencarian yang menggunakan ekspansi, baik satu, dua, maupun pencarian yang menggunakan tiga buah ekspansi dari setiap kata dalam kueri awal. Nilai recall yang dihasilkan dari menu pencarian ini rata-rata sebesar,975. Nilai average precision (AVP) dari menu pencarian ini sebesar,53. Hal ini menunjukkan bahwa pencarian tanpa ekspansi yang dilakukan sistem ini rata-rata menemukembalikan 97,5% dokumen relevan dari semua dokumen relevan yang ada dalam koleksi dokumen. Tiga kondisi pengujian selanjutnya yakni QE, QE2, dan QE3 merupakan pengujian untuk pencarian yang dilakukan dengan menambahkan istilah ekspansi pada kueri awal. Hasil dari masing-masing pengujian akan dibandingkan dengan pencarian tanpa ekspansi (). a. QE dibandingkan dengan QE merupakan kondisi pengujian dengan melakukan pencarian dokumen disertai dengan penambahan satu istilah ekspansi pada masing-masing kata dalam kueri awal. Istilah yang ditambahkan tidak lain adalah istilah terjemahan masing-masing kata yang memiliki nilai peluang bersyarat tertinggi. QE menghasilkan pencarian dengan nilai recall rata-rata sebesar.982. Hal ini menunjukkan bahwa 98,2% dari total dokumen relevan yang ada dalam koleksi dokumen dihasilkan dari tiap pencarian dengan kueri uji. Nilai ini lebih tinggi,7% dibandingkan pencarian yang dilakukan tanpa penambahan istilah ekspansi. Walaupun dapat meningkatkan nilai recall, pencarian dengan kondisi ini dapat menurunkan nilai presisi dari hasil pencarian. Nilai AVP dari kondisi pencarian ini ialah sebesar.487 atau.43 lebih rendah daripada nilai AVP yang dimiliki pencarian tanpa tambahan istilah ekspansi (). Grafik perbandingan nilai presisi pencarian antara QE dan dapat dilihat pada Gambar 4.,9,8,7,6,5,4 QE,4,5,6,7,8,9 Gambar 4 Grafik nilai recall dan precision pada pencarian QE dibandingkan dengan b. QE2 dibandingkan dengan Kondisi pengujian ini melakukan pencarian dengan menambahkan dua istilah ekspansi pada setiap kata dalam kueri awal. Hasil pencarian QE2 menghasilkan nilai recall rata-rata sebesar,982. Dengan melihat nilai recall yang dimilikinya dapat diketahui bahwa rata-rata 98,2% dari total dokumen 8

5 relevan yang ada dalam koleksi dokumen dapat dihasilkan dari tiap pencarian. Namun, seperti halnya QE, penambahan dua istilah ekspansi pada setiap kata dalam kueri awal ini dapat pula menurunkan nilai presisi pencarian jika dibandingkan dengan pencarian tanpa ekspansi (). Dengan kondisi pencarian QE2 terjadi penurunan nilai presisi menjadi.453. Penurunan ini malah lebih parah jika dibandingkan dengan QE. Grafik perbandingan nilai presisi pancarian antara QE2 dengan dapat dilihat pada Gambar 5.,9,8,7,6,5,4 QE2,4,5,6,7,8,9 Gambar 5 Grafik nilai recall dan precision pada pencarian QE2 dibandingkan dengan c. QE3 dibandingkan dengan Seperti halnya QE2 dan QE, QE3 juga melakukan pencarian yang disertai dengan penambahan istilah ekspansi pada setiap kata dalam kueri awal. Jumlah istilah yang ditambahkan pada kondisi pencarian QE3 ialah sebanyak tiga istilah ekspansi pada masing-masing kata dalam kueri awal. Hasil pencarian QE3 dapat memberikan nilai recall rata-rata sebesar.983. Sebesar 98,3% dari total dokumen relevan dapat dikembalikan dengan kondisi pencarian QE3. Nilai ini lebih tinggi dibandingkan tiga kondisi pencarian lainnya yakni, QE, dan QE2. Walaupun demikian nilai presisi atau precision yang dihasilkan dari kondisi pencarian ini merupakan yang terendah dibandingkan dengan tiga kondisi pencarian lainnya. Nilai precision yang dihasilkan dari kondisi pencarian QE3 ialah sebesar.435. Grafik perbandingan nilai recall dan precision dari dan QE3 dapat dilihat pada Gambar 6. Tabel 2 akan menampilkan nilai rata-rata recall dan AVP untuk masing-masing kondisi pencarian, QE, QE2, dan QE3. Tabel 2 juga menunjukkan bahwa semakin banyak istilah ekspansi yang ditambahkan pada kueri awal maka semakin tinggi rata-rata nilai recall hasil pencariannya. Dapat pula dikatakan akan semakin banyak dokumen relevan yang ditemukembalikan pada hasil pencarian. Meskipun banyak dokumen relevan yang ditemukembalikan, namun penurunan nilai precision dari hasil pencarian tetap terjadi. Hal ini dikarenakan penambahan istilah yang dilakukan mengakibatkan dokumen-dokumen yang tak relevan juga ikut ditemukembalikan oleh sistem. Dokumen-dokumen tak relevan ini sebagian menempati peringkat yang lebih tinggi daripada dokumen relevan yang ditemukembalikan sehingga nilai precision menjadi lebih rendah dibandingkan dengan pencarian yang tidak menggunakan penambahan istilah ekspansi.,9,8,7,6,5,4 QE3,4,5,6,7,8,9 Gambar 6 Grafik nilai recall dan precision pada pencarian QE3 dibandingkan dengan Tabel 2 Nilai recall dan AVP semua kondisi pencarian Kondisi Nilai Nilai AVP Pencarian QE QE QE Pengujian Waktu Pencarian Dokumen Pengujian Untuk setiap kueri pengujian yang ada dalam Lampiran, dilakukan pencarian sebanyak lima kali ulangan. Hasil yang diperolah yakni tidak ditemukannya pengaruh secara nyata dari banyaknya kata dalam kueri terhadap waktu yang dibutuhkan utnuk 9

6 melakukan sebuah pencarian. Hal ini tidak hanya berlaku untuk pencarian tanpa ekspansi (), tetapi juga untuk pencarian yang dilakukan dengan menggunakan ekspansi (QE, QE2, dan QE3). Kelemahan Sistem Salah satu kelemahan utama dari sistem yang dikembangkan yakni algoritme penerjemahan yang digunakan. Algoritme penerjemahan yang ada dalam penelitian ini terkadang menghasilkan istilah ekspansi yang terlihat seperti hanya diberi imbuhan dan bukan diterjemahkan. Pada Lampiran 3 dapat dilihat beberapa kata yang diterjemahkan menjadi kata awal yang hanya diberi imbuhan saja. Beberapa dari kata tersebut ditunjukkan pada Tabel 3. Selain itu algoritme penerjemahan yang digunakan merupakan penerjemahan word-byword atau penerjemahan kata-per-kata. Dengan penerjemahan seperti ini, dua kata yang merupakan frase akan dikenali sebagai dua kata terpisah tanpa ada keterkaitan. Untuk mengujinya, penulis memasukkan kata rumah sakit. Terjemahan yang diharapkan untuk kata ini ialah hospital. Lain halnya dengan hasil yang didapatkan dengan algoritme penerjemahan ini. Kata terjemahan yang dihasilkan ialah house dan ill. Jadi penerjemahan dilakukan secara terpisah untuk masing-masing kata rumah dan sakit. Tabel 3 Penerjemahan yang menghasilkan kata berimbuhan dari kata awal kueri pupuk harga Tani Istilah terjemahan Memupuk Dihargai, menghargai, berharga Petani Analisis Perbandingan Pemilihan Istilah Ekspansi Penelitian ini menggunakan metode ekspansi kueri yang sama dengan ekspansi kueri yang dilakukan oleh Sitohang (29). Namun penelitian ini memiliki beberapa perbedaan dalam hal metode pemilihan istilah ekspansi yang digunakan. Sitohang (29) menggunakan nilai IDF sebagai ukuran utama untuk menentukan pemilihan istilah ekspansi yang akan ditambahkan pada kueri awal, sedangkan penelitian ini menggunakan peluang kejadian bersama antara dua istilah. Penelitian Sitohang (29) hanya menunjukkan 2 dari 3 kueri uji yang mengalami peningkatan nilai AVP setelah dilakukan ekspansi kueri terhadapnya. Peningkatan tersebut terjadi pada penambahan satu istilah ekspansi pada masing-masing kata pada kueri awal. Pada penelitian ini keberhasilan kueri uji dalam meningkatkan nilai AVP terjadi pada setiap kondisi pengujian. QE menunjukkan bahwa 7 dari 3 kueri pengujian mengalami peningkatan AVP. QE2 menunjukkan bahwa 7 dari 3 kueri uji mengalami peningkatan nilai AVP dan kondisi pengujian QE3 menunjukkan bahwa 5 dari 3 kueri mengalami peningkatan nilai AVP. Perbandingan nilai AVP untuk tiap kondisi pengujian dapat dilihat pada Tabel 4. Tabel 4 Perbandingan nilai AVP dari kedua sistem Kondisi Pengujian Average Pemilihan dengan Nilai IDF Pemilihan dengan Peluang bersyarat QE QE QE Pada Tabel 4 dapat dilihat bahwa pada tiap kondisi pengujian yang sama penggunaan peluang bersyarat memberikan hasil yang lebih tinggi. Pada pengujian sistem ini memiliki nilai AVP yang lebih tinggi daripada sistem yang dikembangkan dalam penelitian Sitohang (29). Hal ini dapat disebabkan perlakuan tokenisasi yang berbeda pada saat proses pengindeksan dokumen. Selain itu penelitian ini juga menggunakan pembuangan stopword dengan daftar stopword yang berbeda. Proses pengindeksan yang dilakukan Sitohang(29) menghasilkan istilah berbeda dari dokumen pengujian. Sementara penelitian ini menghasilkan istilah berbeda dari penggunaan dokumen pengujian yang sama. Hasil yang lebih tinggi juga terdapat pada nilai AVP pencarian yang menggunakan tambahan istilah ekspansi. Baik QE, QE2,

7 maupun QE3 memperlihatkan bahwa ekspansi yang dilakukan pada penelitian ini memiliki hasil yang lebih baik daripada penelitian Sitohang (29). Penelitian ini menggunakan metode yang sama dalam mendapatkan istilah ekspansinya yakni dengan menggunakan metode penerjemahan kamus dwibahasa. Dengan metode ini kedua penelitian menghasilkan sejumlah istilah yang sama yang dapat ditambahkan ke dalam kueri awal. Kedua penelitian ini menjadi berbeda ketika akan memilih istilah mana saja yang akan ditambahkan ke dalam kueri. Sitohang (29) memilih nilai IDF sebagai ukuran untuk memilih istilah terjemahan yang akan ditambahkan ke dalam kueri. Nilai IDF merupakan nilai yang menunjukkan tingkat kepentingan suatu kata dalam koleksi. Semakin tinggi nilai IDF berarti semakin jarang kata itu muncul di banyak dokumen dan semakin mungkin kata itu dapat digunakan untuk mencirikan suatu dokumen. Dengan mengunakan nilai IDF sebagai pemilihan istilah ekspansi berarti mengambil istilah terjemahan yang merupakan kata terpenting untuk ditambahkan ke dalam kueri awal. Mengingat algoritme penerjemahan yang kurang baik digunakan dalam penelitiannya maka tingkat kepentingan kata menjadi kurang berarti. Peluang bersyarat yang digunakan dalam penelitian ini dapat sedikit mengatasi masalah penerjemahan tersebut. Walaupun hasil terjemahan yang didapat kurang mencapai konsep kueri, namun dengan peluang bersyarat pencarian akan tetap berada pada sekitar kata yang memiliki keterkaitan dengan kueri awal. Pengujian pada koleksi dokumen yang lebih besar Pengujian ini menggunakan tambahan dokumen lagi pada koleksi dokumen sebelumnya. Total 2 dokumen digunakan pada pengujian ini. Pengujian ini juga menggunakan kueri-kueri yang telah ditentukan dokumen-dokumen mana yang relevan dengannya. Ternyata sistem memperlihatkan penurunan presisi pencarian jika dilakukan penambahan dokumen terhadapnya. Tabel 5 di bawah ini akan memperlihatkan perbandingan nilai presisi sistem pada penggunaan dan 2 dokumen. Tabel 5 Perbandingan nilai presisi sistem pada penggunaan dan 2 dokumen. Kondisi Pengujian Average dokumen 2 dokumen QE QE QE Kesimpulan KESIMPULAN DAN SARAN Hasil penelitian ini menunjukkan bahwa:. Ekspansi kueri yang dilakukan pada sistem ini akan mengakibatkan menurunnya nilai presisi bila dibandingkan dengan pencarian tanpa melakukan ekspansi kueri. 2. Metode pemilihan istilah ekspansi dengan peluang bersyarat relatif lebih baik jika dibandingkan dengan penggunaan nilai IDF pada metode ekspansi yang sama, yakni metode penerjemahan kamus dwibahasa. 3. Banyaknya kata dalam kueri tidak memiliki pengaruh secara nyata terhadap waktu pencarian sistem. Saran Untuk penelitian-penelitian yang berkaitan dengan ekspansi kueri, disarankan untuk melakukan penelitian dengan:. Penggunaan koleksi dokumen yang lebih besar 2. Penggunaan metode pembobotan lainnya, seperti BM25. DAFTAR PUSTAKA Adisantoso J Temu Kembali Infomasi Menggunakan Peluang Bersyarat. Tesis. Program Studi Ilmu Komputer Universitas Indonesia. Jakarta. Aly AA. 28. Using a Query Expansion Technique to Improve Document Retrieval. Information Technologies and Knowledge, vol. 2. Baeza-Yates R, Riberio-Neito B Modern Information Retrieval. New York, Adison Weasley.

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j 3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan

Lebih terperinci

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya. beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini

Lebih terperinci

EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA

EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011

Lebih terperinci

HASIL DAN PEMBAHASAN. sim(, )=

HASIL DAN PEMBAHASAN. sim(, )= 4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i

Lebih terperinci

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita 6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Identifikasi Masalah Merumuskan Masalah Study Literatur Perancangan Struktur Menu Interface Analisa

Lebih terperinci

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA Fridolin Febrianto Paiki Universitas Papua, Jl. Gunung Salju, Amban, Manokwari ff.paiki@unipa.ac.id

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi Penelitian adalah sekumpulan peraturan, kegiatan, dan prosedur yang digunakan oleh pelaku suatu disiplin ilmu. Metodologi juga merupakan analisis teoritis mengenai

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.

Lebih terperinci

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen 6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat

Lebih terperinci

2. Ketepatan untuk setiap jawaban.

2. Ketepatan untuk setiap jawaban. dikembalikan sebagai top passage dari kueri pertanyaan yang diberikan. 5. Ekstraksi Jawaban Top passages yang diperoleh dilakukan perhitungan terhadap jarak kata. Entitas yang memiliki jarak terpendek

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian

Lebih terperinci

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 XML RETRIEVAL UNTUK DOKUMEN

Lebih terperinci

EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI

EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian menjelaskan bagaimana langkah-langkah atau tahapan-tahapan yang akan dilakukan dalam penelitian agar rumusan masalah penelitian dapat terselesaikan.

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi.

HASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi. 5 Mulai HASIL DAN PEMBAHASAN Kromosom P = rand [0,1] Ya P < Pm R = random Gen(r) dimutasi Selesai Tidak Gambar 7 Diagram alur proses mutasi. Hasil populasi baru yang terbentuk akan dievaluasi kembali dan

Lebih terperinci

BAB I PERSYARATAN PRODUK

BAB I PERSYARATAN PRODUK BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama

Lebih terperinci

V HASIL DAN PEMBAHASAN

V HASIL DAN PEMBAHASAN 22 V HASIL DAN PEMBAHASAN 5.1 Karakteristik Video dan Ektraksi Frame Video yang digunakan di dalam penelitian ini merupakan gabungan dari beberapa cuplikan video yang berbeda. Tujuan penggabungan beberapa

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &

Lebih terperinci

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian ini ada beberapa tahapan penelitian yang akan dilakukan seperti terlihat pada gambar 3.1 berikut : Mulai Identifikasi Masalah Pengumpulan Data Analisa Aplikasi

Lebih terperinci

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency PERSETUJUAI\ ARTIKEL ILMIAH Artikel ilmiah hasil penelitian mahasiswa: Nama NIM Mashar Eka Putra Dai 53 1409036 Program Studi S1-Sistem Informasi Jurusan Teknik Informatika Fakultas Teknik Judul Karya

Lebih terperinci

BAB 4 HASIL PENELITIAN DAN PEMBAHASAN. Berikut ini adalah contoh tampilan hasil dari kueri:

BAB 4 HASIL PENELITIAN DAN PEMBAHASAN. Berikut ini adalah contoh tampilan hasil dari kueri: BAB 4 HASIL PENELITIAN DAN PEMBAHASAN 4.1 Proses Retrival Berikut ini adalah contoh tampilan hasil dari kueri: 1. Kategori Buah Gambar 4.1 Hasil kueri kategori buah dengan metode histogram warna 55 56

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka

Lebih terperinci

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan

Lebih terperinci

SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS

SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS Surya Agustian 1, Imelda Sukma Wulandari 2 1,2 Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, UIN

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak

SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF Muh. Alfarisi Ali¹, Moh. Hidayat Koniyo², Abd. Aziz Bouty³ ¹Mahasiswa Teknik Informatika Universitas

Lebih terperinci

Lingkungan Pengembangan HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Pengolahan Query

Lingkungan Pengembangan HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Pengolahan Query 5 Lingkungan Pengembangan Perangkat lunak yang digunakan dalam penelitian ialah: Sistem Operasi Windows 7. Sphinx Search. XAMPP versi 1.7.3. Named Entity Tagger bahasa Indonesia. Perangkat keras yang digunakan

Lebih terperinci

Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25

Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25 54 Widiasri, M., dkk.: Peningkatan Kinerja Pencarian Dokumen Tugas Akhir Menggunakan Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI

Lebih terperinci

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 1 PERBANDINGAN

Lebih terperinci

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI 18 PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI Karter D. Putung, Arie Lumenta, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi Manado, Indonesia. karterputung@gmail.com,

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN Pada bab ini akan dibahas mengenai analisa proses information retrieval dengan menggunakan cosine similarity dan analisa proses rekomendasi buku dengan menggunakan jaccard

Lebih terperinci

Identifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN

Identifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN 5 Identifikasi Tipe Pertanyaan Ada beberapa tipe pertanyaan yang digunakan dalam Bahasa Indonesia, yaitu: 1 APA, yang menanyakan suatu pengertian, tujuan, manfaat, kata benda, baik abstrak maupun konkret

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada era ini perkembangan teknologi informasi sangat pesat. Hal ini ditandai dengan semakin populernya penggunaan internet dan perangkat lunak komputer sebagai

Lebih terperinci

BAB 3 PERANCANGAN SISTEM

BAB 3 PERANCANGAN SISTEM BAB 3 PERANCANGAN SISTEM Bab ini menguraikan perancangan sistem yang dikembangkan meliputi arsitektur sistem, perancangan pembuat unit pengindeksan dan perancangan antarmuka. 3.1 Arsitektur Sistem Gambar

Lebih terperinci

Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor

Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor Persoalan 1: Ada 4 dokumen (D1 s.d D4): D1: dolar naik harga naik penghasilan turun D2: harga naik harusnya gaji juga naik D3: Premium tidak

Lebih terperinci

HASIL DAN PEMBAHASAN

HASIL DAN PEMBAHASAN 10 HASIL DAN PEMBAHASAN Pengumpulan Dokumen Tahapan awal yang dilakukan dalam penelitian adalah mengolah dokumen XML yang akan menjadi korpus. Terdapat 21578 dokumen berita yang terdiri atas 135 topik.

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN KAMUS DWIBAHASA NETTY LAORA SITOHANG

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN KAMUS DWIBAHASA NETTY LAORA SITOHANG EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN KAMUS DWIBAHASA NETTY LAORA SITOHANG DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUANN ALAM INSTITUT PERTANIAN

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

HASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan.

HASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan. 4 dan Thelen (2000) karena disesuaikan terhadap kaidah bahasa Indonesia. Rule yang dibuat Sianturi (2008) dan digunakan oleh Sanur (2011) memiliki notasi S sebagai sentence atau passage serta Q sebagai

Lebih terperinci

II TINJAUAN PUSTAKA. * adalah operasi konvolusi x dan y, adalah fungsi yang merepresentasikan citra output,

II TINJAUAN PUSTAKA. * adalah operasi konvolusi x dan y, adalah fungsi yang merepresentasikan citra output, 5 II INJAUAN PUSAKA.1 Fitur Scale Invariant Feature ransform (SIF) Fitur lokal ditentukan berdasarkan pada kemunculan sebuah objek pada lokasi tertentu di dalam frame. Fitur yang dimaksudkan haruslah bersifat

Lebih terperinci

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan

Lebih terperinci

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB IV IMPLEMENTASI DAN PENGUJIAN BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Setelah sistem dianalisa dan dilakukan perancangan secara rinci, maka tahap selanjutnya adalah implementasi. Implementasi merupakan tahap membuat sistem

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 1.1. Rancangan Penelitian Rancangan penelitian adalah rencana dan struktur penyelidikan yang disusun sedemikian rupa sehingga penelitian akan memperoleh jawaban untuk pertanyaan-pertanyaan

Lebih terperinci

Pemanfaatan Aljabar Vektor Pada Mesin Pencari

Pemanfaatan Aljabar Vektor Pada Mesin Pencari Pemanfaatan Aljabar Vektor Pada Mesin Pencari Anwar Ramadha 13514013 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Indonesia

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN Bab ini akan membahas tentang analisa dan perancangan aplikasi source detection pada kasus plagiarisme dokumen menggunakan biword winnowing dan retrieval berbasis Okapi BM25.

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :

Lebih terperinci

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,

Lebih terperinci

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang 58 BAB 3 METODE PENELITIAN 3.1 Analisis Masalah Seiring dengan perkembangan zaman, jumlah informasi yang disimpan dalam betuk digital semakin bertambah, sehingga dibutuhkan cara pengorganisasian dan pengelolaan

Lebih terperinci

III METODOLOGI PENELITIAN

III METODOLOGI PENELITIAN 13 III METODOLOGI PENELITIAN 3.1 Kerangka Penelitian Penelitian dilakukan dalam lima tahapan utama, yaitu ekstraksi frame video, ekstraksi fitur SIFT dari seluruh frame, pembentukan kantong kata visual

Lebih terperinci

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan

Lebih terperinci

PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN

PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi

Lebih terperinci

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Wahyudi,MT Laboratorium Sistem Informasi Fakultas Sains dan Teknologi UINSUSKA RIAU Jl.HR.Subrantas KM.15

Lebih terperinci

SISTEM TEMU KEMBALI INFORMASI

SISTEM TEMU KEMBALI INFORMASI SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah 1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari

Lebih terperinci

APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA

APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA Adhit Herwansyah Jurusan Sistem Informasi, Fakultas

Lebih terperinci

PROGRAM STUDI INFORMATIKA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA

PROGRAM STUDI INFORMATIKA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA PERBANDINGAN HASIL DETEKSI KEMIRIPAN TOPIK SKRIPSI DENGAN MENGGUNAKAN METODE N-GRAM DAN EKSPANSI KUERI Disusun oleh : Dwi iswanto L200100014 Pembimbing : Husni Thamrin PROGRAM STUDI INFORMATIKA FAKULTAS

Lebih terperinci

SISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR

SISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR SISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Pada Jurusan Teknik

Lebih terperinci

PENGEMBANGAN SISTEM TEMU KEMBALI INFORMASI DIGITAL FULLTEXT ARTIKEL JURNAL DI PDII LIPI

PENGEMBANGAN SISTEM TEMU KEMBALI INFORMASI DIGITAL FULLTEXT ARTIKEL JURNAL DI PDII LIPI PENGEMBANGAN SISTEM TEMU KEMBALI INFORMASI DIGITAL FULLTEXT ARTIKEL JURNAL DI PDII LIPI Sjaeful Afandi 1*, Firman Ardiansyah 2, Blasius Soedarsono 3 1 Magister Profesional Teknologi Informasi untuk Perpustakaan

Lebih terperinci

SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL

SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL Sistem Informasi Pengelolaan Arsip Statis... SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL Silmi Kafatan, Djalal Er Riyanto,

Lebih terperinci

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan pengetahuan dan kehidupan manusia sungguh dipercepat dengan kemudahan akses terhadap begitu banyak informasi. Pada beberapa waktu yang lalu akses terhadap

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

Data Mining. Tidak. Mulai. Data transaksi. Pembersihan data. Seleksi data. Transformasi data. Pemberian nilai minimum support

Data Mining. Tidak. Mulai. Data transaksi. Pembersihan data. Seleksi data. Transformasi data. Pemberian nilai minimum support 6 Representasi Pengetahuan Tahap ini merupakan tahap akhir dari proses KDD. Sederetan aturan atau rule disajikan kepada pengguna dengan menggunakan algoritme Rule Generation. Mulai Data transaksi Pembersihan

Lebih terperinci

BAB V IMPLEMENTASI DAN PENGUJIAN

BAB V IMPLEMENTASI DAN PENGUJIAN BAB V IMPLEMENTASI DAN PENGUJIAN Bab kelima ini berisi uraian hasil implementasi dan pengujian terhadap perangkat lunak yang dibuat pada tugas akhir ini. 5.1 Implementasi Sub bab ini mendeskripsikan hasil

Lebih terperinci

Rata-rata token unik tiap dokumen

Rata-rata token unik tiap dokumen Percobaan Tujuan percobaan ini adalah untuk mengetahui kinerja algoritme pengoreksian ejaan Damerau Levenshtein. Akan dilihat apakah algoritme tersebut dapat memberikan usulan kata yang cukup baik untuk

Lebih terperinci

BAB II ANALISIS DAN PERANCANGAN

BAB II ANALISIS DAN PERANCANGAN BAB II ANALISIS DAN PERANCANGAN 2.1 Analisis Sistem Pembuatan sistem kamus bahasa Sunda online, memerlukan perangkat keras dan perangkat lunak yang mendukung dalam pembuatan sistem tersebut. Adapun perangkat

Lebih terperinci

DAFTAR ISI. SKRIPSI... ii

DAFTAR ISI. SKRIPSI... ii DAFTAR ISI SKRIPSI... i SKRIPSI... ii HALAMAN PENGESAHAN... ii PERNYATAAN... iii HALAMAN MOTO DAN PERSEMBAHAN... iv PRAKATA... v DAFTAR ISI... vii DAFTAR GAMBAR... x DAFTAR TABEL... xiii INTISARI... xiv

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen

Lebih terperinci

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga 1 BAB I PENDAHULUAN A. Latar Belakang Dalam era teknologi informasi seperti saat ini, informasi berupa teks sudah tidak lagi selalu tersimpan dalam media cetak seperti kertas. Orang sudah mulai cenderung

Lebih terperinci

EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G

EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G64103024 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA DENGAN MEMPERKAYA QUERY MENGGUNAKAN PERSAMAAN KATA PADA TESAURUS

TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA DENGAN MEMPERKAYA QUERY MENGGUNAKAN PERSAMAAN KATA PADA TESAURUS TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA DENGAN MEMPERKAYA QUERY MENGGUNAKAN PERSAMAAN KATA PADA TESAURUS Hariyanto 1), Gian Sebastian Anjasmara 2), Nanang Taufan Budiansyah 3) Jurusan Teknik Informatika

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN 1 EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI DENGAN TESAURUS DAN BOBOT IRISAN MOHAMAD REZA PANCAWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer CORPUS DOKUMEN TEKS BAHASA INDONESIA UNTUK PENGUJIAN EFEKTIVITAS TEMU KEMBALI INFORMASI Oleh: Ir. Julio Adisantoso, M.Kom.

Lebih terperinci