EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA

Ukuran: px
Mulai penontonan dengan halaman:

Download "EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA"

Transkripsi

1 EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011

2 EKSPANSI KUERI BERDASARKAN KAMUS DWIBAHASA MENGGUNAKAN PELUANG BERSYARAT MUHAMMAD AWET SAMANA Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011

3 ABSTRACT MUHAMMAD AWET SAMANA. Query Expansion based on Bilingual Dictionary Using Conditional Probability. Supervised by JULIO ADISANTOSO. Query expansion is a technique that can be used to bridge vocabulary gaps between queries and documents in the collection. With query expansion, user will be helped to formulate queries well so that user will optimize the search result. In this study, the expansion term was resulted from the translation of bilingual dictionary. Subsequently, several terms of expansion were elected based on the closeness of its relationship with the original query. This research showed that conditional probability can be used to select expansion term in bilingual translation method query expansion. The result of 1000 documents was more than 97% relevan document can be retrieved by this system. The more expansion term used, the larger number relevan document was retrieved. Keyword: query expansion, conditional probability, query translation, bilingualism dictionary

4 Judul Nama NRP : Ekspansi Kueri Berdasarkan Kamus Dwibahasa Menggunakan Peluang Bersyarat : Muhammad Awet Samana : G Menyetujui: Pembimbing, Ir. Julio Adisantoso, M. Kom NIP Mengetahui: Ketua Departemen Ilmu Komputer, Dr. Ir. Sri Nurdiati, M.Sc. NIP Tanggal Lulus:

5 RIWAYAT HIDUP Penulis dilahirkan di Jakarta pada tanggal 14 Juni Penulis merupakan anak kedua dari empat bersaudara dari pasangan Muh. Wardani dan Budiyati. Pada Tahun 2006 penulis menamatkan pendidikannya dari SMA Islam Al Azhar Syifa Budi Jakarta dan diterima menjadi salah satu mahasiswa Institut Pertanian Bogor melalui jalur SPMB. Setahun kemudian penulis berhasil diterima menjadi salah satu mahasiswa Program Studi Ilmu Komputer IPB. Pada tahun 2008 penulis aktif di organisasi Himpunan Mahasiswa Ilmu Komputer (HIMALKOM) dan bergabung dengan divisi networking. Pada tahun yang sama penulis juga tergabung dalam organisasi Badan Kerohanian Ilmu Komputer (BANKERS) dan menjabat sebagai sekretaris umum.

6 KATA PENGANTAR Alhamdulillahirobbil alamin, segala puji syukur penulis panjatkan ke hadirat Allah SWT atas limpahan rahmat dan karunia-nya sehingga penulis dapat menyelesaikan skripsi yang berjudul Ekspansi Kueri Berdasarkan Kamus Dwibahasa Menggunakan Peluang Bersyarat. Penulis menyadari bahwa tugas akhir ini tidak akan terselesaikan tanpa bantuan dari berbagai pihak. Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada: 1. Orang tua tercinta, Kakak saya Adam Ginanjar, kedua adik yang saya sayangi Moch. Zarkasi dan Siti Tinitah serta segenap keluarga besar, terima kasih atas doa dan dukungan yang diberikan. 2. Bapak Ir. Julio Adisantoso, M.Kom selaku dosen pembimbing tugas akhir. Terima kasih atas kesabaran, bimbingan serta dukungan dalam penyelesaian tugas akhir ini. 3. Bapak Ahmad Ridha, S.Kom, MS dan Bapak Sony Hartono Wijaya, S. Kom, M.Kom selaku dosen penguji, Dr. Sri Nurdiati, MSc selaku Kepala Departemen Ilmu Komputer serta seluruh staf Departemen Ilmu Komputer FMIPA IPB. 4. Teman-teman satu bimbingan Hendrex, Wildan, Rio, Ekachu, Iyam, Tina, Yucan, dan Adit. Terima kasih atas semangat dan kebersamaannya selama penyelesaian tugas akhir ini. 5. Sahabat-sahabatku Sandi, Aadun, Windu, Ericson, Bayu dan seluruh sahabatku Ilkomerz 43. Terima kasih atas motivasi dan kebersamaannya selama ini. 6. Sahabat-sahabatku di Kontrakan Al Kautsar Adrian, Habib, Wahyu, Wiwid, Budi, Fandi, dan lain-lain. Terima kasih atas kebersamaan dan keceriannya selama ini. 7. Seluruh pihak yang turut membantu baik secara langsung maupun tidak langsung dalam pelaksanaan tugas akhir. Penulis menyadari bahwa dalam penulisan tugas akhir ini masih terdapat banyak kekurangan dan kelemahan di dalamnya. Hal ini dikarenakan oleh keterbatasan kemampuan penulis. Penulis berharap adanya masukan berupa saran atau kritik yang bersifat membangun dari pembaca demi kesempurnaan tugas akhir ini. Semoga tugas akhir ini bermanfaat. Bogor, Maret 2011 Muhammad Awet Samana

7 DAFTAR ISI Halaman DAFTAR GAMBAR... iv DAFTAR TABEL... iv DAFTAR LAMPIRAN... iv PENDAHULUAN Latar Belakang... 1 Tujuan... 1 Ruang Lingkup... 1 Manfaat... 2 TINJAUAN PUSTAKA Ekspansi Kueri... 2 Penerjemahan Kueri... 2 Peluang Bersyarat... 2 Ukuran Kemiripan Cosine... 3 Evaluasi Temu Kembali Informasi... 3 METODE PENELITIAN Perolehan Dokumen Pengujian... 3 Pengembangan Sistem... 3 Pengujian Kinerja Sistem... 4 Analisis Pembandingan Kinerja Sistem... 4 Lingkungan Implementasi... 5 HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian... 5 Pengembangan Sistem... 5 Pengujian Kinerja Sistem... 8 Kelemahan Sistem Analisis Perbandingan Pemilihan Istilah Ekspansi KESIMPULAN DAN SARAN Kesimpulan Saran DAFTAR PUSTAKA LAMPIRAN iii

8 DAFTAR GAMBAR Halaman 1 Gambaran umum sistem temu-kembali yang dikembangkan Bagian dokumen yang diproses Grafik Nilai recall dan precision dari pencarian tanpa ekspansi (QE0) Grafik nilai recall dan precision pada pencarian QE1 dibandingkan dengan QE Grafik nilai recall dan precision pada pencarian QE2 dibandingkan dengan QE Grafik nilai recall dan precision pada pencarian QE3 dibandingkan dengan QE DAFTAR TABEL Halaman 1 Deskripsi dokumen pengujian Nilai recall dan AVP semua kondisi pencarian Penerjemahan yang menghasilkan kata berimbuhan dari kata awal Perbandingan nilai AVP dari kedua sistem Perbandingan nilai presisi sistem pada penggunaan 1000 dan 2000 dokumen DAFTAR LAMPIRAN Halaman 1 Daftar Kueri untuk Pengujian Waktu Pencarian Sistem Contoh dokumen pengujian Daftar istilah kueri dan istilah hasil terjemahannya iv

9 Latar Belakang PENDAHULUAN Sistem temu kembali informasi merupakan suatu sistem yang dapat membantu seseorang dalam menemukan suatu informasi yang dibutuhkannya. Sistem ini memerlukan sebuah masukan (kueri) yang akan menjadi acuan dalam menemukan informasi. Dengan kueri tersebut, sistem akan menghasilkan dokumen relevan atau dokumen yang memunyai topik yang berkaitan dengan kebutuhan informasi pengguna. Seringkali pengguna mengalami kesulitan dalam membentuk kueri yang ditujukan untuk menemukembalikan informasi hal ini dikarenakan mereka tidak mengetahui detail dari konstruksi koleksi dan lingkungan temu kembali (Baeza-Yates & Ribeiro-Neito 1999). Padahal, jumlah dokumen relevan yang diperoleh dipengaruhi oleh jumlah kata kunci dalam kueri. Hal ini akan mengakibatkan hasil pencarian yang dilakukan pun menjadi kurang optimal. Ekspansi kueri merupakan salah satu teknik yang dapat digunakan dalam membantu pengguna dalam memberikan kueri yang baik. Ekspansi kueri dapat berperan sebagai penghubung karena adanya vocabulary gaps antara kueri dan dokumen (Fang 2008). Dalam teknik ini kueri awal akan dimodifikasi dan akan ditambahkan istilah-istilah tertentu. Rusidi (2008) telah melakukan penelitian untuk menggunakan peluang bersyarat dan mengaplikasikannya dalam ekspansi kueri suatu sistem temu kembali informasi. Ia mengambil istilah ekspansi dari istilah yang berada dalam indeks dan memilihnya berdasarkan keeratan hubungan suatu istilah dengan istilah lainnya. Keeratan hubungan ini diukur dengan menggunakan peluang bersyarat. Namun, metode ini dianggap kurang mempertimbangkan apakah istilah tersebut memiliki makna yang berkaitan dan jauh dari konsep dalam kueri yang dimasukkan pengguna. Sitohang (2009) telah menggunakan metode kamus dwibahasa dalam melakukan ekspansi pada kueri pengguna. Kamus dwibahasa digunakan untuk mendapatkan padanan kata yang merupakan sinonim dari kueri atau memiliki makna yang hampir sama dengan kueri awalnya. Ia menggunakan nilai IDF untuk memilih kueri ekspansi yang dihasilkan dari penerjemahan. Penggunaan nilai IDF ini masih dirasa kurang optimal dalam memilih istilah ekspansi. Hal ini dikarenakan kurangnya perhatian terhadap keeratan hubungan antar istilah ekspansi dengan kueri awal. Untuk itu, ada beberapa metode yang dapat digunakan dalam menemukan keeratan hubungan ini di antaranya: korelasi, ukuran kesamaan, dan dengan menggunakan peluang bersyarat. Keeratan hubungan berdasarkan kemunculan suatu objek sebaiknya menggunakan peluang bersyarat karena korelasi maupun ukuran kesamaan lainnya umumnya diberlakukan bagi data berskala ordinal atau interval (Adisantoso 1997). Penelitian ini akan berfokus pada pemilihan istilah ekspansi yang dihasilkan oleh penerjemahan dwibahasa dengan menggunakan metode peluang bersyarat. Metode ini diharapkan dapat memperoleh istilah ekspansi yang benar-benar merupakan istilah yang memiliki makna yang berkaitan sekaligus memiliki keeratan hubungan dengan kueri awal. Tujuan Penelitian ini bertujuan untuk: 1. Menerapkan metode peluang bersyarat untuk melakukan pemilihan istilah pada ekspansi kueri dengan menggunakan kamus dwibahasa. 2. Membandingkan hasil penggunaan metode peluang bersyarat ini dengan penggunaan nilai IDF sebagai ukuran dalam memilih istilah ekspansi. Ruang Lingkup Ruang lingkup penelitian ini adalah: 1. Penelitian ini akan menggunakan dokumen serta kueri berbahasa indonesia. 2. Istilah ekspansi didapatkan dari penerjemahan dengan menggunakan kamus dwibahasa Indonesia-Inggris dan Inggris-Indonesia. 3. Kamus dwibahasa yang digunakan merupakan kamus yang sama yang digunakan oleh Sitohang (2009). 4. Pada penelitian ini penulis tidak melakukan perubahan apapun terhadap dokumen uji maupun kamus dwibahasa yang digunakan. 1

10 5. Pembobotan kata yang digunakan dalam proses pengindeksan dokumen ialah metode pembobotan tf-idf. Manfaat Penggunaan kamus dwibahasa dan pendekatan peluang bersyarat ini diharapkan dapat membantu pengguna sistem temu kembali untuk dapat membentuk kueri sehingga diharapkan akan menghasilkan dokumen-dokumen temu kembali yang lebih banyak dan lebih relevan. Ekspansi Kueri TINJAUAN PUSTAKA Suatu sistem temu kembali informasi tidak memberi tahu pengguna mengenai masalah yang ditanyakan. Sistem ini hanya memberitahukan keadaan dan keterangan dokumen yang berhubungan dengan permintaan pengguna (Rijsbergen 1979). Sistem-sistem ini bisa berupa sistem yang berdasarkan boolean, vektor maupun berdasarkan model peluang. Tiap model memiliki keterbatasan sehingga menyebabkan ketidakseimbangan proporsi jumlah dokumen yang diinginkan (relevan) dengan jumlah dokumen yang ditemu kembalikan oleh sistem. Salah satu solusi yang ada untuk mengatasinya ialah dengan menggunakan automatic query expansion (Aly 2008). Sebenarnya terdapat tiga cara yang dapat digunakan dalam melakukan ekspansi kueri yakni : manual, interaktif, dan automatic (Imran & Sharan 2009). Terkadang pengguna tidak dapat memberikan informasi yang cukup untuk melakukan ekspansi kueri (manual dan interaktif), maka dibutuhkan suatu metode ekspansi yang tidak memerlukan keterlibatan pengguna di dalamnya (automatic). Automatic query expansion (AQE) merupakan proses penambahan istilah atau frase pada kueri asli untuk meningkatkan kinerja temu kembali tanpa intervensi dari pengguna (Imran & Sharan 2009). Aly (2008) mengatakan bahwa suatu algoritme ekspansi kueri akan mengevaluasi kueri yang diberikan pada dokumen dan memilih istilah yang sesuai dari dokumen relevan. Sistem memberikan input tambahan pada kueri awal berupa kata atau frase (Manning et al 2008). Beberapa mesin pencari (dalam web) telah menggunakan teknik ini dengan menyarankan pengguna untuk memilih beberapa kueri baru yang dinilai sebagai respon dari kueri yang dimasukkan pengguna. Penerjemahan Kueri Beberapa pendekatan yang terdapat dalam penerjemahan kueri yakni menggunakan mesin penerjemah, language specific stemmers, kamus, thesaurus, dan pembangkitan daftar istilah dwibahasa otomatis untuk menerjemahkan kueri dalam bahasa L ke dalam bahasa target L (Grossman & Frieder 2004). Salah satu penerjemahan yang dapat dilakukan dalam penelitian ini ialah penerjemahan kueri dengan menggunakan kamus dwibahasa. Sitohang (2009) melakukan penerjemahan kueri dengan menggunakan kamus dwibahasa. Penerjemahan ini dilakukan dengan menerjemahkan kata-perkata dari kueri. Teknik pemilihan kata hasil terjemahan adalah berdasarkan analisa statistik. Peluang Bersyarat Koopman (1997) mengemukakan bahwa peluang bersyarat B setelah A merupakan kependekan dari "peluang bersyarat bahwa B akan terjadi jika diketahui bahwa A telah atau pasti akan terjadi". Ruang contohnya telah diperkecil menjadi kejadian A. Ruang kejadiannya merupakan kejadian yang mempunyai sifat-sifat kejadian A dan B, sehingga peluang B setelah A yakni: atau N(A B) P(B A) = N(A) P(A B) P(B A) = P(A) Adisantoso (1997) menggunakan formula peluang bersyarat t j setelah t i yang dinyatakan sebagai berikut: P(t j t i ) = P(t i t j ) P(t i ) dengan dan P(t i t j ) = dokumen yang ada t i dan t j dokumen keseluru han P(t i ) = dokumen yang ada t i dokumen keseluru han Dengan demikian peluang bersyarat t j setelah t i dapat dihitung dengan menggunakan formula: 2

11 P(t j t i ) = dokumen yang ada t i dan t j dokumen yang ada t i Ukuran Kemiripan Cosine Ukuran cosine telah menjadi salah satu ukuran kemiripan dokumen yang populer karena kepekaannya terhadap pola vektor dokumen sekaligus ketidakpekaan terhadap variasi bobot. Pengukuran ini berdasarkan operasi inner product dan normalisasi dari panjang dokumen. Ukuran ini akan memberikan ukuran kemiripan yang tinggi ketika suatu dokumen-dokumen mempunyai pola vektor yang mirip (Jones & Furnas 1987 diacu dalam Jung et al 2007). sim(q, d j ) = V q.v (d j ) V q. V(d j ) Dengan q adalah kueri yang dimasukkan penguna dan d j adalah dokumen ke-j. V q dan V (d j ) menjelaskan vektor dari kueri (q) dan dokumen ke-j (d j ). V q dan V(d j ) menunjukkan panjang dari vektor kueri dan vektor dokumen ke-j. Evaluasi Temu Kembali Informasi Efektifitas merupakan suatu ukuran murni yang menyatakan kemampuan suatu sistem untuk memuaskan pengguna dalam hal relevansi dari dokumen hasil pencarian. Dua ukuran mendasar yang sering dipakai dalam menentukan efektifitas suatu sistem temu kembali informasi ialah recall dan precision. (Manning et al 2008) Recall merupakan nilai yang menyatakan proporsi antara dokumen relevan yang dihasilkan dengan keseluruhan dokumen relevan dalam koleksi, sedangkan precision menyatakan proporsi antara dokumen relevan yang dihasilkan dengan seluruh dokumen yang dihasilkan (retrieved documents). Dari berbagai tingkat recall yang ada, ratarata precision akan dihitung. Biasanya digunakan sebelas tingkat recall standar yakni 0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1 (Baeza-yates & Ribeiro-Neto 1999). Selanjutnya penelitian ini akan dibagi ke dalam empat tahap yakni: perolehan dokumen pengujian, pengembangan sistem, pengujian kinerja sistem, dan analisis pembandingan kinerja sistem. Gambaran umum dari sistem pencarian yang dikembangkan dapat dilihat pada Gambar 1. Perolehan Dokumen Pengujian Penelitian ini akan menggunakan koleksi dokumen berita dalam bidang pertanian. Dokumen ini merupakan dokumen-dokumen berbahasa Indonesia yang berisikan sekitar 2000 buah dokumen. Dalam penelitian ini juga digunakan pasangan kueri-dokumen relevan yang diambil dari koleksi yang ada di Laboratorium Temu Kembali Informasi Departemen Ilmu Komputer IPB. Dokumen Indexing Ekspansi Kueri Pencarian Dokumen Top n Document Evaluasi Kueri Penerjemahan Kueri Pemilihan Istilah Ekspansi Hasil Ekspansi METODE PENELITIAN Penelitian ini merupakan penerapan salah satu metode ekspansi kueri yang ada ke dalam sebuah sistem temu-kembali informasi. Metode yang dimaksud ialah metode penerjemahan kamus dwibahasa ditambah metode peluang bersyarat sebagai cara pemilihan istilah ekspansi yang dihasilkan. Gambar 1 Gambaran umum sistem temukembali yang dikembangkan Pengembangan Sistem Sistem temu-kembali yang dikembangkan merupakan suatu aplikasi berbasis web yang menggunakan bahasa pemrograman perl. Bahasa pemrograman ini dipilih karena relatif 3

12 mudah dan memiliki fungsi-fungsi yang mendukung dalam pengolahan teks. Terdapat beberapa modul pengerjaan dari sistem yang dikembangkan, antara lain: 1. Pengindeksan Dalam modul pengindeksan dokumendokumen yang ada akan mengalami beberapa proses yakni tokenisasi, pembuangan kata buangan (stopwords), dan melakukan pembobotan dengan metode pembobotan tf.idf. 2. Penerjemahan kamus dwibahasa Penerjemahan dilakukan untuk mendapatkan istilah lain dengan makna yang hampir serupa dengan kueri awal. Penerjemahan dilakukan dengan menggunakan database kamus yang sama dengan yang digunakan dalam penelititan Sitohang (2009). 3. Penghitungan peluang bersyarat Setelah didapatkan istilah kandidat ekspansi dari proses penerjemahan, langkah selanjutnya ialah memilih istilah mana saja yang akan ditambahkan ke dalam kueri awal. Kriteria yang dipilih untuk menambahkan istilah ekspansi ialah berdasarkan peluang bersyarat kemunculan istilah terjemahan setelah istilah kueri. 4. Pencarian dokumen Pencarian dokumen dilakukan dengan menghitung ukuran kesamaan bobot kueri dengan bobot dari dokumen. Pemberian peringkat dilakukan terhadap dokumen berdasarkan ukuran kesamaannya terhadap kueri. Pengujian Kinerja Sistem Terdapat dua hal utama yang akan diuji dari sistem yakni presisi hasil pencarian dan waktu yang dibutuhkan untuk melakukan pencarian dokumen berdasarkan kueri masukan. 1. Presisi hasil pencarian dokumen Metode evaluasi yang digunakan untuk menghitung presisi dari sistem ialah metode recall-precision. Nilai recall dan precision dari setiap pencarian dengan kueri tertentu akan dihitung dan selanjutnya diambil nilai rata-ratanya untuk mendapatkan nilai average precision dari sistem. Dengan menghitung nilai average precision dari sistem, nilai precisi sistem secara keseluruhan akan dapat diketahui. Terdapat pula empat asumsi kondisi pengujian presisi sistem, yakni: Kondisi pertama (QE0): evaluasi proses temu kembali tanpa menggunakan ekspansi kueri. Kondisi kedua (QE1): evaluasi proses temu kembali dengan menambahkan satu istilah pada masing-masing kata dalam kueri. Kondisi ketiga (QE2): evaluasi proses temu kembali dengan menambahkan dua istilah pada masing-masing kata dalam kueri. Kondisi keempat (QE3): evaluasi proses temu kembali dengan menambahkan tiga istilah pada masing-masing kata dalam kueri. Evaluasi presisi pencarian sistem akan diuji pada dua jenis koleksi dokumen pengujian. Koleksi pertama ialah menguji sistem pada pengolah 1000 dokumen dan membandingkan hasil presisi dengan hasil penelitian Sitohang (2009). Koleksi kedua ialah koleksi dokumen yang memiliki ukuran lebih besar yakni 2000 dokumen. 2. Waktu pencarian dokumen Untuk mengetahui seberapa cepat sistem menemukembalikan dokumen digunakan beberapa macam kueri masukan. Kueri ini dibagi berdasarkan jumlah kata yang terdapat dalam masing-masing kueri, yakni satu, dua, tiga, empat, dan lima kata dalam masingmasing kueri. Selanjutnya pengujian akan dipisah berdasarkan menu pencarian yang ada dalam sistem (QE0, QE1, QE2, dan QE3). Untuk setiap menu akan dilakukan proses pencarian dengan sebuah kueri sebanyak lima kali ulangan. Daftar kueri yang digunakan untuk pengujian ini dapat dilihat pada Lampiran 1. Analisis Pembandingan Kinerja Sistem Penelitian ini menggunakan metode penerjemahan yang sama dengan penelitian yang telah dilakukan oleh Sitohang(2009) untuk mendapatkan istilah ekspansi dari kueri awal. Walaupun menggunakan cara yang sama dalam mendapatkan istilah ekspansinya, penelitian ini menggunakan metode berbeda dalam memilih istilah mana saja yang akan ditambahkan pada kueri awal. Analisis lebih jauh diperlukan untuk membandingkan hasil pemilihan istilah yang menggunakan nilai IDF pada penelitian Sitohang (2009) dengan penggunaan peluang bersyarat. Dengan demikian dapat diketahui 4

13 metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu: 1. Windows Vista Bussiness SP2 sebagai sistem operasi, 2. Strawberry-perl sebagai interpreter bahasa pemrograman perl yang digunakan, 3. Apache xampp-win sebagai web server, 4. Notepad , dan 5. Microsoft Excell 2007 sebagai aplikasi yang digunakan untuk melakukan perhitungan dalam evaluasi sistem. Perangkat keras yang digunakan untuk penelitian meliputi: 1. Intel(R) Core(TM) 2 Duo 2. RAM 2 GB, 3. Harddisk dengan kapasitas 160 GB. HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Penelitian ini menggunakan 2000 buah dokumen yang berasal dari Laboratorium Temu Kembali Ilmu Komputer IPB. Deskripsi dari dokumen ini dapat dilihat pada Tabel 1. Tabel 1 Deskripsi dokumen pengujian Uraian Ukuran keseluruhan dokumen Nilai (byte) Ukuran rata-rata dokumen 3236 Ukuran dokumen terbesar Ukuran dokumen terkecil 412 Contoh dari dokumen pengujian dapat dilihat pada Lampiran 2. Dokumen ini merupakan dokumen plain-text yang memilki struktur XML di dalamnya. Isi dari dokumen dikelompokan ke dalam tag-tag sebagai berikut: <DOC></DOC>, tag ini mewakili keseluruhan dokumen. Tag ini melingkupi beberapa tag-tag lain yang lebih spesifik di dalamnya. <DOCNO></DOCNO>, tag ini menunjukkan ID dari dokumen. ID yang ada merupakan kombinasi dari nama sumber berita, tanggal berita, urutan berita dengan sumber dan tanggal yang sama. <DATE></DATE>, menunjukkan tanggal dari berita <AUTHOR></AUTHOR>, menunjukkan penulis dari berita tersebut. <TEXT></TEXT>, tag ini menunjukkan isi dari dokumen. Pengembangan Sistem 1. Pengindeksan Modul paling awal yang dikerjakan dalam pengembangan sistem ini ialah modul pengindeksan dokumen. Pengindeksan dokumen yang dilakukan meliputi proses tokenisasi, pembuangan stopword, dan pembobotan dengan menggunakan metode pembobotan tf-idf. Tokenisasi merupakan proses yang dilakukan untuk memecah isi dokumen menjadi token-token. Proses tokenisasi dilakukan berdasarkan langkah-langkah berikut: Proses tokenisasi tidak dilakukan pada seluruh bagian dokumen, tetapi hanya pada bagian yang diapit oleh tag-tag <TITLE><TITLE> dan <TEXT></TEXT>. Gambar 2 menunjukkan ilustrasi bagianbagian dokumen yang diproses. Semua huruf dalam dokumen diubah menjadi huruf kecil. Penyeragaman ini dilakukan agar token yang sama namun memiliki besar kecil huruf yang berbeda tidak dianggap menjadi token-token yang berbeda. Karakter-karakter yang akan yang akan dijadikan sebagai pemisah token didefinisikan dengan ekspresi regular berikut: [\s+\/%,.\"\];()*<>&\':=`?\[!@]+ Selanjutnya pembuangan stopword dilakukan pada hasil tokenisasi dokumen. Hal ini bertujuan untuk menghilangkan kata-kata yang dianggap tidak penting seperti: kata sambung, kata keterangan, kata depan, kata ganti, kata dengan partikel (-lah, -kah, -pun), dan kata-kata tidak penting lainnya yang mempunyai frekuensi kemunculan tinggi. Kata-kata tersebut dianggap tidak penting karena dianggap kurang bisa mencirikan dokumen yang mengandungnya. Sebagai 5

14 contoh: kata adalah merupakan kata yang tidak penting. Kata ini mungkin terdapat hampir di setiap dokumen sehingga tak dapat mencirikan dokumen tertentu. <DOC> <DOCNO>situshijau </DOCNO> <TITLE> Ditunggu, PP Pembebasan </TITLE> <DATE>Kamis, 15 Februari 2001</DATE> <AUTHOR>Ely</AUTHOR> <TEXT> Pemerintah hendaknya segera </TEXT> </DOC> bagian dokumen yang digunakan untuk proses tokenisasi Gambar 2 Bagian dokumen yang diproses Setelah dilakukan tokenisasi berikut pembuangan stopword, token-token yang dihasilkan akan diberi bobot tertentu. Metode pembobotan yang digunakan ialah metode pembobotan tf-idf. Pembobotan dilakukan dengan menggunakan lima fungsi utama dari program pengindeksan yang diberi nama Indexing.pl. Kelima fungsi utama tersebut antara lain: Fungsi untuk mendapatkan frekuensi tiap token di dalam setiap dokumen (TF). Fungsi untuk mendapatkan jumlah dokumen yang mengandung token tertentu (DF). Fungsi untuk mendapatkan nilai IDF (Inverse document frequency) dari setiap token. Nilai IDF ini didapatkan dengan menggunakan rumus: idf t = log df t N dengan df t merupakan nilai df (jumlah dokumen yang mengandung token tertentu) dan N merupakan jumlah dokumen yang ada dalam koleksi. Fungsi untuk mendapatkan nilai tf-idf dari setiap token. Nilai tf-idf ini didapatkan dengan menggunakan rumus: tf-idf t = tf t * idf t dengan tf merupakan frekuensi kemunculan kata dalam dokumen dan idf merupakan nilai invers document frequency dari kata tersebut. Fungsi untuk mengetahui panjang dari masing-masing dokumen. Nilai ini diperlukan karena dokumen pengujian dimodelkan menjadi ruang vektor (vektor space model). Nilai-nilai yang dihasilkan setiap fungsi disimpan dalam bentuk file hash dengan ekstension.dat. Dalam pemrograman perl file ini dapat langsung digunakan dengan menggunakan fungsi retrieve (). Hash yang sebelumnya sudah dibuat akan disimpan di-memory. Jadi lebih mudah dan cepat untuk menggunakan hash berukuran besar dalam program yang berbeda. Sebagai contoh, jika ingin mendapatkan nilai IDF dari suatu kata, maka dapat digunakan cuplikan program yang ada pada Modul 1. Modul 1 # retrieve hasil pengindeksan my $indexingresult = retrieve( Stored File/IndexingResult.dat ) or die $!; # nilai IDF hasil pengindeksan my %idfterm = ${$IndexingResult->{ idf }}; # nilai Idf untuk kata tani $tani_idf = $idfterm{ tani } ; 2. Penerjemahan Kamus Dwibahasa Penerjemahan kamus dwibahasa dilakukan dengan tujuan mendapatkan istilah lain dengan makna yang sama atau berkaitan dengan kueri awal. Penerjemahan dilakukan dengan mengikuti Algoritme 1. Algoritme 1 Untuk setiap kata dalam kueri lakukan: Ambil hasil terjemahan dari kamus Indonesia-Inggris. Untuk setiap kata hasil penerjamahan, lakukan: Ambil hasil terjemahan dari kamus Inggris- Indonesia. 6

15 Algoritme 1 merupakan algoritme yang sama yang digunakan oleh Sitohang (2009) dalam mendapatkan istilah ekspansi bagi penelitiannya. Selain menggunakan algoritme yang sama, penelitian ini juga menggunakan kamus yang sama untuk melakukan penerjemahan kueri awal. Penerjemahan kueri akan dilakukan sebanyak pencarian yang dilakukan. Dengan demikian eksekusi kueri pada database juga akan dilakukan dalam jumlah yang sama. Penggunaan database untuk penerjemahan ini akan memperbanyak waktu yang dibutuhkan untuk melakukan pencarian. Jadi perlu dicari bentuk penerjemahan yang lebih baik untuk mengoptimalkan waktu pencarian. Untuk membuatnya lebih efisien, penggunaan database akan digantikan dengan hash. Hal ini hampir serupa dengan penggunaan hash pada modul pengindeksan. Untuk melakukan penerjemahan hal yang perlu dilakukan hanyalah mengakses alamat dari hash tersebut. Contoh yang sederhana dari penggunaan hash ini dapat dilihat pada cuplikan program berikut: $transpetani= $hk{ petani }; Cuplikan program ini akan mengembalikan hasil penerjemahan dengan kamus dwibahasa ke variabel $transpetani. Cara ini dianggap lebih efisien daripada harus melakukan eksekusi kueri pada tiap kata yang ingin diterjemahkan. Untuk mengubah bentuk kamus yang berupa database menjadi bentuk hash digunakan sebuah program sederhana gethashkamus.pl. Program ini melakukan penerjemahan berdasarkan Algoritme 1. Hasil penerjemahan diberikan dalam bentuk array seperti ilustrasi pada Modul 2. Modul 2 $hk{menyandang}[0]= mengangkat $hk{menyandang}[0]= membawa $hk{menyandang}[0]= memenangkan $hk{menyandang}[0]= menggotong $hk{menyandang}[0]= menerima $hk{menyandang}[0]= meloloskan Hasil penerjemahan serupa yang dilakukan pada beberapa kata dalam kueri uji dapat dilihat pada Lampiran Penghitungan Peluang Bersyarat Istilah-istilah baru yang didapatkan dari proses penerjemahan tidaklah dapat digunakan semuanya. Penambahan istilah ekspansi yang terlalu banyak hanya akan mengurangi kinerja sistem temu kembali. Untuk itu diperlukan suatu ukuran untuk dapat memilih istilah ekspansi yang dapat digunakan. Ukuran yang digunakan dalam penelitian ini ialah peluang bersyarat kemunculan bersama antara kueri dan istilah ekspansinya. Peluang bersyarat ini akan menggambarkan suatu keterkaitan antara kata dalam kueri awal dan hasil terjemahannya. Ilustrasi penentuan nilai peluang bersyarat antara kata hujan dengan istilah hasil terjemahannya dapat dilihat pada Modul 3. Modul 3 $hexp{hujan}{awan}= 0.9 $hexp{hujan}{megnhujani}= 0 $hexp{hujan}{menghujan}= 0 $hexp{hujan}{musim}=0.336 Selanjutnya akan dipilih tiga istilah dengan nilai peluang bersyarat tertinggi serta nilai peluang bersyaratnya > 0. Hasilnya disimpan dalam sebuah file yang berisi hash dengan struktur yang dapat diilustrasikan pada Modul 4. Modul 4 $hexp{hujan}[0]= musim $hexp{hujan}[0]= awan 4. Pencarian Dokumen Proses pencarian dokumen dilakukan sesuai dengan pilihan tindakan ekspansi yang dipilih oleh pengguna. Terdapat empat pilihan tindakan ekspansi di dalam sistem ini, di antaranya: pencarian tanpa melakukan ekspansi pada kueri, satu istilah ekspansi, dua istilah ekspansi, dan tiga istilah ekspansi. Masing-masing angka di atas menunjukkan jumlah istilah ekspansi yang ditambahkan pada tiap kata dalam kueri awal. Hasil dari proses pencarian dokumen merupakan dokumen-dokumen yang dianggap memiliki kemiripan dengan kueri yang diberikan atau memiliki nilai ukuran kesamaan > 0. Pemeringkatan dokumen hasil pencarian juga dilakukan dan disajikan berdasarkan urutan menurun dari nilai ukuran kesamaannya. 7

16 Pengujian Kinerja Sistem 1. Pengujian Presisi Pencarian Dokumen Proses evaluasi dalam penelitian ini menggunakan 30 kueri uji yang telah ada sebelumnya berikut dokumen-dokumen yang relevan dengannya. Pencarian dengan kueri uji ini dilakukan dengan tujuan mendapatkan nilai recall dan precision dari sistem. Nilainilai ini diukur dari setiap dokumen yang dihasilkan dari proses pencarian atau yang memiliki ukuran kesamaan > 0. Setelah didapatkan nilai-nilai recall dan precisionnya, interpolasi dilakukan untuk mendapatkan nilai average precision yang akan menggambarkan bagaimana kinerja dari sistem secara keseluruhan. Pada tahap awal akan dihitung hasil pengujian untuk pencarian dokumen tanpa melakukan ekspansi (QE0). Gambar 3 merupakan grafik recall dan precision untuk hasil pencarian tanpa ekspansi dari ke-30 kueri uji yang ada. Precision 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0, ,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Recall Gambar 3 Grafik Nilai recall dan precision dari pencarian tanpa ekspansi (QE0) Nilai recall dan precision dari pencarian tanpa ekspansi ini akan digunakan sebagai pembanding oleh pencarian yang menggunakan ekspansi, baik satu, dua, maupun pencarian yang menggunakan tiga buah ekspansi dari setiap kata dalam kueri awal. Nilai recall yang dihasilkan dari menu pencarian ini rata-rata sebesar 0,975. Nilai average precision (AVP) dari menu pencarian ini sebesar 0,530. Hal ini menunjukkan bahwa pencarian tanpa ekspansi yang dilakukan sistem ini rata-rata menemukembalikan 97,5% dokumen relevan dari semua dokumen relevan yang ada dalam koleksi dokumen. Tiga kondisi pengujian selanjutnya yakni QE1, QE2, dan QE3 merupakan pengujian untuk pencarian yang dilakukan dengan menambahkan istilah ekspansi pada kueri awal. Hasil dari masing-masing pengujian akan dibandingkan dengan pencarian tanpa ekspansi (QE0). a. QE1 dibandingkan dengan QE0 QE1 merupakan kondisi pengujian dengan melakukan pencarian dokumen disertai dengan penambahan satu istilah ekspansi pada masing-masing kata dalam kueri awal. Istilah yang ditambahkan tidak lain adalah istilah terjemahan masing-masing kata yang memiliki nilai peluang bersyarat tertinggi. QE1 menghasilkan pencarian dengan nilai recall rata-rata sebesar Hal ini menunjukkan bahwa 98,2% dari total dokumen relevan yang ada dalam koleksi dokumen dihasilkan dari tiap pencarian dengan kueri uji. Nilai ini lebih tinggi 0,7% dibandingkan pencarian yang dilakukan tanpa penambahan istilah ekspansi. Walaupun dapat meningkatkan nilai recall, pencarian dengan kondisi ini dapat menurunkan nilai presisi dari hasil pencarian. Nilai AVP dari kondisi pencarian ini ialah sebesar atau lebih rendah daripada nilai AVP yang dimiliki pencarian tanpa tambahan istilah ekspansi (QE0). Grafik perbandingan nilai presisi pencarian antara QE1 dan QE0 dapat dilihat pada Gambar 4. Precision 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 QE0 QE1 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Recall Gambar 4 Grafik nilai recall dan precision pada pencarian QE1 dibandingkan dengan QE0 b. QE2 dibandingkan dengan QE0 Kondisi pengujian ini melakukan pencarian dengan menambahkan dua istilah ekspansi pada setiap kata dalam kueri awal. Hasil pencarian QE2 menghasilkan nilai recall rata-rata sebesar 0,982. Dengan melihat nilai recall yang dimilikinya dapat diketahui bahwa rata-rata 98,2% dari total dokumen 8

17 relevan yang ada dalam koleksi dokumen dapat dihasilkan dari tiap pencarian. Namun, seperti halnya QE1, penambahan dua istilah ekspansi pada setiap kata dalam kueri awal ini dapat pula menurunkan nilai presisi pencarian jika dibandingkan dengan pencarian tanpa ekspansi (QE0). Dengan kondisi pencarian QE2 terjadi penurunan nilai presisi menjadi Penurunan ini malah lebih parah jika dibandingkan dengan QE1. Grafik perbandingan nilai presisi pancarian antara QE2 dengan QE0 dapat dilihat pada Gambar 5. Precision 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 QE0 QE2 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Recall Gambar 5 Grafik nilai recall dan precision pada pencarian QE2 dibandingkan dengan QE0 c. QE3 dibandingkan dengan QE0 Seperti halnya QE2 dan QE1, QE3 juga melakukan pencarian yang disertai dengan penambahan istilah ekspansi pada setiap kata dalam kueri awal. Jumlah istilah yang ditambahkan pada kondisi pencarian QE3 ialah sebanyak tiga istilah ekspansi pada masing-masing kata dalam kueri awal. Hasil pencarian QE3 dapat memberikan nilai recall rata-rata sebesar Sebesar 98,3% dari total dokumen relevan dapat dikembalikan dengan kondisi pencarian QE3. Nilai ini lebih tinggi dibandingkan tiga kondisi pencarian lainnya yakni QE0, QE1, dan QE2. Walaupun demikian nilai presisi atau precision yang dihasilkan dari kondisi pencarian ini merupakan yang terendah dibandingkan dengan tiga kondisi pencarian lainnya. Nilai precision yang dihasilkan dari kondisi pencarian QE3 ialah sebesar Grafik perbandingan nilai recall dan precision dari QE0 dan QE3 dapat dilihat pada Gambar 6. Tabel 2 akan menampilkan nilai rata-rata recall dan AVP untuk masing-masing kondisi pencarian QE0, QE1, QE2, dan QE3. Tabel 2 juga menunjukkan bahwa semakin banyak istilah ekspansi yang ditambahkan pada kueri awal maka semakin tinggi rata-rata nilai recall hasil pencariannya. Dapat pula dikatakan akan semakin banyak dokumen relevan yang ditemukembalikan pada hasil pencarian. Meskipun banyak dokumen relevan yang ditemukembalikan, namun penurunan nilai precision dari hasil pencarian tetap terjadi. Hal ini dikarenakan penambahan istilah yang dilakukan mengakibatkan dokumen-dokumen yang tak relevan juga ikut ditemukembalikan oleh sistem. Dokumen-dokumen tak relevan ini sebagian menempati peringkat yang lebih tinggi daripada dokumen relevan yang ditemukembalikan sehingga nilai precision menjadi lebih rendah dibandingkan dengan pencarian yang tidak menggunakan penambahan istilah ekspansi. Precision 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 QE0 QE3 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Recall Gambar 6 Grafik nilai recall dan precision pada pencarian QE3 dibandingkan dengan QE0 Tabel 2 Nilai recall dan AVP semua kondisi pencarian Kondisi Nilai Nilai AVP Pencarian Recall QE QE QE QE Pengujian Waktu Pencarian Dokumen Pengujian Untuk setiap kueri pengujian yang ada dalam Lampiran 1, dilakukan pencarian sebanyak lima kali ulangan. Hasil yang diperolah yakni tidak ditemukannya pengaruh secara nyata dari banyaknya kata dalam kueri terhadap waktu yang dibutuhkan utnuk 9

18 melakukan sebuah pencarian. Hal ini tidak hanya berlaku untuk pencarian tanpa ekspansi (QE0), tetapi juga untuk pencarian yang dilakukan dengan menggunakan ekspansi (QE1, QE2, dan QE3). Kelemahan Sistem Salah satu kelemahan utama dari sistem yang dikembangkan yakni algoritme penerjemahan yang digunakan. Algoritme penerjemahan yang ada dalam penelitian ini terkadang menghasilkan istilah ekspansi yang terlihat seperti hanya diberi imbuhan dan bukan diterjemahkan. Pada Lampiran 3 dapat dilihat beberapa kata yang diterjemahkan menjadi kata awal yang hanya diberi imbuhan saja. Beberapa dari kata tersebut ditunjukkan pada Tabel 3. Selain itu algoritme penerjemahan yang digunakan merupakan penerjemahan word-byword atau penerjemahan kata-per-kata. Dengan penerjemahan seperti ini, dua kata yang merupakan frase akan dikenali sebagai dua kata terpisah tanpa ada keterkaitan. Untuk mengujinya, penulis memasukkan kata rumah sakit. Terjemahan yang diharapkan untuk kata ini ialah hospital. Lain halnya dengan hasil yang didapatkan dengan algoritme penerjemahan ini. Kata terjemahan yang dihasilkan ialah house dan ill. Jadi penerjemahan dilakukan secara terpisah untuk masing-masing kata rumah dan sakit. Tabel 3 Penerjemahan yang menghasilkan kata berimbuhan dari kata awal kueri pupuk harga Tani Istilah terjemahan Memupuk Dihargai, menghargai, berharga Petani Analisis Perbandingan Pemilihan Istilah Ekspansi Penelitian ini menggunakan metode ekspansi kueri yang sama dengan ekspansi kueri yang dilakukan oleh Sitohang (2009). Namun penelitian ini memiliki beberapa perbedaan dalam hal metode pemilihan istilah ekspansi yang digunakan. Sitohang (2009) menggunakan nilai IDF sebagai ukuran utama untuk menentukan pemilihan istilah ekspansi yang akan ditambahkan pada kueri awal, sedangkan penelitian ini menggunakan peluang kejadian bersama antara dua istilah. Penelitian Sitohang (2009) hanya menunjukkan 2 dari 30 kueri uji yang mengalami peningkatan nilai AVP setelah dilakukan ekspansi kueri terhadapnya. Peningkatan tersebut terjadi pada penambahan satu istilah ekspansi pada masing-masing kata pada kueri awal. Pada penelitian ini keberhasilan kueri uji dalam meningkatkan nilai AVP terjadi pada setiap kondisi pengujian. QE1 menunjukkan bahwa 7 dari 30 kueri pengujian mengalami peningkatan AVP. QE2 menunjukkan bahwa 7 dari 30 kueri uji mengalami peningkatan nilai AVP dan kondisi pengujian QE3 menunjukkan bahwa 5 dari 30 kueri mengalami peningkatan nilai AVP. Perbandingan nilai AVP untuk tiap kondisi pengujian dapat dilihat pada Tabel 4. Tabel 4 Perbandingan nilai AVP dari kedua sistem Kondisi Pengujian Average Precision Pemilihan dengan Nilai IDF Pemilihan dengan Peluang bersyarat QE QE QE QE Pada Tabel 4 dapat dilihat bahwa pada tiap kondisi pengujian yang sama penggunaan peluang bersyarat memberikan hasil yang lebih tinggi. Pada pengujian QE0 sistem ini memiliki nilai AVP yang lebih tinggi daripada sistem yang dikembangkan dalam penelitian Sitohang (2009). Hal ini dapat disebabkan perlakuan tokenisasi yang berbeda pada saat proses pengindeksan dokumen. Selain itu penelitian ini juga menggunakan pembuangan stopword dengan daftar stopword yang berbeda. Proses pengindeksan yang dilakukan Sitohang(2009) menghasilkan istilah berbeda dari 1000 dokumen pengujian. Sementara penelitian ini menghasilkan istilah berbeda dari penggunaan dokumen pengujian yang sama. Hasil yang lebih tinggi juga terdapat pada nilai AVP pencarian yang menggunakan tambahan istilah ekspansi. Baik QE1, QE2, 10

19 maupun QE3 memperlihatkan bahwa ekspansi yang dilakukan pada penelitian ini memiliki hasil yang lebih baik daripada penelitian Sitohang (2009). Penelitian ini menggunakan metode yang sama dalam mendapatkan istilah ekspansinya yakni dengan menggunakan metode penerjemahan kamus dwibahasa. Dengan metode ini kedua penelitian menghasilkan sejumlah istilah yang sama yang dapat ditambahkan ke dalam kueri awal. Kedua penelitian ini menjadi berbeda ketika akan memilih istilah mana saja yang akan ditambahkan ke dalam kueri. Sitohang (2009) memilih nilai IDF sebagai ukuran untuk memilih istilah terjemahan yang akan ditambahkan ke dalam kueri. Nilai IDF merupakan nilai yang menunjukkan tingkat kepentingan suatu kata dalam koleksi. Semakin tinggi nilai IDF berarti semakin jarang kata itu muncul di banyak dokumen dan semakin mungkin kata itu dapat digunakan untuk mencirikan suatu dokumen. Dengan mengunakan nilai IDF sebagai pemilihan istilah ekspansi berarti mengambil istilah terjemahan yang merupakan kata terpenting untuk ditambahkan ke dalam kueri awal. Mengingat algoritme penerjemahan yang kurang baik digunakan dalam penelitiannya maka tingkat kepentingan kata menjadi kurang berarti. Peluang bersyarat yang digunakan dalam penelitian ini dapat sedikit mengatasi masalah penerjemahan tersebut. Walaupun hasil terjemahan yang didapat kurang mencapai konsep kueri, namun dengan peluang bersyarat pencarian akan tetap berada pada sekitar kata yang memiliki keterkaitan dengan kueri awal. Pengujian pada koleksi dokumen yang lebih besar Pengujian ini menggunakan tambahan 1000 dokumen lagi pada koleksi dokumen sebelumnya. Total 2000 dokumen digunakan pada pengujian ini. Pengujian ini juga menggunakan kueri-kueri yang telah ditentukan dokumen-dokumen mana yang relevan dengannya. Ternyata sistem memperlihatkan penurunan presisi pencarian jika dilakukan penambahan dokumen terhadapnya. Tabel 5 di bawah ini akan memperlihatkan perbandingan nilai presisi sistem pada penggunaan 1000 dan 2000 dokumen. Tabel 5 Perbandingan nilai presisi sistem pada penggunaan 1000 dan 2000 dokumen. Kondisi Pengujian Average Precision 1000 dokumen 2000 dokumen QE QE QE QE Kesimpulan KESIMPULAN DAN SARAN Hasil penelitian ini menunjukkan bahwa: 1. Ekspansi kueri yang dilakukan pada sistem ini akan mengakibatkan menurunnya nilai presisi bila dibandingkan dengan pencarian tanpa melakukan ekspansi kueri. 2. Metode pemilihan istilah ekspansi dengan peluang bersyarat relatif lebih baik jika dibandingkan dengan penggunaan nilai IDF pada metode ekspansi yang sama, yakni metode penerjemahan kamus dwibahasa. 3. Banyaknya kata dalam kueri tidak memiliki pengaruh secara nyata terhadap waktu pencarian sistem. Saran Untuk penelitian-penelitian yang berkaitan dengan ekspansi kueri, disarankan untuk melakukan penelitian dengan: 1. Penggunaan koleksi dokumen yang lebih besar 2. Penggunaan metode pembobotan lainnya, seperti BM25. DAFTAR PUSTAKA Adisantoso J Temu Kembali Infomasi Menggunakan Peluang Bersyarat. Tesis. Program Studi Ilmu Komputer Universitas Indonesia. Jakarta. Aly AA Using a Query Expansion Technique to Improve Document Retrieval. Information Technologies and Knowledge, vol. 2. Baeza-Yates R, Riberio-Neito B Modern Information Retrieval. New York, Adison Weasley. 11

20 Fang H A Re-examination of Query Expansion Using Lexical Resources. Proceedings of ACL-08. Hal Grossman DA, Frieder O Information Retrieval: Algorithms and Heuristics Second Edition. Springer, Netherlands. Imran H, Sharan A Thesaurus and Query Expansion. International Journal of Computer science & Information Technology (IJCSIT), Vol 1, No 2 Jung Y, Park H, Du D A Balance Term- Weighting Scheme For Improve Document Comparison And Classification. Departemen of Computer Science and Engineering, University of Minnesota, Minneapolis. Koopmans, L.H Pengantar ke Statistika Kontemporer. Terjemahan: Bambang Sumantri, Departemen Statistika IPB Manning CD, Raghavan P, Schutze H Introduction to Information Retrieval. America, New York. Rijsbergen CJ Information Retrieval Second Edition. Butterworths, London. Rusidi Ekspansi Kueri dalam Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Peluang Bersyarat. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Sitohang, NL Ekpansi Kueri pada Sistem Temu Kembali Informasi Menggunakan Kamus Dwibahasa. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. 12

21 LAMPIRAN

22 Lampiran 1 Daftar Kueri untuk Pengujian Waktu Pencarian Sistem Banyak kata dalam kueri Kueri Petani Sawah 1 kata Ladang Instesifikasi Irigasi Hama padi Sistem ijon 2 kata Harga gabah Masa tanam Ladang jagung Manfaat intensifikasi pertanian Sistem perikanan tambak 3 kata Kerugian pupuk kimia Sawah tadah hujan Usaha perkebunan rakyat Mahasiswa institut pertanian bogor Pendidikan pertanian bagi remja 4 kata Prospek usaha tani gurem Hasil pertanian dalam negeri Investasi perkebunan dalam negeri Program kerja menteri pertanian indonesia Perkembangan teknologi pertanian dalam negeri 5 kata Sistem pertanian tradisional rakyat daerah Penyebaran penyakit kuku dan mulut di Indonesia Usaha menuju swasembada pangan Indonesia 14

23 Lampiran 2 Contoh Dokumen Pengujian <DOC> <DOCNO>indosiar </DOCNO> <TITLE>Meski Diambil Alih, Distribusi dan HET Pupuk Tetap</TITLE> <AUTHOR>Pataruddin/Idh</AUTHOR> <DATE>30/7/2003</DATE> <TEXT> <P>indosiar.com, Makassar - Meski terjadi pengalihan distribusi pupuk di wilayah timur oleh PT Pupuk Kaltim (PKT), masalah distribusi dan Harga Eceran tertinggi (HET) pupuk tetap.</p> <P>Menurut Kepala Wilayah Pusri Abdul Wasji, sudah ada kerjasama, termasuk pengantongan semuanya akan berlabel PKT, begitupula dengan masalah distribusi mulai dari lini 1 (kota provinsi) hingga lini 4 (kota kecamatan) akan ditangani PKT dengan tetap memakai distribusi Pusri.</P> <P>Sementara Muhammad Hasyim Jafar, distributor CV Astri berharap kepada PKT agar dalam pendistribusian pupuk nantinya tetap ditangani oleh distributor yang ada dan sudah menjadi rekanan Pusri selama ini. ''Ini bisa menjadi gejolak nantinya,'' ujar Hasyim.</P> <P>Sementara itu, terkait dengan rencana subsidi pupuk yang mulai berlaku 1 Agustus besok, ditegaskan PKT dan Pusri bahwa tidak ada penurunan harga. Sebab pemberian subsidi tersebut bukan untuk pupuk, namun ditujukan untuk pembelian gas bagi produsen. Sehingga Harga Eceran tertinggi (HET) yang berlaku secara nasional itu tetap Rp </P> <P>Meski ada subsidi, harga pupuk tidak akan mengalami perubahan. Alasannya karena subsidi yang diberikan adalah kepada produsen untuk pembelian gas yang mengalami kenaikan dari harga sebelumnya US$ naik menjadi US$ Apalagi dalam SK Menteri Pertanian menyebutkan bahwa harga eceran tertinggi untuk pupuk secara nasional sebesar Rp1.150 perkilogram.</p> <P>Sementara itu menyangkut apakah kemungkinan akan dilakukan pengalihan aset Pusri kepada PKT, Triyoga mengaku belum sampai ke sana. Karena dalam operasionalnya nanti, PKT akan tetap memanfaatkan jaringan-jaringan distribusi serta gudang-gudang milik Pusri. Jadi pada dasarnya, aset milik Pusri tidak akan mengalami pengalihan.</p> </TEXT> </DOC> 15

24 Lampiran 3 Daftar Istilah Kueri dan Istilah Hasil Terjemahannya Kueri Ayam Bencana Beras Dukungan Flu Gabah Gagal Giling Gula Harga Hasil Hewan Hujan Impor Indonesia Industri Institut Kekeringan Kelangkaan Kelompok Kering Komoditas Laboratorium Musim Istilah hasil terjemahan Ditakuti, jago, keran, jantan, melirik, mudah Mala, petaka, merusakkan, malapetaka, kegagalan, kerusakan, besar Nasi, gabah, padi Penyokong, sokongan, sandaran, menyangga, tiang, dinding, penyangga, persetujuan, bantuan, membantu Pingsan, pilek, nada, berdarah, huruf, dingin, angin, tertarik, kelas, angka, mata, sekali, pertama, masuk, satu Tangkai, mengejar, padang, mengikuti, batang, sawah, padi Lalai, menjatuhkan, lupa, gangguan, kelemahan, kegagalan, meninggalkan, jatuh, kerusakan, kekurangan, rusak Menggiling, pemintalan, menggulung, gulungan, menggelinding, gulung, penggilingan, rol Manisan, sayang, apel, enak, manis, uang, hati, bersifat, membuat, hadiah, Menghargai, berharga, ganti, ongkos, dihargai, korban, menetapkan, menilai, harganya, meminta, nilai Mengalah, menyerah, panenang, gandum, pemilihan, sukses, keberhasilan, karya, mengakibatkan, menghasilkan, kali, panen, produksi, pertanian Hewani, binatang, protein, pemeliharaan, ilmu, peternakan Awan, hujan, turun, musim Membawakan, menyadarkan, pengimpor, mendatangkan, diimpor, mengajukan, importir, mengadakan, mengimpor, membawa, menimbulkan, barang, kepetingan, menyebabkan, menghasilkan, perdagangan, luar, negeri Bahasa Baja, kerajinan, perindustrian, proyek, kota Mengadakan, lembaga Mengeringkan, dikeringkan, pengeringan, sifat, kemarau, sekali, kering, musim, masa Bakar, kayu, kekurangan Pengelompokan, grup, berkumpul, tandan, sekelompok, anggur, kategori, golongan, buah, kelompok, kecil Mengeringkan, gersang, dikeringkan, pengeringan, menarik, menguntungkan, tanah Dagangan, keperluan, pokok, barang, utama, bahan Mantri, pembantu, asisten Masa 16

25 Lampiran 3 Lanjutan Kueri Obat Organik Panen Pangan Pembangunan Pemerintah Pendapatan Penerapan Peningkatan Penyakit Penyuluhan Perdagangan Petani Peternak Peternakan Produk Pupuk Rakyat Riset Sektor Sistem Swasembada Istilah terjemahan Serbuk, racun, kedokteran, belajar, ilmu, kimia, bahan Karbon, mengandung, dasar Pemungutan, memungut, memotong, memanen, padi, hasil Masakan, makanan, bahan Susunan, pendirian, penegakan, pembentukan, bangunan, pembukaan, pembuatan, perkembangan, pertumbuhan, bentuk, perusahaan Pemerintahan, politik, ilmu Bayaran, gaji, upah, penghasilan, memperoleh Penggunaan, ketekunan, pemasangan, majelis, kumpulan, pertemuan, permintaan Daftar, meratakan, mempertinggi, timbangan, nada, melontarkan, melancarkan, huruf, naiknya, reaksi, menaikkan, berkembangnya, memperluas, derajat, pertambahan, dataran, ketinggian, kelas, permukaan, bertamabah, kenaikan Jahat, menyusahkan, penyebar, kesusahan, kekacauan, jelek, susah, busuk, sakit, buruk, mengganggu, keadaan, meminta, persoalan hiasan, uraian, penerangan, penjelasanm keterangan, memperoleh, bagian, pusat Kejuruan, keterampilan, langganan, menukar, berdagang, pembeli, tukar, tambah Tani, petani Keturunannya Hewani, binatang, protein, pemeliharaan, ilmu, hewan, pertanian Kali, hasil, pertanian Memupuk Khalayak, ramai, mass, penduduk Menyelidiki, penyelidikan, meneliti, ilmiah, penelitian Kawasan, bidang Sistim, susunan, jaringan, cara Secukupnya, dirinya, mengatur, diri, sendiri, cukup 17

beberapa tag-tag lain yang lebih spesifik di dalamnya.

beberapa tag-tag lain yang lebih spesifik di dalamnya. metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j 3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan

Lebih terperinci

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya. beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini

Lebih terperinci

HASIL DAN PEMBAHASAN. sim(, )=

HASIL DAN PEMBAHASAN. sim(, )= 4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :

Lebih terperinci

Lampiran 1 Contoh koleksi dokumen. <DOC> <DOCNO>gatra </DOCNO> <TITLE>Semarang Kembangkan Sapi Potong Gemuk</TITLE> <AUTHOR>Tma,

Lampiran 1 Contoh koleksi dokumen. <DOC> <DOCNO>gatra </DOCNO> <TITLE>Semarang Kembangkan Sapi Potong Gemuk</TITLE> <AUTHOR>Tma, LAMPIRAN 11 12 Lampiran 1 Contoh koleksi dokumen. gatra230103-002 Semarang Kembangkan Sapi Potong Gemuk Tma, Ant 23 Januari 2003

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN KAMUS DWIBAHASA NETTY LAORA SITOHANG

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN KAMUS DWIBAHASA NETTY LAORA SITOHANG EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN KAMUS DWIBAHASA NETTY LAORA SITOHANG DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUANN ALAM INSTITUT PERTANIAN

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium

Lebih terperinci

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut

Lebih terperinci

EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI

EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI EKSPANSI KUERI MENGGUNAKAN METODE SEMANTIC SIMILARITY RETRIEVAL MODEL (SSRM) SRI RAHAYU ISMANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA Fridolin Febrianto Paiki Universitas Papua, Jl. Gunung Salju, Amban, Manokwari ff.paiki@unipa.ac.id

Lebih terperinci

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan

Lebih terperinci

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009

Lebih terperinci

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

Lebih terperinci

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 XML RETRIEVAL UNTUK DOKUMEN

Lebih terperinci

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI 18 PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI Karter D. Putung, Arie Lumenta, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi Manado, Indonesia. karterputung@gmail.com,

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen 6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita 6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer CORPUS DOKUMEN TEKS BAHASA INDONESIA UNTUK PENGUJIAN EFEKTIVITAS TEMU KEMBALI INFORMASI Oleh: Ir. Julio Adisantoso, M.Kom.

Lebih terperinci

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL Susetyo Adi Nugroho () Abstrak: Salah satu metode yang sering digunakan dalam mengukur relevansi dokumen

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING

Lebih terperinci

2. Ketepatan untuk setiap jawaban.

2. Ketepatan untuk setiap jawaban. dikembalikan sebagai top passage dari kueri pertanyaan yang diberikan. 5. Ekstraksi Jawaban Top passages yang diperoleh dilakukan perhitungan terhadap jarak kata. Entitas yang memiliki jarak terpendek

Lebih terperinci

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA Oleh: YUDHA PERMADI G64102064 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008

Lebih terperinci

PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI

PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan

Lebih terperinci

Lampiran 1 Antarmuka implementasi

Lampiran 1 Antarmuka implementasi LAMPIRAN 16 Lampiran 1 Antarmuka implementasi 17 17 Lampiran 2 Contoh dokumen XML dalam koleksi pengujian indosiar050704-001 SumKa Presiden Megawati Lakukan

Lebih terperinci

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal

Lebih terperinci

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester

Lebih terperinci

KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA

KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract IMPLEMENTASI SISTEM TEMU KEMBALI INFORMASI Studi Kasus: Dokumen Teks Berbahasa Indonesia (IMPLEMENTATION OF INFORMATION RETRIEVAL SYSTEM Case Study: Text Document in Indonesian Language) Bernadus Very

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Identifikasi Masalah Merumuskan Masalah Study Literatur Perancangan Struktur Menu Interface Analisa

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

SISTEM TEMU KEMBALI INFORMASI

SISTEM TEMU KEMBALI INFORMASI SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak

Lebih terperinci

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 1 PERBANDINGAN

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang Masalah BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Seiring dengan perkembangan informasi, banyak pihak menyadari bahwa masalah utama telah bergeser dari cara mengakses atau bagaimana mencari informasi, namun

Lebih terperinci

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Pengujian Kerelevanan Sistem Temu Kembali Informasi Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document Jurnal Ilmiah Widya Teknik Volume 15 Nomor 2 2016 ISSN 1412-7350 SISTEM PEMEROLEHAN INFORMASI UNDANG-UNDANG DAN KASUS MENGGUNAKAN STRUKTUR DATA INVERTED INDEX DENGAN PEMBOBOTAN TF-IDF Fredes Winda Oktaviani

Lebih terperinci

Mencari dokumen yang dituliskan dalam berbagai bahasa

Mencari dokumen yang dituliskan dalam berbagai bahasa Always Siempre Mencari dokumen yang dituliskan dalam berbagai bahasa Menggunakan query yang dituliskan dalam sebuah bahasa Pengguna internet jumlahnya terus meningkat dari tahun ke tahun dan tersebar

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &

Lebih terperinci

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom IMPLEMENTASI MODEL RUANG VEKTOR SEBAGAI PENERJEMAH QUERY PADA CROSS-LANGUAGE INFORMATION RETRIEVAL SISTEM IMPLEMENTATION OF VECTOR SPACE MODEL AS QUERY TRANSLATION FOR CROSS-LANGUAGE INFORMATION RETRIEVAL

Lebih terperinci

PENGEMBANGAN APLIKASI LOST & FOUND BERBASIS WEBSITE DENGAN FITUR PENCARIAN MENGGUNAKAN COSINE SIMILARITY. Tugas Akhir

PENGEMBANGAN APLIKASI LOST & FOUND BERBASIS WEBSITE DENGAN FITUR PENCARIAN MENGGUNAKAN COSINE SIMILARITY. Tugas Akhir PENGEMBANGAN APLIKASI LOST & FOUND BERBASIS WEBSITE DENGAN FITUR PENCARIAN MENGGUNAKAN COSINE SIMILARITY Tugas Akhir Diajukan untuk Memenuhi Persyaratan Meraih Gelar Sarjana Strata 1 Teknik Informatika

Lebih terperinci

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

BAB I PERSYARATAN PRODUK

BAB I PERSYARATAN PRODUK BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem

Lebih terperinci

EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G

EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN PELUANG BERSYARAT R U S I D I G64103024 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency PERSETUJUAI\ ARTIKEL ILMIAH Artikel ilmiah hasil penelitian mahasiswa: Nama NIM Mashar Eka Putra Dai 53 1409036 Program Studi S1-Sistem Informasi Jurusan Teknik Informatika Fakultas Teknik Judul Karya

Lebih terperinci

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Wahyudi,MT Laboratorium Sistem Informasi Fakultas Sains dan Teknologi UINSUSKA RIAU Jl.HR.Subrantas KM.15

Lebih terperinci

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI

Lebih terperinci

V HASIL DAN PEMBAHASAN

V HASIL DAN PEMBAHASAN 22 V HASIL DAN PEMBAHASAN 5.1 Karakteristik Video dan Ektraksi Frame Video yang digunakan di dalam penelitian ini merupakan gabungan dari beberapa cuplikan video yang berbeda. Tujuan penggabungan beberapa

Lebih terperinci

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB RIYAN ADI LESMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENGEMBANGAN WORDNET BAHASA

Lebih terperinci

SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak

SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF Muh. Alfarisi Ali¹, Moh. Hidayat Koniyo², Abd. Aziz Bouty³ ¹Mahasiswa Teknik Informatika Universitas

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami

Lebih terperinci

PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN

PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi

Lebih terperinci

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik

Lebih terperinci

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya Terhadap Peningkatan Kinerja Image Search Engine Nugroho Herucahyono (13504038) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika,

Lebih terperinci

ROCCHIO CLASSIFICATION

ROCCHIO CLASSIFICATION DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir

Lebih terperinci

SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS

SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS Surya Agustian 1, Imelda Sukma Wulandari 2 1,2 Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, UIN

Lebih terperinci

Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information

Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information Ratnadira Widyasari 13514025 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi

Lebih terperinci

Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor

Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor Persoalan 1: Ada 4 dokumen (D1 s.d D4): D1: dolar naik harga naik penghasilan turun D2: harga naik harusnya gaji juga naik D3: Premium tidak

Lebih terperinci

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM Lusianto Marga Nugraha¹, Arie Ardiyanti Suryani², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Stemming

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada era ini perkembangan teknologi informasi sangat pesat. Hal ini ditandai dengan semakin populernya penggunaan internet dan perangkat lunak komputer sebagai

Lebih terperinci

Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25

Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25 54 Widiasri, M., dkk.: Peningkatan Kinerja Pencarian Dokumen Tugas Akhir Menggunakan Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi

Lebih terperinci

PROGRAM STUDI INFORMATIKA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA

PROGRAM STUDI INFORMATIKA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA PERBANDINGAN HASIL DETEKSI KEMIRIPAN TOPIK SKRIPSI DENGAN MENGGUNAKAN METODE N-GRAM DAN EKSPANSI KUERI Disusun oleh : Dwi iswanto L200100014 Pembimbing : Husni Thamrin PROGRAM STUDI INFORMATIKA FAKULTAS

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan

Lebih terperinci

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu

Lebih terperinci

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE Rila Mandala Kelompok Keahlian Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10 Bandung,

Lebih terperinci

DAMPAK KEBIJAKAN HARGA DASAR PEMBELIAN PEMERINTAH TERHADAP PENAWARAN DAN PERMINTAAN BERAS DI INDONESIA RIA KUSUMANINGRUM

DAMPAK KEBIJAKAN HARGA DASAR PEMBELIAN PEMERINTAH TERHADAP PENAWARAN DAN PERMINTAAN BERAS DI INDONESIA RIA KUSUMANINGRUM DAMPAK KEBIJAKAN HARGA DASAR PEMBELIAN PEMERINTAH TERHADAP PENAWARAN DAN PERMINTAAN BERAS DI INDONESIA RIA KUSUMANINGRUM SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2008 SURAT PERNYATAAN Saya menyatakan

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

Identifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN

Identifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN 5 Identifikasi Tipe Pertanyaan Ada beberapa tipe pertanyaan yang digunakan dalam Bahasa Indonesia, yaitu: 1 APA, yang menanyakan suatu pengertian, tujuan, manfaat, kata benda, baik abstrak maupun konkret

Lebih terperinci

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:

Lebih terperinci

TEMU KEMBALI INFORMASI

TEMU KEMBALI INFORMASI JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 1 Identitas Mata Kuliah Nama Mata Kuliah : Temu Kembali Informasi (TKI) Information Retrieval (IR) Kode Mata Kuliah : KOM431 Koordinator : Julio

Lebih terperinci

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Dokumen Penyimpanan yang Terorganisasi Database Mahasiswa Database Buku ID Nama Buku Pengarang 001 Information Retrieval Ricardo baeza

Lebih terperinci