HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen

dokumen-dokumen yang mirip
Identifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN

IMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED PADA BANYAK DOKUMEN BERBAHASA INDONESIA ROMAIDA DOLAROSA SIANTURI

HASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan.

2. Ketepatan untuk setiap jawaban.

BAB III METODOLOGI PENELITIAN

beberapa tag-tag lain yang lebih spesifik di dalamnya.

IMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED PADA TERJEMAHAN AL QUR AN SURAT AL BAQARAH MEYNAR DWI ANGGRAENY G

PEMILIHAN DEPARTEMEN FAKULTAS

HASIL DAN PEMBAHASAN. sim(, )=

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j

HASIL DAN PEMBAHASAN. B fch a. d b

BAB I PENDAHULUAN 1.1. Latar Belakang

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.

Aplikasi Question Answering System dengan Metode Rule-Based Question Answering System pada Alkitab

Code shift Asumsi-asumsi Pengaburan Kode Lingkungan Pengembangan HASIL DAN PEMBAHASAN Karakteristik Dokumen Perlakuan ( Treatment

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

BAB III METODOLOGI PENELITIAN

IMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED UNTUK TEMU KEMBALI INFORMASI BERBAHASA INDONESIA. Oleh: NAFI IKHSANI G

Lingkungan Pengembangan HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Pengolahan Query

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB 3 ANALISIS DAN PERANCANGAN

Rata-rata token unik tiap dokumen

BAB III METODOLOGI PENELITIAN

BAB 3 METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN UKDW

III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

Gambar 4 Ilustrasi bagian dokumen yang digunakan untuk pemrosesan.

BAB V IMPLEMENTASI DAN PEMBAHASAN. dibutuhkan Hardware dan software untuk menggunakan program Sistem Informasi

APLIKASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED QUESTION ANSWERING SYSTEM PADA ALKITAB

BAB 1 PENDAHULUAN Pengantar

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

HASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi.

BAB III METODOLOGI PENELITIAN

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer

BAB 1 PENDAHULUAN 1.1 Pengantar 1.2 Latar Belakang Masalah

PENDAHULUAN. Latar belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PERSYARATAN PRODUK

BAB 4 HASIL PENELITIAN DAN PEMBAHASAN. Berikut ini adalah contoh tampilan hasil dari kueri:

BAB I PENDAHULUAN Latar Belakang

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

BAB 1 PENDAHULUAN 1.1. Latar belakang

METODE PENELITIAN. Gambar 2 Metodologi penelitian.

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 4 IMPLEMENTASI DAN EVALUASI

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Pendahuluan. 1.2 Latar Belakang Masalah

BAB III ANALISIS DAN PERANCANGAN

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

BAB IV HASIL DAN UJI COBA

BAB IV ANALISA DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB III METODOLOGI PENELITIAN

1. PENDAHULUAN 1.1 Latar belakang Masalah

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB IV HASIL DAN UJI COBA

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

BAB V IMPLEMENTASI DAN PENGUJIAN

BAB 3 PERANCANGAN SISTEM

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

BAB I PENDAHULUAN. tersebut dibuktikan dengan semakin canggihnya perangkat keras seperti prosesor,

UKDW BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

ANALISIS PERTANYAAN BERBAHASA INDONESIA PADA QUESTION ANSWERING SYSTEM (QAS) KARTINA

BAB III ANALISIS DAN PERANCANGAN

BAB 1 PENDAHULUAN Pengantar

UKDW BAB 1 PENDAHULUAN Latar Belakang Masalah

BAB V IMPLEMENTASI DAN PENGUJIAN

BAB II LANDASAN TEORI

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

BAB IV IMPLEMENTASI DAN EVALUASI SISTEM

BAB III METODOLOGI PENELITIAN

Lampiran 1 Antarmuka implementasi

BAB III METODOLOGI PENELITIAN

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan

Indexing dan Bahasa Penelusuran

APLIKASI INVENTARIS BUKU UNTUK PERPUSTAKAAN BERBASIS WEB. Sir Kalifatullah Ermaya. Abstrak

U K D W BAB I PENDAHULUAN

BAB V IMPLEMENTASI DAN PENGUJIAN. yang digunakan untuk menulis program dan membentuk tabel-tabel basis data.

BAB III PEMBAHASAN. untuk menampilkan ringkasan dari teks yang dimasukkan pengguna. Ringkasan

1.1 Latar Belakang Masalah

Bab 1 PENDAHULUAN UKDW

BAB 4 IMPLEMENTASI DAN EVALUASI

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB V IMPLEMENTASI PERANGKAT LUNAK. Aplikasi setelah dianalisa dan dirancang, maka aplikasi tersebut siap

BAB V IMPLEMENTASI DAN PEMBAHASAN. perpustakaan SMA N 14 Surabaya dibutuhkan: 1. Sistem Operasi Microsoft Windows XP Profesional

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III ANALISIS DAN PERANCANGAN SISTEM. utuh dan nyata ke dalam bagian-bagian atau komponen-komponen komputer yang

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA

TES. Pustakawan Dalam Pengelolaan Database. Atas bantuan Bapak/Ibu/Sdr saya. 2. Nama BapakIbu/Sdr tidak perlu dicantumkan.

UKDW BAB I PENDAHULUAN

Transkripsi:

6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat keras : Prosesor AMD Turion, 2.2 GHz RAM 512 MB Harddisk dengan kapasitas 80 GB HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Dokumen yang digunakan sebagai dokumen uji diambil dari korpus yang sudah tersedia di Laboratorium Temu Kembali Informasi Departemen Ilmu Komputer IPB. Sumbernya adalah media koran, media majalah, media internet, dan lain-lain. Dari 958 dokumen dan 30 topik yang dibicarakan dalam dokumen, penulis hanya mengambil 60 dokumen dan 5 topik (bencana kekeringan, pertanian organik, flu burung, gagal panen dan kelangkaan pupuk) yang dibicarakan di dalamnya sebagai koleksi dokumen. Pengambilan dokumen dan topik dilakukan secara acak atau tidak memiliki aturan tertentu. Dokumen sebagai koleksi memiliki format teks (*.txt) dan terdapat struktur tag XML didalamnya. Dokumen disimpan dalam satu direktori. Nama dokumen berdasarkan sumber data dan tanggal data tersebut diterbitkan, misalnya Gatra070203.txt yang berarti data berasal dari majalah Gatra dan diterbitkan oleh Gatra pada tanggal 07 bulan Februari tahun 2003. Satu dokumen dapat berisi beberapa artikel bacaan. Satu dokumen berisi minimal satu kalimat dan sebuah kalimat harus diakhiri dengan tanda titik (.). Sementara untuk kalimat yang diakhiri dengan tanda tanya (?), tanda seru (!) dan tidak berhubungan dengan kalimat sesudahnya maka dilakukan penambahan tanda titik (.) secara manual. Indexing Hal yang pertama dilakukan pada saat Indexing adalah menyimpan nama dokumen yang digunakan sebagai dokumen uji ke tabel tb_dokumen. Struktur tabel tb_dokumen dapat dilihat pada Tabel 1. Tabel 1 Struktur tabel tb_dokumen Nama Tipe Data Keterangan iddok INT Primary key namadok VARCHAR (100) Proses penyimpanan nama dokumen tidak berurutan karena pengambilan nama dokumen oleh sistem dilakukan secara acak. iddok merupakan urutan penyimpanan dokumen berdasarkan jumlah dokumen yang digunakan. Nama dokumen disimpan dalam kolom namadok. Parsing yang dilakukan pada dokumen diawali dengan memisahkan kalimat-kalimat dokumen berdasarkan separator titik (.). Hasil proses ini berupa array kalimat yang kemudian disimpan dalam tabel tb_kalimat. Struktur tabel tb_kalimat dapat dilihat pada Tabel 2. Tabel 2 Struktur tabel tb_kalimat Nama Tipe Data Keterangan idkal INT Primary key iddok INT Primary key kalimat VARCHAR(8000) - score INT - idkal menunjukkan urutan kalimat pada dokumen bersangkutan. iddok mengacu ke kolom iddok pada tabel tb_dokumen. kalimat berisi array kalimat yang dihasilkan oleh proses parsing. score digunakan untuk menyimpan nilai yang diperoleh masing-masing kalimat dari proses WordMatch dan pembobotan berdasarkan rule. Pada Indexing dokumen dan awal proses pengolahan terhadap kueri pengguna, kolom score masing-masing kalimat diberi nilai nol (0). Parsing pada kalimat diawali dengan proses case folding (membuat semua huruf pada teks yang akan diparsing menjadi huruf kecil). Penelitian ini tidak melakukan penghilangan stopwords karena semua kata dianggap penting dan masih akan mengalami proses stemming. Penulis memanfaatkan algoritme parsing Ikhsani (2006). Proses ini akan menghasilkan token-token yang disimpan pada array sementara untuk -

7 kemudian dilanjutkan dengan proses stemming. Stemming dilakukan pada setiap token hasil parsing kalimat dengan menggunakan algoritme stemming Ikhsani (2006). Dalam prosesnya, stemming menghasilkan beberapa kata yang tidak sesuai dengan tata bahasa baku misalnya kata leta. Proses stemming melakukan penghilangan huruf k di awal dan akhir kata. Sehingga kata letak menjadi leta. Padahal ketika menjadi kata leta, kata tersebut menjadi tidak memiliki makna apaapa. Tetapi hal tersebut tidak mempengaruhi sistem yang dibangun karena setiap kueri pertanyaan yang akan diproses oleh sistem juga mengalami proses parsing dan stemming. Proses selanjutnya, hasil stemming dimasukkan ke dalam tabel tb_kata. Struktur tabel tb_kata dapat dilihat pada Tabel 3. Tabel 3 Struktur tabel tb_kata Nama Tipe Data Keterangan idkata INT Primary key idkal INT - kata VARCHAR(100) - idkal mengacu pada kolom idkal pada tabel tb_kalimat. Hasil parsing dan stemming untuk masing-masing kalimat pada tabel tb_kalimat disimpan di kolom kata pada tabel tb_kata. Setelah proses Indexing selesai dilakukan diperoleh hasil seperti yang ada di Lampiran 2. Algoritme Rule Mengacu pada algoritme yang dibuat Riloff & Thelen (2000) dan algoritme yang diimplementasikan oleh Ikhsani (2006), penulis membuat algoritme rule dengan melakukan beberapa modifikasi. Algoritme rules yang dibuat dan diimplementasikan ke dalam sistem adalah algoritme APA, SIAPA, KAPAN, MANA dan MENGAPA. Seperti yang dituliskan di bawah. 1 KAPAN If contains(s,{saat, ketika, kala, semenjak, sejak, waktu, setelah, sebelum, sesudah,selama, pada}) and contains(s, TIME) If contains(q,time) Or containss(s, TIME) Score(S) += good_clue If contains(s,{saat, ketika, kala, semenjak, sejak, waktu, setelah, sebelum}) Score(S) +=good_clue Untuk algoritme rule menggunakan kata tanya KAPAN, juga memiliki perbedaan dengan algoritme rule yang sudah dibuat oleh Ikhsani (2006). Selain pada pemberian nilai score, untuk kondisi if yang pertama, penulis menambahkan kata sesudah, selama dan pada. 2 MANA If contains(s,location) and contains(s,{dalam, dari, pada}) If contains(s,{dalam, dari, pada}) Score(S) += clue If contains(s,location) Score(S) += good_clue 3 MENGAPA If contains(s,{karena, sebab, akibat, maka, agar, supaya}) Score(S) += clue Untuk kueri pertanyaan dengan menggunakan kata tanya MANA algoritme rule yang dibuat sama dengan yang sudah dibuat oleh Ikhsani (2006). Sementara untuk kueri pertanyaan dengan menggunakan kata tanya MENGAPA, perbedaannya terletak pada kondisi if yaitu pemberian nilai score untuk dan penambahan kata agar dan supaya. 4 SIAPA If contains(q,human) Berbeda dengan kueri pertanyaan dengan kata tanya APA, algortima rule untuk kueri pertanyaan dengan kata tanya SIAPA yang diimplementasikan pada sistem yang dibangun oleh penulis berbeda dengan algoritme rule yang telah diimplementasikan oleh Ikhsani (2006). Perbedaannya terletak pada pemberian nilai score. 5 APA If contains(q,{tujuan, manfaat}) and contains(s,{untuk, guna})

8 Elseif contains(q,{maksud}) and contains(s,{adalah, ialah, yaitu}) Elseif contains(s,{adalah, ialah}) Algortima rule untuk kueri pertanyaan dengan kata tanya APA yang diimplementasikan pada sistem yang dibangun oleh penulis sama dengan algoritme rule yang telah diimplementasikan oleh Ikhsani (2006). Fungsi dan notasi yang digunakan dalam rules tersebut adalah sebagai berikut : Notasi S = sentence (kalimat dokumen). Notasi Q = query (kalimat kueri). Fungsi contains adalah fungsi untuk memeriksa kalimat dokumen dan kalimat kueri pertanyaan, apakah mengandung kata yang telah ditentukan. Fungsi WordMatch adalah fungsi untuk memeriksa kesamaan kata. Fungsi score adalah fungsi pemberian nilai pada kalimat dokumen. Parsing dan WordMatch Algoritme parsing dokumen menjadi kalimat-kalimat berdasarkan separator titik (. ) dibuat sendiri oleh penulis. Namun untuk parsing kalimat-kalimat dokumen dan kalimat kueri menjadi token-token serta algoritme stemming, penulis memanfaatkan algoritme yang sudah ada di Laboratorium Temu Kembali Informasi, Departemen Ilmu Komputer, Institut Pertanian Bogor (IPB). Algoritme WordMatch memanfaatkan algoritma yang sudah digunakan pada penelitian yang dilakukan oleh Ikhsani (2006). Algoritme WordMatch membandingkan token-token pada setiap kalimat dokumen dengan token-token pada kalimat kueri, yang telah melalui proses stemming. Setiap token yang sama akan menambahkan nilai clue (+3) pada kalimat dokumen tersebut. Hasil Percobaan Percobaan dilakukan pada seluruh dokumen yang ada. Dokumen yang digunakan sebanyak 60 dokumen. Seluruh dokumen diberi lima tipe kueri pertanyaan yang kalimat pertanyaannya menggunakan kata tanya APA, SIAPA, KAPAN, MENGAPA dan MANA. Untuk masing-masing tipe pertanyaan diberikan empat kueri pertanyaan yang sudah dibuat sebelumnya oleh penulis. Antarmuka prototipe Question Answering System dapat dilihat pada Lampiran 3. Penghitungan persentase hasil jawaban yang benar yang berhasil dikembalikan oleh sistem dilakukan untuk masing-masing tipe pertanyaan. Penghitungan dilakukan dengan cara membandingkan jumlah kalimat yang benar yang ditemukembalikan oleh sistem dengan jumlah keseluruhan kalimat yang ditemukembalikan oleh sistem pada masingmasing nilai ambang batas yang ditentukan. Yang dimaksud dengan hasil yang benar adalah jika ada jawaban yang relevan yang berhasil dikembalikan walaupun tidak memiliki nilai tertinggi. Hasil percobaan berdasarkan nilai ambang batas dapat dilihat pada Gambar 3 dan berdasarkan Recall Precision dapat dilihat pada Gambar 4. Evaluasi Question Answering System Berdasarkan Nilai Ambang Batas Tujuan dari temu kembali informasi yaitu menemukembalikan informasi yang relevan dan sesedikit mungkin menemukembalikan informasi yang tidak relevan. Hasil dari Gambar 3 dapat diuraikan sebagai berikut : 1 Tipe pertanyaan KAPAN, terlihat bahwa kinerja sistem paling tinggi dicapai saat pemakaian nilai ambang batas 26. Dengan ambang batas 26, persentase hasil yang benar mencapai 94,44 % dan nilai persentase yang paling kecil dicapai saat pemakaian ambang batas 3 yaitu 14,67 %. 2 Tipe pertanyaan MANA, terlihat bahwa kinerja sistem yang tinggi dicapai saat pemakaian nilai ambang batas 13, 15 dan 26. Dengan ambang batas 13, 15, persentase hasil yang benar mencapai 64,95% dan ambang batas 26 mencapai 76,8 %. Nilai persentase yang paling kecil dicapai saat pemakaian ambang batas 3 yaitu 21,55 %. 3 Tipe pertanyaan MENGAPA, terlihat bahwa kinerja sistem paling tinggi dicapai saat pemakaian ambang batas 7. Dengan ambang batas 7, persentase hasil yang benar mencapai 64,19% dan nilai persentase yang paling kecil dicapai saat pemakaian ambang batas 3 yaitu 7,22%. 4 Tipe pertanyaan SIAPA, terlihat bahwa kinerja sistem paling tinggi dicapai saat pemakaian ambang batas 26 dan 29.

9 Persentase Relevansi (%) 100,0% 90,0% 80,0% 70,0% 60,0% 50,0% 40,0% 30,0% 20,0% 10,0% 0,0% 3 6 7 9 10 12 13 15 23 26 29 Treshold of score Gambar 3 Persentase hasil yang benar KAPAN MANA MENGAPA SIAPA APA Precision 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 KAPAN MANA MENGAPA SIAPA APA Recall Gambar 4 Recall Precision Dengan ambang batas 26 dan 29, persentase hasil yang benar mencapai 50% dan nilai persentase yang paling kecil dicapai saat pemakaian ambang batas 3 yaitu 7,22 %. 5 Tipe pertanyaan APA, terlihat bahwa kinerja sistem kurang baik dengan nilai persentase yang sangat kecil. Nilai tertinggi yaitu sebesar 25,88% dicapai saat pemakaian ambang batas 9. Nilai persentase untuk ambang batas 3 sangat kecil karena sistem mengembalikan sedikit jawaban yang benar dari semua kalimat jawaban yang terdapat pada relevance judgement dan mengembalikan semua kalimat pada basis data yang memiliki score = 3. Evaluasi Sistem Berdasarkan Rule Setiap rule yang dibuat pasti tidak memiliki kinerja yang sama dengan rule yang lain. Gambar 4 menunjukkan perbedaan

10 kinerja sistem untuk masing-masing rule menggunakan rumus Recall Precision. Berdasarkan Gambar 3 dan Gambar 4 terlihat bahwa kinerja sistem yang paling buruk adalah kueri pertanyaan dengan menggunakan kata tanya APA. Berbeda dari sistem yang telah diimplementasikan oleh Ikhsani (2007), rule APA memiliki kinerja yang paling baik dibandingkan dengan rules yang lain yaitu mencapai 81,94%. Sementara untuk sistem ini, persentase hasil jawaban yang benar hanya mencapai 25,88% dan nilai Recall Precision tertinggi mencapai 0.46. Hal ini disebabkan oleh rule APA yang hanya membatasi kalimat jawaban yang dikembalikan mengandung kata ialah, adalah, maksud, untuk, guna, manfaat dan tujuan. Sementara di dokumen yang digunakan sebagai dokumen uji jarang sekali ditemukan kalimat yang mengandung kata-kata tersebut. Dengan demikian sistem akan mengembalikan kalimat jawaban yang relevan lebih sedikit. dibandingkan dengan kalimat jawaban yang tidak relevan. Selain itu koleksi dokumen yang menggunakan bahasa yang tidak baku (tidak sesuai dengan EYD) juga mempengaruhi kinerja rule APA. Kinerja sistem yang paling tinggi dicapai oleh kueri pertanyaan KAPAN. Terlihat bahwa nilai persentase hasil jawaban yang benar mencapai 94,44 % dan nilai Recall Precision mencapai 0,93. Kenaikan cukup drastis dicapai pada nilai ambang batas 26 dan membuat nilai Recall Precision mencapai nilai tertinggi. Hal ini disebabkan oleh karena sistem mengembalikan kalimat jawaban yang relevan lebih banyak dibandingkan dengan kalimat jawaban yang tidak relevan dan rule yang digunakan sudah cukup baik. Kinerja sistem untuk kueri pertanyaan MANA sudah cukup baik dengan nilai Recall Precision tertinggi sebesar 0,88 dan nilai ambang batas tertinggi sebesar 76,86 %. Dengan menggunakan nilai ambang batas tertinggi yaitu 26, sistem mengembalikan cukup banyak kalimat jawaban yang relevan yang membuat nilai Recall Precision cukup tinggi. Untuk kueri pertanyaan MENGAPA, nilai Recall Precision yang dicapai sebesar 0.65 dan dicapai saat pemakaian nilai ambang batas = 7. Kueri pertanyaan SIAPA, nilai Recall Precision yang dicapai sebesar 0,84 dan nilai tersebut dicapai ketika menggunakan nilai ambang batas = 26. Masih banyak kalimat jawaban yang tidak relevan yang dikembalikan oleh sistem. Hal ini mungkin disebabkan rule yang masih belum sempurna. Kelebihan dan Kekurangan Sistem Kelebihan dan kekurangan Question Answering System (QAS) yang telah dibangun adalah sebagai berikut : Kelebihan: Indexing dokumen hanya dilakukan satu kali yaitu di awal pembangunan sistem. Kueri pertanyaan menggunakan bahasa yang alami. Penggunaan nilai ambang batas yang memudahkan pengguna untuk menentukan sendiri score minimal yang harus dikembalikan dan memutuskan sendiri kalimat jawaban yang relevan menurut pengguna. Kekurangan: Jika terdapat penambahan dokumen, maka harus dilakukan pengindeksan ulang. Tidak dilakukan kajian terhadap makna semantik dalam dokumen. Kamus yang digunakan belum dibuat otomatis tapi secara manual dibuat penulis. Masih harus ada penyempurnaan untuk algoritme rule agar dokumen yang dikembalikan nilai persentasenya lebih bagus. KESIMPULAN DAN SARAN Kesimpulan Berdasarkan penelitian yang dilakukan, dapat disimpulkan bahwa metode rule-based dapat diterapkan untuk implementasi QAS (Question Answering System) untuk temu kembali banyak dokumen berbahasa Indonesia. Kinerja sistem sangat berbeda satu sama lain. Kinerja sistem tertinggi dengan penggunaan nilai ambang batas 23, yang mengembalikan rata rata 0,5 atau sebagian kalimat jawaban yang relevan dari keseluruhan kalimat jawaban yang relevan yang seharusanya dikembalikan oleh sistem. Berdasarkan evaluasi menggunakan KAPAN, MANA, MENGAPA, SIAPA dan APA, rule KAPAN memiliki kinerja tertinggi.