QUERY REWRITING BERBASIS SEMANTIK MENGGUNAKAN WORDNET DAN LCh PADA SEARCH ENGINE GOOGLE

dokumen-dokumen yang mirip
Pentingnya Peranan Bahasa dalam Interoperabilitas Informasi berbasiskan Komputer karena Keragaman Semantik

Pendekatan Schema Matching dalam Bahasa Indonesia

KLASIFIKASI BERITA BERDASARKAN PENDEKATAN SEMANTIK. Dimas Bagus Prasetyo 1 Freddy Arviando 2, Muhammad Farhan Mubarak 3 Sandy Febriant Eka Putra 4

Membandingkan Pendekatan Latent Semantic terhadap WordNet untuk Semantic Similarity

Pengembangan Aplikasi Antar-muka Pemakai untuk Penghitungan Similaritas Semantik Berbasis String dan Wordnet

@UKDW BAB 1 PENDAHULUAN Latar Belakang

APLIKASI WEB PENGUJIAN KESERUPAAN XML DENGAN METODA EDIT DISTANCE

Analisis dan Implementasi Kesamaan Semantik Antar Kata Menggunakan Pengukuran Berbasis Path

APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. masalah, keaslian penelitian, manfaat penelitian) dan juga tujuan penelitian.

BAB I PENDAHULUAN. Begitu juga halnya pada perkembangan Internet, hampir semua bidang teknologi

PENCARIAN CITRA BERDASARKAN BENTUK DASAR TEPI OBJEK DAN KONTEN HISTOGRAM WARNA LOKAL

IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE

TINJAUAN SIMILARITAS SEMANTIK DALAM PEMELIHARAAN ONTOLOGI PADA PEER-TO-PEER (P2P)

USER GUIDE. Aplikasi Ekstraksi Data Tidak Terstruktur

PENERAPAN SEMANTIC SEARCHING BERBASIS ONTOLOGI PADA PERPUSTAKAAN DIGITAL

BAB I PENDAHULUAN 1.1 Latar Belakang

PENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM

ALGORITMA UNTUK EKSTRAKSI TABEL HTML DI WEB

UNIVERSITAS GUNADARMA

Implementasi Generalized Vector Space Model Menggunakan WordNet

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Permasalahan

BAB II LANDASAN TEORI

PENGELOMPOKAN DOKUMEN MENGGUNAKAN ALGORITMA DIG (DOCUMENT INDEX GRAPH)

Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

Pemodelan Pengukuran Tingkat Kematangan Kerangka Kerja COBIT Menggunakan Ontology

BAB 2. TINJAUAN PUSTAKA

KATA PENGANTAR. Rektor. Dekan. Ketua Program Studi. Pembimbing. Teman. orang tua dan keluarga

Pengujian Kerelevanan Sistem Temu Kembali Informasi

BAB I PENDAHULUAN. Dalam suatu basis data, pendekatan model data relasional masih banyak dimanfaatkan untuk penyimpanan data dan informasi terhadap

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENGENALAN OBJEK PADA CITRA BERDASARKAN SIMILARITAS KARAKTERISTIK KURVA SEDERHANA

PENERAPAN SEMANTIC SIMILARITY PADA KRIPTOGRAFI SUATU DOKUMEN TEKS DALAM BAHASA INDONESIA

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract

BAB 1 PENDAHULUAN. Universitas Indonesia

PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING

BAB I PENDAHULUAN. dalam memproses data akan meningkatkan efektivitas, produktivitas, serta

Metode Mengatasi Keragaman Semantik Antara Informasi di Pemasok dan Manufaktur pada Manajemen Rantai Persediaan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PERANCANGAN PORTAL DOKUMEN ILMIAH DENGAN FASILITAS PENCARIAN YANG MENERAPKAN EKSPANSI KUERI. Makalah

UNIVERSITAS GUNADARMA DIREKTORAT PROGRAM DIPLOMA TIGA TEKNOLOGI INFORMASI DIREKTORAT PROGRAM DIPLOMA TIGA TEKNOLOGI INFORMASI

khazanah Efektivitas Algoritma Semantik dengan Keterkaitan Kata dalam Mengukur Kemiripan Teks Bahasa Indonesia informatika

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK PENCARIAN WEB SERVICE MENGGUNAKAN LUCENE

KATA PENGANTAR. Rektor. Dekan. Ketua Program Studi. Pembimbing. Teman. orang tua dan keluarga

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

UNIVERSITAS GUNADARMA DIREKTORAT PROGRAM DIPLOMA TIGA TEKNOLOGI INFORMASI

PEMBUATAN APLIKASI STUDENT ACCESS SISTEM ABSENSI MAHASISWA DAN INFORMASI DAFTAR NILAI MAHASISWA PADA SISTEM OPERASI ANDROID Angga Tri Hendratno Univer

PENDAHULUAN. I.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Perkembangan Teknologi Informasi di era globalisasi sekarang ini

UNIVERSITAS GUNADARMA DIREKTORAT PROGRAM DIPLOMA TIGA TEKNOLOGI INFORMASI DIREKTORAT PROGRAM DIPLOMA TIGA TEKNOLOGI INFORMASI

RANCANG BANGUN PENCARIAN JUDUL TESIS BERBASIS TEKNOLOGI WEB SEMANTIK

BAB 2 TINJAUAN PUSTAKA

BAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi

Penerapan Graf dalam Algoritma PageRank Mesin Pencari Google

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

APLIKASI KAMUS DIGITAL BAHASA INDONESIA - BAHASA ARAB DENGAN MENGGUNAKAN METODE PROTOTYPING

Bab 1 Pendahuluan. 1.1 Latar Belakang

ADOPSI ENKRIPSI JEFFERSON WHEEL PADA PROTOKOL ONE-TIME PASSWORD AUTHENTICATION UNTUK PENCEGAHAN SNIFFING PADA PASSWORD

UKDW BAB 1 PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

Perancangan Sistem Penentuan Kunjungan Tempat Wisata Daerah Bali Menggunakan Metode K-Nearest Neighbour

BAB I PENDAHULUAN. membantu dalam menghasilkan suatu sistem informasi secara cepat, akurat,

Enkripsi Sederhana SMS (Short Message Service) Menggunakan Vigenere Cipher

BAB 1 PENDAHULUAN Latar Belakang

Sistem Rekapitulasi Dokumen Perundang-Undangan Indonesia

BAB 1 PENDAHULUAN. masyarakat setelah kebutuhan primer. Salah satu perkembangan teknologi

Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara

BAB 1 PENDAHULUAN. perusahaan diharapkan agar mampu menerapkan dan mengikuti. pelayanannya dimana petugas yang melayani pemesanan travel harus

Penerapan Algoritma Knuth Morris Pratt dalam Aplikasi Penerjemah Teks

SISTEM PAKAR IDENTIFIKASI KENDARAAN MENGGUNAKAN METODE INFERENSI

PENGUJIAN TOOL ONTOLOGY ENGINEERING

BAB I PENDAHULUAN DKI Jakarta memiliki jumlah penduduk jiwa. Menurut dinas

BAB I PENDAHULUAN. Berkembangnya teknologi dan informasi saat ini telah menghasilkan kumpulan

STEMMING DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN ALGORITMA PORTER ABSTRAK

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

PEMELIHARAAN ONTOLOGI PADA PEER-TO-PEER (P2P) BERBASIS VOTING DAN SIMILARITAS. Abstrak

Andie Hariyadi Supriyatna

Aplikasi Pemodelan Bahasa Secara Statistik dalam Bisnis Periklanan di Internet

BAB I PENDAHULUAN 1.1. Latar Belakang

SHARING DATA ANTARA LINUX DAN WINDOWS DENGAN JARINGAN PEER TO PEER

Pencocokan Citra Berbasis Graph untuk Pengenalan dan Pemilihan Kembali (Retrieval) Oleh: Yureska Angelia ( )

Sistem Rekonstruksi Rute Perjalanan Dengan GPS Untuk Efisiensi Proses Update Posisi

MOBILE ONLINE DICTIONARY

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Enkripsi Pesan pada dengan Menggunakan Chaos Theory

BAB I PENDAHULUAN. paling mencolok dari perkembangan teknologi tersebut adalah gadget dan

PERANCANGAN ALGORITMA KRIPTOGRAFI KUNCI SIMETRI DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN

Metode Mengatasi Keragaman Semantik Antara Informasi di Pemasok dan Manufaktur pada Manajemen Rantai Persediaan

Transkripsi:

sss Makalah Nomor: KNSI-469 QUERY REWRITING BERBASIS SEMANTIK MENGGUNAKAN WORDNET DAN LCh PADA SEARCH ENGINE GOOGLE Ahmad M. Thantawi, I Wayan Simri Wicaksana 2, Lily Wulandari 3 Teknik Informatika, 2 Teknologi Informasi, 3 Teknik Informatika Fakultas Teknik, UPI YAI, 2 Pascasarjana, 3 Fakultas Teknologi Industri, Universitas Gunadarma Jl. Diponegoro 74, 2,3 Jl. Margonda Raya No. 00 Pondok Cina Depok thantawi@yai.ac.id, { 2 iwayan, 3 lily}@staff.gunadarma.ac.id Abstrak Saat ini sumber dari informasi semakin bertambah secara cepat pada kurun waktu terakhir ini, terlebih dengan makin berkembangnya teknologi internet. Besarnya jumlah sumber informasi juga melahirkan keragaman dari sumber informasi tersebut. Pengumpulan data dengan memanfaatkan Internet seperti adanya fasilitas Google adalah dengan cara memasukkan kata kunci. Mesin pencari tidak selalu memberikan informasi yang akurat. Kekurangan ini biasanya disebabkan oleh dua masalah utama. Pertama, mesin pencari tidak mampu menemukan pola dari dokumen relevan. Kedua, pengguna tidak menyatakan permintaannya dengan benar. Pada artikel ini menjelaskan teknik bahwa penulisan ulang permintaan (query) dengan menggunakan semantik similarity yaitu leacock & chodrow pada saat pencarian informasi di mesin pencari dapat memberikan hasil informasi yang lebih tepat. Kata kunci : query rewriting, semantik, wordnet, leacock & chodrow. Pendahuluan Memasuki era globalisasi dan teknologi informasi yang berkembang pesat, kebutuhan akan informasi yang cepat dan akurat semakin besar. Sumber dari informasi semakin bertambah secara cepat pada kurun waktu terakhir ini, apalagi dengan makin berkembangnya teknologi internet. Besarnya jumlah sumber informasi juga melahirkan keragaman dari sumber informasi tersebut. Untuk menemukan informasi yang kita butuhkan, kita dapat menggunakan sumber informasi yang ada, salah satunya adalah dengan menggunakan bantuan mesin pencari (search-engine) di internet, salah satunya adalah mesin pencari Google. Mesin pencari merupakan alat yang sangat berguna untuk mencari informasi di alam dunia maya. Mesin pencari memiliki kemampuan untuk mencari informasi dari dokumen-dokumen yang tidak terstruktur. Kemampuan ini sangat berguna ketika kita ingin mencari suatu informasi dari dokumen-dokumen yang masing-masing memiliki struktur yang berbeda. Walaupun memiliki manfaat yang menjanjikan, mesin pencari tidak selalu memberikan informasi yang akurat. Kekurangan ini biasanya disebabkan oleh dua masalah utama. Pertama, mesin pencari tidak mampu menemukan pola dari dokumen relevan. Kedua, pengguna tidak menyatakan permintaannya dengan benar, misalnya dengan menggunakan kalimat yang redundan. Masalah pertama dapat diselesaikan dengan memperbaiki teknologi mesin pencari, sehingga mesin pencari dapat mengenali pola dokumendokumen relevan. Masalah kedua dapat diselesaikan dengan algoritma pencarian []. Dari uraian diatas memberikan gambaran bahwa penulisan ulang permintaan (query) pada saat pencarian informasi di mesin pencari dapat memberikan hasil informasi yang lebih baik, maka timbul pertanyaan bagaimana pendekatan yang digunakan dalam rangka penulisan ulang suatu permintaan (query) informasi pada mesin pencari agar didapatkan informasi yang lebih baik dan metode atau pendekatan apa yang digunakan dalam mengukur tingkat kesamaan semantik dari konsep permintaan (query) yang ada? 2. Pendekatan 2. Ilustrasi Query Rewriting Query Rewriting adalah sebuah proses penulisan ulang suatu kueri asli ke kueri yang baru dengan menyesuaikan konsep atau terminalogi yang digunakan di masing-masing sumber data

dalam sistem yang terintegrasi, seperti yang tergambar di bawah ini : Query (q) Query (q) Query Rewriting (q, q 2, q 3 q n ) Mesin Pencari Mesin Pencari (a) (b) Gambar Ilustrasi query rewriting Sebagai contoh adalah jika ada permintaan (query) untuk mencari informasi Jumlah Mobil di, pada saat permintaan itu dikirimkan ke sumber data seperti yang tergambar pada gambar point a, maka hanya akan didapatkan hasil yang berkaitan dengan permintaan tadi, tetapi jika dilakukan proses query rewriting diharapkan tidak hanya informasi Jumlah Mobil di yang dihasilkan tetapi informasi Jumlah kendaraan di, Jumlah kendaraan roda empat di, Jumlah Truck di dapat dihasilkan seperti yang tergambar pada gambar point b. Pengaksesan informasi berdasarkan kata kunci kadang-kadang tidak memuaskan, dikarenakan penggunaan kata kunci yang dikonversi menjadi sebuah pertanyaan (query) tidak dapat menghasilkan jawaban (response) yang diharapkan. Sebagai ilustrasi, misalkan kita mengirimkan sebuah permintaan informasi ke beberapa institusi (asumsikan semua institusi memiliki sumber informasi elektronik yang dapat diakses oleh publik) di Depok untuk mencari berapa jumlah tenaga kerja (employee). Misalkan permintaan informasi dikirimkan ke berbagai institusi seperti perusahaan swasta, kantor pemerintah, lembaga pendidikan. Untuk kantor pemerintah tenaga kerja diistilahkan dengan pegawai (employee), beberapa pabrik menggunakan istilah buruh (labor), sementara perusahaan swasta diistilahkan pekerja (worker), dan di universitas memakai kata dosen (lecture). Kalau kita hanya mengacu kepada query berapa jumlah tenaga kerja di Depok / how many employee at Depok. Maka informasi yang bisa dijawab berdasarkan pendekatan keyword adalah hanya untuk kantor pemerintahan, sedangkan dari institusi lainnya akan memberikan informasi dengan nilai nol. Walaupun kita tahu bahwa antara employee, labor, worker, lecture adalah hal yang sama [3]. 2.2 Wordnet WordNet adalah sebuah database network semantik untuk bahasa Inggris yang dikembangkan di Princenton University. WordNet berisi informasi tentang kata benda, katakerja, kata sifat dan kata keterangan. Ia mengorganisir konsep yang terkait ke dalam kumpulan sinonim atau synsets. Masingdipertimbangkan mewakili Masing synset dapat suatu konsep atau makna/pengertian kata. Sebagai contoh: {car, auto, automobile, machine, motorcar} adalah suatu synset yang menghadirkan makna/pengertian: kendaraan bermotor yang beroda 4; pada umumnya yang didorong oleh suatu mesin pembakaran di bagian dalam. Pada masing-masing synset menghadirkan suatu konsep atau makna/pengertian kata [3]. Wordnet telah menjadi suatu sumber daya yang populer untuk mengidentifikasi hubungan jaringan dan taksonomi antar konsep. Pada Gambar 2 menunjukkan bagaimana WordNet melakukan ekstrak dari suatu konsep [2]. Gambar 2. Ekstrak WordNet untuk konsep Car Synset dihubungkann dengan berbagai bentuk relasi seperti hypernym (adalah jenis dari), meronymy (adalah bagian dari), antonymy (adalah lawan dari) dan sebagainya. Jika sebuah kata benda A dihubungkan dengan kata benda B dengan jenis dari, maka B adalah hypernym dari A atau A adalah hyponym dari B. Sebagai contoh car adalah hypernym hatchback, atau hatchback adalah hyponym dari car. Metode kesamaan semantik perhitungan pada WordNet dibagi dalam dua kelompok besar pendekatan, yaitu path length dan information content. Beberapa contoh pendekatan dengan path length adalah Leacock-Chodorow, Resnik, Wu- pendekatan dengan Palmer. Beberapa contoh Information content adalah Lin dan Jiang Conrath. [4]. 2.3 Leacock & Chodrow

Metode perhitungan kesamaan semantik pada wordnet dibagi dalam dua kelompok besar pendekatan, yaitu path length dan information content. Metode Leacock & Chodrow termasuk kelompok path length. Persamaan dari Leacock & Chodrow adalah sebagai berikut: Gambar 3 menunjukkan langkah yang dilakukan pada pembuatan ulang query atas suatu original query. (2* D) l ch = log( ) (length(c, c2)) di mana : c c2 length(c,c2) D = konsep = konsep2 = panjang jalur yang paling pendek (yaitu., jumlah minimum edge antara dua konsep) = Maksimum depth dari taksonomi (Jumlah maksimum node dari skema ontology dari dua konsep) Berikut ini contoh penghitungan keterkaitan antar kata teacher-employee-worker dengan menggunakan metode Leacok & Chodrow seperti yang dirumuskan pada persamaan F.. Langkahlangkah yang dilakukan adalah sebagai berikut :. Mencari panjang jalur dari c dan c2 dimana c adalah teacher dan c2 adalah employee. 2. Masukkan c dan c2 ke dalam WordNet. 3. Hitung panjang jalur mulai dari entity sampai ke c atau c2 4. Maka kita dapatkan nilai c adalah 9 dan c2 adalah 7 untuk mendapatkan nilai length dari c dan c2, dengan mengambil nilai yang paling minimum diantara c dan c2 yakni 7. 5. Sedangkan untuk mencari nilai D dapat diperoleh dengan membandingkan jumlah node dari c dan c2, maka nilai D adalah jumlah maksimum node diantara c dan c2, yaitu 0. 6. Perhitungannya akan menjadi (2 *0) lch = log( ) length(9,7) 20 lch = log( ) 7 = 0,45 Langkah -6 diulang untuk mencari keterkaitan antar kata teacher-worker dan employee-worker. Sehingga didapatkan untuk teacher-worker adalah 0,52 dan untuk employee-worker = 0,90 [3]. 3. Ujicoba Penelitian pada paper ini menggunakan beberapa kata kunci sebagai contoh, diantaranya Jumlah Mobil di, Jumlah Pelajar di, Jumlah Perguruan Tinggi di. Pemanfaatan TI RGBPlain Pemanfaatan TI RGBPlain Kunci K Kinerja Pemanfaatan Organisasi TI Dekripsi RGBPlain Kunci K Pemanfaatan TI RGBPlain C = 0 Dekripsi o Gambar 3. Langkah-langkah melakukan query Kunci rewriting K K Kinerja Pemanfaatan berbasis Organisasi semantik TI Upamakan seorang pengguna RGBPlain RGBPlain Dekripsi C = 0 memberikan query melalui search engine o adalah Jumlah Mobil di. Kunci Berdasarkan K Pemanfaatan langkah-langkah pada Dekripsi TI gambar Kunci 3 maka K akan dilakukan proses sebagai berikut: RGBPlain Dekripsi C = 0 RGBPlain o. Ekstrak query menjadi konsep-konsep jumlah, mobil, Kunci di, K dan. Kunci K RGB 2. Terjemahkan masing-masing Dekripsi Plain konsep: Jumlah number; Dekripsi C = 0 mobil car; di in; unknown RGBPlain o 3. Cari Kunci padanan K RGB kata Plain masing-masing konsep Kunci K hasil terjemahan. Dekripsi Hasil dapat diperoleh sepeti pada tabel 3 RGB kolom Dekripsi Plain dan 2. 4. Cari persamaan semantik RGBPlain C = 0 o antar konsep pada kolom Kunci K dan 2 dengan menggunakan WordNet. RGB Hasil Plain Kunci K Dekripsi persamaan semantik berdasarkan RGB metode Lch Plain di WordNet seperti C = 0 pada tabel RGB 3 kolom 3. o RGBPlain Kunci K K Kunci K RGB Plain Enkripsi,E RGB Dekripsi Plain RGBPlain RGB RGB Plain Dekripsi

5. Terjemahkan konsep dari bahasa Inggris ke Bahasa Indonesia, dengan tetap menyimpan besaran similaritasnya. Besaran similaritas ini nantinya berguna dalam langkah menentukan batasan similaritas yang diinginkan.misalkan batasan similar yang diinginkan adalah 0,3 maka berdasarkan hasil perhitungan pada tabel 3 diperoleh bahwa mobil (dalam bahasa Indonesia) akan memperoleh hasil konsep vehicle, automobile dan truck. 6. Tiap-tiap konsep yang dihaslkan dalam langkah 6 diterjemahkan kembali ke bahas Indonesia, sehingga menghasilkan konsep sebagai berikut: - Vehicle kendaraan - Automobile mobil - Truck truk 7. Pembentukan ulang query berdasarkan hasil langkah 6 adalah sebagai berikut: - Jumlah kendaraan di - Jumlah mobil - Jumlah Truck di - Hitung kendaraan di - Hitung mobil di Tabel. Hasil Perhitungan Menggunakan Metode Leacock & Chodrow di wordnet Konsep Konsep 2 Lch car vehicle 0,33 car automobile student pupil 0,09 in at 0,25 number count vehicle automobile 0,2 campus college 0,08 university college 0,33 campus university 0,08 academy university 0,33 campus academy 0,08 college academy 0,25 truck car 0,33 vehicle truck 0,25 vehicle motorcycle 0,2 motorcycle motorbike motorcycle bicycle 0,33 bike bicycle bike vehicle 0,33 vehicle bicycle 0,33 plane aircraft 0,33 vehicle bus 0,25 student college 0, campus student 0,08 computer notebook 0,2 laptop notebook 0,33 laptop computer 0,2 pc computer 0,33 pc notebook 0,33 laptop Pc 0,33 pupil campus 0,09 pupil school 0, high school pupil 0,06 Adapun ringkasan hasil ujicoba dapat dilihat pada tabel 2. Tabel 2. Ringkasan Hasil Ujicoba No. Query-N Nilai batas Jumlah Mobil di 2 Jumlah Mobil di 3 Jumlah Mobil di 4 Jumlah Pelajar di 5 Jumlah Pelajar di 6 Jumlah Pelajar di 4. Kesimpulan Jumlah Query rewriting 0,2 8 0,3 4 0,8 2 0,2 8 0,3 4 0,8 2 Paper ini mengajukan suatu metode baru dalam meningkatkan kinerja query rewriting dengan melibatkan pencarian sinonim konsep dan mempertimbangkan hubungan semantik diantara kandidat konsep yang akan membentuk ulang query. Hubungan semantik ditunjukkan melalui nilai similaritas yang diperoleh melalui sebuah perhitungan semantik antar konsep menggunakan tesaurus bahasa Inggris yang disebut WordNet. Nilai similaritas digunakan sebagai pertimbangan batasan konsep yang akan dijadikan sebagai kandidat konsep untuk query rewriting. Adanya nilai similaritas inimemberikan suatu fleksibilitas terhadap luasan/cakupan kandidat konsep yang pada akhirnya juga membatasi banyaknya query rewriting yang akan dilakukan. Penelitian ini masih merupakan penelitian awal dalam meningkatkan kinerja query rewriting dengan melibatkan pencarian sinonim konsep. Oleh karena itu perlu dilakukan penelitian lebih mendalam, diantarnya adalah bagaimana

menangani respon dari hasil query rewriting yang ada. Daftar Pustaka: [] Mandala Rila, 2006, Evaluasi Efektivitas Metode Machine Learning pada Search- Engine, Bandung, Institut Teknologi Bandung. [2] Richardson, Smeaton, Murphy J, 995, Using WordNet as a Knowledge Base for Measuring Semantic Similarity between Words, Dublin City University. [3] Wicaksana I Wayan Simri, Yuniar Lintang Banowosari, Wulandari Lily, Wirawan Setia, 2006, Pentingnya Peranan Bahasa dalam Interoperabilitas Informasi berbasiskan Komputer Karena Keragaman Semantik, Depok, Universitas Gunadarma. [4] Wicaksana I Wayan Simri, Hakim Reza A.., 2006, Pendekatan Schema Matching dalam Bahasa Indonesia, Depok, Universitas Gunadarma dan PT Radiant Centra Nusa.