xi BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan ilmu pengetahuan dan teknologi informasi dewasa ini membuat perubahan perilaku dalam pencarian informasi yang berdampak bagi lembagalembaga yang bergerak dalam bidang jasa penyedia informasi seperti perpustakaan. Dalam hal ini, perpustakaan harus mampu berperan sebagai penyedia sumber daya informasi dan pengetahuan yang utama serta ketersediaan mekanisme pengaksesan dan pengembalian sumber daya informasi dan pengetahuan yang efisian. Untuk mendukung peranan tersebut, perpustakaan melakukan perubahan pemeliharaan dan katalogisasi dari yang sebelumnya berupa objek fisik seperti buku, jurnal dan lain sebagainya ke dalam bentuk digital berupa teks, gambar dan audio serta ketersediaan pengaksesan katalog secara online. Hasil dari perubahan tersebut dapat dilihat dengan munculnya perpustakaan digital yang menyediakan akses instan terhadap koleksi dokumen yang dimilikinya seperti pencarian pada metadata keyword, penulis, judul dan lain sebagainya (Suwedi, 2006). Namun seiring dengan bertambahnya jumlah sumber daya informasi yang semakin besar serta keragamannya, temu kembali informasi (information retrieval) yang relevan menjadi suatu tugas yang sulit dilakukan. Belum adanya interoperabilitas sumber daya informasi antar perpustakaan atau bahkan pada perpustakaan yang sama merupakan permasalahan yang dihadapi saat ini. Pada level semantik, perbedaan skema database digunakan berbeda oleh masing-masing perpustakaan yang mengakibatkan perbedaan pandangan akan obyek digital oleh pengguna (Chen, 1999). Secara umum, layanan pencarian pada katalog perpustakaan berdasarkan pada sistem pencarian indeks dari metadata sumber daya informasi. Permasalahan utama dari sistem indeks seperti ini adalah hanya mengembalikan sumber daya informasi yang memenuhi properti yang direpresentasikan oleh metadata. Karena teknik ini
xii hanya mengeksploitasi sintaksis kata, sehingga dimungkinkan pengembalian sumber daya informasi yang tidak relevan. Secara umum, pencarian berbasis indeks metadata ini gagal menemukan sumber daya informasi relevan disebabkan ketidakmampuan mesin untuk memahami makna dari kueri yang diberikan, ketidakjelasan dari bahasa alami seperti sinonim, homonim dari kata dapat mengelabuhi algoritma yang hanya melihat terminologi pencarian hanya sebagai urutan dari karakter (Baeza et al, 1999). Walaupun kebanyakan dari sistem temu kembali informasi saat ini telah sukses menangani permasalahan bentuk-bentuk kata dengan menggunakan algoritma stemming, namun sejumlah formula-formula pembobotan berdasarkan statistik yang dikembangkan pada penelitian sistem temu kembali informasi dalam satu dekade terakhir ini belum dapat mengatasi isu semantik. Salah satu alasannya adalah term cooccurrence (kemunculan term) yang digunakan oleh sebagian besar metode statistik untuk mengukur hubungan semantik dari kata adalah tidak benar menurut pandangan ilmu bahasa (Kuropka, 2005). Di samping statistik berdasarkan tingkat kemunculan term, cara lain yang digunakan untuk menambah efektivitas pencarian adalah dengan menyertakan latar belakang pengetahuan kedalam proses pencarian. Penggunaan latar belakang pengetahuan oleh komunitas temu kembali informasi sampai sejauh ini dipusatkan dalam bentuk thesauri. Thesauri menggambarkan satu set term yang digunakan sebagai indeks dan satu set hubungan-hubungan linguistik antar term yang digunakan sebagai solusi terhadap ketidakpahaman mesin terhadap bahasa alami. Namun dari pengalaman menunjukkan hal ini tidak dapat meningkatkan efektivitas pencarian (Salton, 1993). Salah satu penyebabnya adalah relasi antara term dalam thesauri seperti sinonim pada dasarnya adalah dua kata yang mempunyai arti yang sama, namun thesauri merepresentasikan relasi ini pada level sintaksis yang menyebabkan pengembalian hasil yang salah. Penyebab lain adalah pembuatan thesauri manual dan proses annotation (penandaan) dokumen dengan term dalam thesauri memerlukan waktu dan biaya yang mahal. Sehingga proses annotation sering kali kurang lengkap
dan sering terjadi kesalahan yang pada akhirnya mengurangi kinerja pencarian (Salton, 1993). xiii Ontologi dapat digunakan untuk merepresentasikan latar belakang pengetahuan yang lebih baik bila dibandingkan dengan thesauri. Ontologi merepresentasikan pengetahuan pada level semantik karena ontologi berisikan entitas semantik (concept, relation dan instance) sebagai pengganti kata. Selain itu, ontologi memungkinkan untuk menspesifikasikan hubungan semantik antar entitas dan juga untuk menyimpan fakta dan aksioma tentang domain pengetahuan (Salton, 1993). Semantic web adalah salah satu teknologi untuk web masa depan yang menggunakan ontologi sebagai infrastruktur dasar untuk memungkinkan mesin mengerti akan arti dari informasi yang ada pada World Wide Web. Dalam teknologi semantic web ini, domain pengetahuan direpresentasikan dalam ontologi dan web pages ditandai (annotated) menggunakan konsep-konsep dan relasi-relasi yang berhubungan yang ada dalam ontologi dan reasoning system akan menggunakan semantic annotation tersebut untuk melakukan reasoning dalam menjawab kueri. Hal yang sama ontologi dapat digunakan untuk merepresentasikan pengetahuan tentang field dalam domain data bibliografi seperti pengarang, penerbit, keyword, dan lain sebagainya. Reasoning system dapat digunakan untuk melakukan resoning dalam menjawab kueri yang kompleks atau digunakan untuk meningkatkan service pencarian dengan melakukan ekspansi kueri (query expansion) menggunakan basis pengetahuan dalam ontologi.
xiv 1.2 Rumusan Masalah Di dasarkan pada latar belakang di atas, maka dirumuskan masalah: 1. Bagaimana membangun basis pengetahuan berbasis ontologi dari data bibliografi pada perpustakaan digital agar dapat digunakan untuk pencarian yang semantik? 2. Bagaimana mengembangkan suatu search engine yang menggunakan basis pengetahuan yang telah dibuat sebagai basis pencarian secara semantik? 1.3 Batasan Masalah Karena keterbatasan upaya dan waktu, penulisan skripsi ini dibatasi pada: 1. Implementasi hanya dibatasi pada repository lokal dengan data bibliografi diambil dari beberapa sumber. 2. Pengembangan ontologi dibatasi untuk domain publikasi karya ilmiah. 3. Penelitian terfokus pada pengembangan search engine bukan pada pengembangan ontologi. 4. Pengembangan search engine ditujukan hanya sebagai fitur tambahan pada sistem yang sudah ada. 1.4 Tujuan Penelitian Adapun tujuan dari penelitian ini adalah: 1. Diperoleh basis pengetahuan berbasis ontologi sederhana untuk domain publikasi karya ilmiah. 2. Diperoleh search engine berbasis semantik menggunakan ontologi sebagai basis pencarian.
xv 1.5 Manfaat Penelitian Penelitian ini akan memberikan manfaat dalam hal peningkatan fungsionalitas sebuah perpustakaan digital dengan penerapan metode pencarian semantik berbasis ontologi serta memberikan gambaran penerapan teknologi baru. 1.6 Metodologi Penelitian Tahapan yang dilalui selama pelaksanaan skripsi ini adalah: 1. Studi pustaka Tahapan ini dilakukan dengan cara melakukan kajian terhadap semua teori yang mendukung tercapainya tujuan skripsi ini baik yang berupa buku (text book), jurnal dan artikel ilmiah, maupun website yang berhubungan dengan perpustakaan digital, ontologi, dan sematic web. 2. Analisis Pada tahap ini akan dijelaskan pemodelan data semantik dengan ontologi. 3. Perancangan Pada tahap ini dilakukan perancangan ontologi untuk data bibliografi, dan perancangan perangkat lunak semantic search engine. 4. Implementasi dan Pengujian Dalam tahapan ini dilakukan implementasi dari perancangan ontologi dan perangkat lunak semantic search engine serta dilakukan pengujian untuk mendapatkan kesimpulan serta saran untuk pengembangan lebih lanjut.
xvi 1.7 Sistematika Penulisan Sistematika penulisan skripsi ini dibagi menjadi lima bab, yaitu sebagai berikut: BAB 1 BAB 2 BAB 3 BAB 4 BAB 5 PENDAHULUAN Bab ini menjelaskan mengenai latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metode penelitian dan sistematika penulisan. LANDASAN TEORI Pada bab ini dibahas mengenai teori tentang ontologi, semantic web, information retrieval, dan metadata. ANALISIS DAN PERANCANGAN Bab ini berisikan analisis pemodelan data semantik berbasis ontologi yang meliputi desain skema ontologi dan pembuatan basis pengetahuan serta analisis tentang semantic search berbasis ontologi. IMPLEMENTASI DAN EVALUASI Bab ini berisikan deskripsi implementasi sistem serta pengujian sesuai dengan analisis yang telah dilakukan. PENUTUP Bab ini berisikan kesimpulan atas keseluruhan isi serta saran-saran dari penulis.