BAB 1 PENDAHULUAN. pengguna Internet harus tetap up-to-date dengan dokumen terbaru. Karena jumlah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Peningkatan jumlah dokumen digital yang pesat telah menyebabkan para pengguna Internet harus tetap up-to-date dengan dokumen terbaru. Karena jumlah penyedia dokumen digital yang sangat banyak, maka tidak mungkin seorang pengguna mengingat alamat masing-masing penyedia dokumen digital. Salah satu solusinya adalah dengan membangun sebuah daftar indeks dokumen digital. Pada prinsipnya hampir mirip dengan pencari web (web search engine) yang mengindeks alamat URL (Uniform Resource Locator) [1]. Penyedia dokumen digital mempunyai sejumlah informasi baik hanya berupa informasi nama penulis, judul dan lain-lain yang berkaitan dengan dokumen tersebut. Masing-masing halaman mempunyai informasi dan ukuran yang berbeda. Seiring dengan berkembangnya jumlah web yang ada, maka informasi yang terkandung di dalamnya mempunyai jumlah yang sangat banyak [2]. Informasi tersebut tersimpan dalam berbagai macam bentuk salah satunya adalah. Berbagai jenis yang digunakan dapat mempersulit pengumpulan data karena bentuk yang tidak sama antara satu dengan yang lainnya. Penggunaan yang mengikuti kaidah OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) [3] dapat mempermudah proses pembacaan data 1

2 digital oleh mesin sekaligus mengatasi masalah perbedaan penggunaan jenis sesuai dengan rekomendasi Shuming Li pada penelitiannya yang berjudul Research of Metadata Based Digital Education Resource Sharing [4]. OAI-PMH telah diterapkan pada institusi yang menggunakan perangkat lunak DSpace (www.dspace.org) dan eprints (www.eprints.org). Kedua perangkat lunak ini digunakan sebagai repositori digital. Untuk menangani jumlah yang sedemikian banyak tersebut, timbul suatu pemikiran bagaimana merancang sistem terdistribusi untuk menangani beban kerja yang tinggi sekaligus jumlah data yang besar. Seperti yang tertera pada Tabel 1.1, telah dilakukan penelitian oleh Iqbal Syamsu yang berjudul Perancangan Penjelajah Web (Crawler) Terdistribusi dengan objek penelitiannya adalah dokumen web [5]. Pada penelitian tersebut dilakukan penelusuran web dan pengumpulan dokumen-dokumen di dalamnya dengan tujuan merancang suatu crawler terdistribusi untuk search engine. Merujuk pada penelitian Michael L. Nelson yang berjudul Efficient, Automatic Web Resource Harvesting [6], dikemukakan bahwa teknik crawling konvensional tidak dapat mengetahui apakah seluruh halaman telah dijelajahi dan format data yang mudah dibaca manusia tidak selalu sesuai untuk pemrosesan menggunakan mesin, sehingga penggunaan teknik pengumpulan (harvesting) cenderung lebih baik daripada teknik crawling.

3 Tabel 1.1 Penelitian tentang Pengumpul Metadata dan Sistem Terdistribusi Penulis Judul Penelitian Pembahasan Iqbal Syamsu Shuming Li, dkk Michael L. Nelson, dkk Perancangan Penjelajah Web (Crawler) Terdistribusi Research of Metadata Based Digital Educational Resource Sharing Efficient, Automatic Web Resource Harvesting Penjelajahan dokumen web Rekomendasi penggunaan OAI- PMH Pengumpulan menggunakan modul Apache Penelitian yang dilakukan Pengumpulan Menggunakan OAI-PMH Metadata OAI-PMH Tahun 2008 2008 2006 Pada penelitian Michael L. Nelson, dihasilkan sebuah pengumpul OAI-PMH yang diintegrasikan dengan web server Apache dan merupakan sistem tunggal. Sedangkan aplikasi pengumpul pada penelitian ini merupakan sebuah aplikasi yang berdiri sendiri serta merupakan sistem terdistribusi. 1.2 Rumusan masalah Aplikasi pengumpul OAI-PMH yang tersedia masih berupa sistem tunggal. Belum ditemukan adanya aplikasi pengumpul OAI-PMH dengan sistem terdistribusi.

4 1.3 Tujuan Penelitian Hal utama yang ingin dicapai pada penelitian ini adalah menghasilkan pengumpul OAI-PMH terdistribusi dan mengetahui peningkatan perolehan nya terhadap pengumpul tunggal. 1.4 Batasan Masalah Masalah yang dibahas pada tulisan ini dibatasi agar dapat fokus pada hal-hal yang meliputi: a. Perancangan dasar sistem pengumpul b. Model komunikasi yang digunakan untuk menerapkan sistem terdistribusi adalah RMI c. Analisis unjuk kerja sistem pengumpul terdistribusi terhadap sistem pengumpul tunggal d. Kinerja sistem pengumpul diukur dari perolehan selama 10 jam 1.5 Metode Penelitian Adapun metode penelitian yang dilakukan dalam penelitian ini meliputi: a. Studi literatur dari buku dan referensi, untuk menjadikan landasan dan acuan bagi penelitian ini b. Mengembangkan algoritma dan membuat contoh implementasi pengumpul terdistribusi

5 c. Melakukan pengujian pengumpul serta analisis dari data yang diperoleh untuk mendapatkan kesimpulan 1.6 Sistematika Pembahasan Pada tulisan ini disusun sebanyak lima bab yang terdiri dari: BAB 1 : PENDAHULUAN (berisi kerangka penelitian yaitu latar belakang, rumusan masalah, tujuan penelitian, batasan masalah, dan metode yang ditempuh). BAB 2 : TINJAUAN PUSTAKA (memuat berbagai teori yang dijadikan landasan dalam melakukan penulisan dan perancangan pengumpul ). BAB 3 : METODE PENELITIAN (berisi rancangan dalam membangun pengumpul yang terdistribusi). BAB 4 : HASIL DAN ANALISIS (berisi analisis dari hasil pengujian yang dilakukan terhadap sistem pengumpul terdistribusi yang dirancang). BAB 5 : KESIMPULAN DAN SARAN (berisi hasil simpulan dari tulisan dan saran yang mungkin dapat berguna untuk penelitian yang lebih lanjut).