1 BAB I PENDAHULUAN 1.1 Latar Belakang Dalam pembangunan suatu software, sebuah Perusahaan IT atau software house yang profesional akan memandang dokumentasi menjadi bagian yang penting didalamnya. Dokumentasi dalam suatu project sangat dibutuhkan bukan hanya sebagai media komunikasi antar anggota tim atau client, tetapi juga sebagai catatan historis jalannya project. Sebagai contoh, seiring dengan teknologi yang semakin berkembang dan adanya tuntutan kebutuhan client yang harus dipenuhi, maka tak jarang sebuah sistem atau software diminta untuk dikembangkan kembali dan dilakukan enhancement fungsi di kemudian hari. Dengan adanya dokumentasi yang baik, penerus pengembang sistem (new developer) akan terbantu untuk mendapatkan informasi dan memudahkan dalam melakukan pengembangan lanjutan. Tetapi di sisi lain, karena kurangnya manajemen penyimpanan dokumen seperti struktur penyimpanan yang sembarang, tercampur berbagai dokumen lain serta tersebar di beberapa sumber dan ditambah banyaknya jenis dan jumlah dokumen dari tahun ke tahun membuat masalah dalam mendapatkan informasi yang diinginkan tersebut secara cepat dan selektif. Pencarian informasi yang dibutuhkan memakan waktu yang relatif lama karena dilakukan secara manual. Selain itu usaha untuk memilih informasi pun ternyata lebih besar dari sekedar mendapatkan akses terhadap informasi tersebut. Maka dari itu dibutuhkan sebuah search engine yang dapat mencari informasi yang relevan secara lebih mudah. Sistem Information retrieval merupakan sistem yang digunakan untuk mencari informasi yang relevan dan isinya tidak memiliki struktur seperti dokumen dokumen project. Sistem Information retrieval berkaitan dengan representasi penyimpanan, struktur dan akses dari dokumen-dokumen yang bertujuan untuk memudahkan pencarian sebuah informasi. I-1
I-2 Namun dari hasil proses Information retrieval dokumen tersebut dinilai tidak informatif berdasarkan tingkat kesesuaiannya dengan query yang diinputkan User. Oleh karena itu digunakan model ruang vektor (vector space model) yang dapat merangking dokumen dengan mengukur kemiripan antara suatu dokumen dengan suatu query User. Menurut Arifin (dalam Salton, 1989) Salah satu model sistem information retrieval yang paling sederhana namun paling produktif adalah model ruang vektor. Vektor model ini merepresentasikan term yang terdapat pada dokumen dan query. Elemen vektor tersebut adalah bobot term yang menjadi dasar penilaian dalam merangking dokumen. Term dapat berupa kata, frase, atau unit hasil indexing lain dalam suatu dokumen sebagai gambaran konteks dari dokumen tersebut. Karena tiap kata memiliki tingkat kepentingan yang berbeda dalam dokumen, maka diperlukan indikator yaitu term weight (bobot term) dalam proses pencocokan dan perankingan dokumen terhadap query. Metode Vector Space Model ini dapat disimpulkan memiliki keunggulan dengan adanya peringkat pengambilan informasi sehingga akan memperhitungkan pula fungsi kesamaan untuk mendapatkan nilai bobot setiap dokumen yang dicari. Bobot nilai kesamaan tertinggi pada dokumen dengan kata kunci yang digunakan sebagai query pencarian akan ditampilkan lebih awal. Disebutkan pula pada paper Firnas Nadriman (Yogyakarta, 2006) pada implementasi sistem temu kembali informasi file dokumen berbasis teks dengan metode vector space model bahwa secara kinerja, sistem information retrieval yang dikembangkan dengan metode vector space model sudah cukup baik karena dengan rata-rata average precision sekitar 71,31973% yang berarti rata-rata pada tiap recall point, 71,31973% dokumen yang berhasil di-retrieve relevan dengan query yang diberikan. Dengan adanya kebutuhan dan tuntutan kemudahan dalam pencarian informasi, khususnya dalam hal ini adalah informasi mengenai dokumentasi project, maka dari
I-3 itu dicetuskanlah sebuah aplikasi information retrieval menggunakan metode Vector Space Model pada pencarian file dokumentasi project. 1.2 Rumusan Masalah Berdasarkan latar belakang yang telah dikemukakan, didapat beberapa rumusan masalah sebagai berikut : 1. Bagaimana menerapkan metode Vector Space Model pada proses information retrieval untuk pencarian file dokumentasi project? 2. Bagaimana membuat aplikasi information retrieval yang dapat membantu dalam pencarian informasi dokumentasi project? 1.3 Tujuan Tujuan dari pembuatan tugas akhir ini adalah sebagai berikut. 1. Menerapkan konsep metode Vector Space Model pada proses Information Retrieval pencarian file dokumentasi project 2. Membuat aplikasi yang dapat memberikan informasi dan kemudahan dalam pencarian dokumen project 1.4 Batasan Masalah Pembatasan masalah dari penelitian ini digunakan agar masalah yang diteliti lebih terarah dan terfokus sehingga penelitian dapat dilakukan sesuai dengan apa yang direncanakan dan memberikan hasil yang optimal. Batasan masalah yang digunakan pada penelitian ini adalah sebagai berikut. 1. Data atau dokumen yang dicari hanya berisi dan berformat text (.doc dan.docx) 2. Pengindeksan data yang dilakukan yaitu proses parsing, stopword removal dan pembobotan term di dalam dokumen
I-4 3. Aplikasi yang dibuat menggunakan teknik pencarian model ruang vektor yaitu suatu model yang digunakan untuk mengukur kemiripan antara isi suatu data. 1.5 Metode Pembangunan Perangkat Lunak Dalam melakukan pengembangan sistem, metode yang diterapkan adalah menggunakan metodologi berorientasi objek, yaitu suatu strategi pembangunan perangkat lunak yang mengorganisasikan perangkat lunak sebagai kumpulan objek yang berisi data dan operasi yang diberlakukan terhadapnva. Fokus utama metodologi ini adalah pada objek, dengan melihat suatu sistem terdiri dari objek yang saling berhubungan. Tahap-tahap metodologi berdasarkan System Development Life Cycle (SDLC) digunakan dengan memperhatikan karakteristik khusus berorientasi objek, dan pada pembangunan aplikasi information retrieval ini digunakan Linear Sequencial Model yang memiliki alur hidup perangkat lunak secara sekuensial atau terurut dimulai dari analisis, desain, pengodean, dan pengujian, yaitu yang dapat digambarkan sebagai berikut : Gambar 1.1 Alur Linear Sequential Model
I-5 1. Analisis Analisis dilakukan dengan cara menganalisa kebutuhan akan fungsi-fungsi perangkat lunak yang dibutuhkan yaitu yang meliputi fungsi masukan, fungsi proses, dan fungsi keluaran yang dilakukan dengan cara sebagai berikut : a. Studi Literatur Studi literatur dilakukan dengan melakukan studi pustaka, yaitu dengan mencari data atau literatur yang dapat mendukung penelitian ini, khususnya mengenai information retrieval dan metode Vector Space Model. Literatur dapat berupa artikel di internet, makalah, jurnal dan penelitian lain yang berkaitan dengan penelitian yang akan dilakukan. b. Studi Lapangan Dengan menggunakan metode observasi, yaitu melakukan pengamatan terhadap manajemen dokumentasi project di PT Neuronworks Indonesia sebagai objek studi kasus penelitian ini. c. Diskusi dan Konsultasi Metode yang dilakukan dengan cara berdiskusi dengan pihak-pihak yang dapat memberikan saran dan informasi, yaitu diantaranya mengenai proses dokumentasi untuk mendapatkan analisa dan data data yang dibutuhkan dalam penelitian. 2. Desain Desain yang dimaksud yaitu melakukan perancangan perangkat lunak yang dilakukan berdasarkan data yang telah dikumpulkan pada tahap sebelumnya. Perancangan tersebut meliputi perancangan struktur menu, struktur file, alur kerja sistem, database, format masukan (input) dan format keluaran (output).
I-6 3. Pengodean Mengimplementasikan hasil dari perancangan perangkat lunak ke dalam kode program yang dimengerti oleh bahasa mesin untuk menghasilkan aplikasi yang dibutuhkan. 4. Pengujian Pengujian terhadap aplikasi yang telah dibuat dari hasil analisis, desain, dan pengodean untuk mengetahui seperti apa hasil kinerja sistem yang dikembangkan. Pengujian dilakukan dengan mengevaluasi sistem information retrieval yang telah dibuat yaitu dengan menggunakan metode recall dan precision dan melakukan uji fungsi dengan mencari segala kemungkinan kesalahan, memeriksa apakah input, proses, dan output yang ada dapat berjalan sesuai dengan fungsionalitas yang diharapkan. 1.6 Sistematika Penulisan Sistematika penulisan pada tugas akhir ini yaitu sebagai berikut : Bab satu pendahuluan, berisi latar belakang, rumusan masalah, tujuan, batasan masalah, metode pengumpulan data, metode pembangunan perangkat lunak dan sistematika penulisan. Bab dua landasan teori, membahas dasar dasar teori yang dibutuhkan dan berkaitan dalam pembuatan tugas akhir ini, diantaranya mengenai information retrieval, metode vector space model, recall & precision, dan unified modeling languange. Bab tiga analisis dan perancangan, berisi uraian mengenai analisis dan perancangan sistem, perancangan basis data, perancangan antarmuka, perhitungan algoritma secara manual, kebutuhan perangkat keras dan lunak untuk sistem yang dikembangkan. Bab empat implementasi dan pengujian, berisi tentang implementasi dari perancangan sebelumnya yaitu menjadi sebuah aplikasi yang diharapkan dan proses
I-7 pengujian untuk mengevaluasi fungsi apakah aplikasi yang dibangun sudah sesuai atau belum. Bab lima kesimpulan dan saran, berisi tentang kesimpulan dari aplikasi Information retrieval yang di bangun serta saran-saran yang ditujukan kepada semua pihak yang bersangkutan.