1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan komputer di dalam lingkungan kehidupan masyarakat di seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad terakhir ini. Hal ini dapat dilihat dari perkembangan pengguna komputer yang sangat signifikan setiap tahunnya. Semakin banyak aktifitas yang menpergunakan komputer dalam membantu dan mempermudah aktifitas manusia, bahkan penggunaan komputer hampir mengganti keseluruhan peran manusia dalam melakukan aktifitasnya. Hal yang paling umum adalah mengenai penyimpanan dan pengolahan informasi yang dilakukan oleh komputer. Beberapa masalah sederhana yang terjadi apabila sebuah informasi atau lebih diproses dan disimpan dalam komputer adalah 1. Bagaimana memproses dan menyimpan informasi yang acak atau yang sumbernya berbeda? 2. Bagaimana cara mengambil kembali informasi yang telah diproses dan disimpan pada komputer sesuai dengan informasi yang dibutuhkan? 3. Apakah pengambilan informasi yang telah diproses dan disimpan menjamin bahwa informasi yang dibutuhkan benar-benar akurat dan dapat dimengerti?
2 Komputer untuk saat sekarang ini tidak dapat terhindarkan dengan kehadiran teknologi kecerdasan semu, hampir pada setiap peralatan software ataupun hardware yang digunakan mengandung teknologi kecerdasan semu. Beberapa bidang yang telah menerapkan penggunaan kecerdasan semu diantaranya yaitu kedokteran, otomotif, sales dan marketing, pembuatan permainan, traffic management, aplikasi-aplikasi pada software dan lain-lainnya. Menurut prediksi Chilson (2005:89-93) pada 10 tahun ke depan mesin-mesin dengan kecerdasan semu yang berbeda akan terhubung ke dengan organ tubuh manusia dengan tujuan dan fungsi yang berbeda-beda tentunya. Beberapa diantaranya akan memiliki kemampuan seperti ponsel, ada juga yang memiliki kemampuan untuk memantau dan membantu membuat keputusan terhadap kondisi fisik seseorang. Berdasarkan prediksi ke atas tentu dapat kita simpulkan bahwa teknologi kecerdasan semu akan terus berkembang dengan pesat dan banyak digunakan dalam membantu kehidupan manusia. Salah satu solusi yang dapat ditawarkan untu menjawab beberapa pertanyaan permasalahan di atas mengenai pengolahan data dan penyimpanan data dalam suatu komputer adalah menggunakan teknologi information retrieval. Information retrieval adalah proses komputerisasi yang menghasilkan sekumpulan dokumen yang relevan dengan permintaan pengguna dengan cara membandingkan permintaan pengguna dengan indeks yang dihasilkan dari konten tekstual dokumen di dalam sistem. Cara kerja information retrieval mengacu kepada beberapa model-model yang menentukan seberapa cocok sebuah dokumen dan permintaan dari pengguna dan
3 penentuan peringkat setiap dokumen. Model yang umum digunakan adalah Boolean Model, Vector Space Model (VSM), dan Latent Semantic Indexing (LSI). Information retrieval adalah sesuatu yang baru dan menarik dari penelitian teknologi dan informasi yang menyelesaikan permasalahan mengenai ledakan informasi yang berlebihan melalui pengkombinasian teknik dari data training, machine learning, natural languages, penelusuran informasi dan manajemen pengetahuan. (James Sanger, 2007). Pada saat ini information retrieval telah banyak dikembangkan dengan berbagai algoritma dan model-model yang mendukung berbagai macam keperluan, diantaranya yaitu : Boolean Model, Correlated Topic Model, Dirichlet Allocation Model, Vector Space Model, Probabilistic Model, Language Model, Latent Semantic Indexing dan lain-lain. 1.2 Ruang Lingkup Mengingat besarnya latar belakang masalah yang dijelaskan pada subbab sebelumnya, maka penulis membatasi ruang lingkup penelitian hanya pada : 1. Pembahasan penelitian akan difokuskan pada kecerdasan semu mengenai information retrieval. 2. Model yang akan digunakan dalam information retrieval hanya akan membahas mengenai model Boolean Model, Vector Space Model (VSM)dan Latent Semantic Indexing (LSI). 3. Penggunaan atau penerapan model hanya akan dilakukan pada pencarian dokumen dan perbandingan antara ketiga model tersebut.
4 4. Pencarian dokumen hanya berlaku pada pembahasan mengenai ilmu komputer, otomotif mobil dan ilmu bisnis. 5. Dokumen dan query yang digunakan adalah dokumen yang berbahasa Inggris. 6. Dokumen yang diproses hanya dokumen berbasiskan teks. 1.3 Tujuan dan Manfaat Tujuan diadakannya penelitian ini adalah melakukan analisis terhadap ketiga model information retrieval dan menemukan model mana yang paling baik dan paling cocok untuk digunakan. Manfaat yang dapat diperoleh dari penelitian ini adalah 1. Mempermudah developer dan peneliti selanjutnya dalam hal pemilihan model yang akan diterapkan pada penelitian yang akan dilakukan, 2. Mempermudah pemahaman terhadap masing-masing model information retrieval 1.4 Metodologi Penelitian Metodologi yang digunakan dalam penelitian ini adalah sebagai berikut: 1. Analisis permasalahan Mendeskripsikan permasalahan yang ada secara umum pada proses retrieval berbasis konten, kemudian mendefinisi solusi alternatif terhadap permasalahan pada proses retrival. 2. Desain algoritma (prosedur)
5 Penerapan prosedur-prosedur yang digunakan penjabaran diagram kerja sistem retrieval berbasis teks, penjabarkan tahapan-tahapan yang ada pada sistem retrival berbasis teks seperti text operation (tokenizing, stemming, reduce stopword dan lemmatisasi), proses searching, proses pembandingan menggunakan precision dan recall, teknik yang digunakan dalam proses retrieval dan proses retrieval dari sebuah query yang diinput oleh user. 3. Pengujian dan evaluasi hasil penelitian Melakukan pengujian dan evaluasi terhadap hasil penelitian terhadap metode yang digunakan pada sistem information retrieval. Hasil penelitian berbentuk kesimpulan tentang detil dan hasil perbandingan masing-masing model. 1.5 Sistematika Penulisan Sistematika penulisan yang kami buat untuk skripsi ini kami sesuaikan dengan format penulisan skripsi di Bina Nusantara University. a. BAB 1 PENDAHULUAN Pada bab ini akan dijelaskan mengenai latar belakang dibuatnya skripsi ini dan penjelasan mengenai ruang lingkupnya. Pada bab ini juga dijelaskan mengenai tujuan dan masalah pada topik yang diangkat, metodologi penelitian yang digunakan serta sistematika penulisan skripsi. b. BAB 2 TINJAUAN PUSTAKA Bab ini menjelaskan dan menguraikan dasar dasar model teknologi yang dipakai untuk penelitian yang dilakukan antara lain adalah konsep dasar information retrieval, langkah langkah text operation dan ketiga model yang dibahas.
6 c. BAB 3 METODE PENELITIAN Bab ini akan membahas tentang analisis yang dilakukan terhadap cara kerja ketiga model diatas. Pada bab ini juga akan membahas tentang permasalahan yang terjadi serta alternatif pemecahan masalah. d. BAB 4 HASIL PENELITIAN DAN BAHASAN Bab ini akan membahas tentang prosedur penelitian, hasil penelitian serta kebutuhan data yang digunakan dalam penelitian. e. BAB 5 SIMPULAN DAN SARAN Bab terakhir ini berisi kesimpulan terhadap penelitian yang dilakukan yang diperoleh dari bab bab sebelumnya. Bab ini juga berisi saran saran untuk pengembangan lebih lanjut.