APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

dokumen-dokumen yang mirip
SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

PENERAPAN STEMMING DENGAN ALGORITMA PORTER PADA QUERY PENCARIAN JUDUL BUKU

TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL

APLIKASI DATA MINING UNTUK ANALISIS ASOSIASI POLA PEMBELIAN DENGAN ALGORITMA APRIORI

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

BAB III METODOLOGI PENELITIAN

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

SISTEM PAKAR DIAGNOSIS KERUSAKAN NOTEBOOK MENGUNAKAN METODE INFERENSI FORWARD CHAINING DAN TEOREMA BAYES (STUDI KASUS JOGJA COMPUTER) SKRIPSI

DAFTAR ISI. SKRIPSI... ii

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL

BAB I PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II LANDASDAN TEORI

APLIKASI PENDUKUNG KEPUTUSAN PENERIMAAN BEASISWA PPA DAN BBP-PPA MENGGUNAKAN METODE SMART BERBASIS WEB

ABSTRAK. Kata Kunci: dokumen digitalisasi, manajemen dokumen, sistem informasi. Universitas Kristen Maranatha

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

E-Tourism Menggunakan Sistem Rekomendasi Item Based Collaborative Filtering

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

PENGENALAN BAHASA ISYARAT HURUF ABJAD MENGGUNAKAN METODE LEARNING VECTOR QUANTIZATION (LVQ) SKRIPSI

PENGESAHAN PEMBIMBING...

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

SISTEM PENDUKUNG KEPUTUSAN PEMILIHAN MAHASISWA BERPRESTASI PERGURUAN TINGGI MENGGUNAKAN METODE PROMETHEE SKRIPSI

BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

SISTEM INFORMASI PERENCANAAN, REALISASI, MONITORING DAN EVALUASI KEGIATAN HIMAPRO TI BERBASIS WEB

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

PEMBUATAN APLIKASI UJIAN ONLINE UNTUK PERGURUAN TINGGI TUGAS AKHIR

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011

PEMBUATAN APLIKASI INFORMASI PASIEN BERBASIS DESKTOP DI BALAI PENGOBATAN MITRA SEHAT TUGAS AKHIR

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

SKRIPSI SISTEM INFORMASI GEOGRAFIS LOKASI PENGUNGSIAN BENCANA BANJIR DI KABUPATEN KUDUS. Oleh : RIZAL CHAIRUL AMAL

SKRIPSI PERANCANGAN CONTENT MANAGEMENT SYSTEM (CMS) BERITA ONLINE DENGAN MENGGUNAKAN PHP DAN MYSQL

BAB 1 PENDAHULUAN UKDW

DAFTAR ISI HALAMAN JUDUL HALAMAN PENGESAHAN PEMBIMBING HALAMAN PENGESAHAN PENGUJI KATA PENGANTAR.. DAFTAR GAMBAR DAFTAR MODUL..

APLIKASI PERPUSTAKAAN BERBASIS WEB DENGAN MENGGUNAKAN PHP MYSQL DAN BARCODE AZHARI

APLIKASI PEMBELAJARAN SKATEBOARD MENGGUNAKAN FRAMEWORK CODEIGNITER BERBASIS WEB. Disusun Oleh : GIANMAR SAPUTRA

BAB 1 PENDAHULUAN UKDW

SKRIPSI MEMBANGUN PERUSAHAAN ONLINE PADA PABRIK KERUPUK LAKSANA MENGGUNAKAN PHP DAN MYSQL

SISTEM PENJADWALAN UJIAN DOKTOR PADA PASCASARJANA UNIVERSITAS DIPONEGORO. Rizka Ella Setyani, Sukmawati Nur Endah

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

APLIKASI PERAMALAN KEUNTUNGAN PENJUALAN MENGGUNAKAN METODE REGRESI LINIER (Studi Kasus :Home Industri Penjualan Keripik Jagung Manggala )

PENERAPAN ALGORITMA C4.5 PADA APLIKASI DATA MINING PEMILIHAN BEASISWA BAGI MAHASISWA DI UNIVERSITAS DIPONEGORO

APLIKASI METODE AHP (ANALYTICAL HIERARCHY PROCESS) UNTUK SELEKSI KARYA ILMIAH PADA SEMINAR NASIONAL (STUDI KASUS JURUSAN INFORMATIKA FSM UNDIP)

PENGEMBANGAN SISTEM INFORMASI EKSPLOITASI PRODUKSI KAYU PERUM PERHUTANI UNIT I JAWA TENGAH

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL

APLIKASI PENILAIAN EFISIENSI KINERJA DINAS PARIWISATA PROVINSI UNTUK PENGEMBANGAN PARIWISATA DI INDONESIA MENGGUNAKAN DATA ENVELOPMENT ANALYSIS (DEA)

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

DAFTAR ISI. HALAMAN JUDUL... i. LEMBAR PENGESAHAN... ii. ABSTRAK... iv. MOTTO... vi. KATA PENGANTAR... vii. DAFTAR ISI... ix. DAFTAR GAMBAR...

Kata Kunci :Sistem Informasi Akademik, SMA, Waterfall, PHP, MySql

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

APLIKASI SISTEM PENDUKUNG KEPUTUSAN PENENTUAN LOKASI PENANAMAN TANAMAN KELAPA SAWIT MENGGUNAKAN METODE PROMETHEE

TEMU KEMBALI INFORMASI

2.8.1 PHP (Hypertext Preprocessor)... II MySQL... II Macromedia Dreamweaver 8... II-12 BAB III ANALISIS SISTEM 3.

SISTEM INFORMASI PELAYANAN HAJI DAN UMROH BERBASIS WEB PADA PT. BUSINDO AYANA

RANCANG BANGUN SISTEM PENCARIAN DOKUMEN JURNAL MENGGUNAKAN METODE BM25+

UJIAN ONLINE MASUK SEKOLAH SMP BERBASIS WEB, STUDI KASUS XYZ FAJAR MAULANA YUSUP

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB I PERSYARATAN PRODUK

SISTEM INFORMASI PEMBAYARAN SPP DAN PRESENSI DI SMAN 1 MELIAU KALIMANTAN BARAT

Analisa dan Perancangan Sistem Informasi Berita dan Informasi Kelapa Gading Berbasis Web

PERANCANGAN SISTEM INFORMASI DATA PASIEN BIDAN BERBASIS OPEN SOURCE MENGGUNAKAN ALGORITMA AJAX LIVE SEARCH

TUGAS AKHIR SISTEM INFORMASI TUGAS AKHIR DIII TEKNIK INFORMATIKA FMIPA UNS

ABSTRAK. viii. Kata Kunci: Jaringan, Konstruksi, Pelaporan, Proyek, Sistem Informasi. Universitas Kristen Maranatha

IMPLEMENTASI ALGORITMA WINNOWING DAN PORTER STEMMER MENDETEKSI KEMIRIPAN DUA DOKUMEN BERBASIS WEB SKRIPSI LIDIA ARTA FERARI

SKRIPSI. Disusun Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer pada Jurusan Ilmu Komputer/Informatika.

SISTEM PENDUKUNG KEPUTUSAN PENERIMAAN SISWA BARU SEKOLAH MENENGAH KEJURUAN DENGAN METODE WEIGHTED PRODUCT (STUDI KASUS : SMK N 1 KOTA TEGAL)

DAFTAR ISI. ABSTRAKSI... v. KATA PENGANTAR... vi. DAFTAR ISI... viii. DAFTAR GAMBAR... xi. DAFTAR TABEL... xiv BAB I PENDAHULUAN...

ABSTRAK. Kata Kunci : Peramalan, Least Square, Moving Average

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

BAB I PENDAHULUAN. Badan Perencanaan Pembangunan Daerah (Bappeda) Kota Bandung adalah salah

ABSTRAK. Kata Kunci : tugas akhir, bimbingan, online, framework, dan codeigniter. Universitas Kristen Maranatha

PENGEMBANGAN APLIKASI WEB BASED DOCUMENTS SIMILARITY MEASURE MENGGUNAKAN MODEL RUANG VEKTOR PADA DOKUMEN BERBAHASA INDONESIA. Oleh

BAB I PENDAHULUAN 1.1. Latar belakang

BAB I PENDAHULUAN Latar Belakang Masalah

SISTEM PENDUKUNG KEPUTUSAN UNTUK PENENTUAN MINAT PESERTA DIDIK DI SMA MENGGUNAKAN METODE TOPSIS. (Studi Kasus : SMA Negeri 1 Bekasi) SKRIPSI

SKRIPSI SISTEM REKOMENDASI WISATA KULINER DI YOGYAKARTA MENGGUNAKAN METODE KOLABORATIF (COLLABORATIVE METHOD)

ABSTRAK. Kata Kunci : Latent Semantic Indexing, pencarian, dokumen, Singular Value Decomposition.

ABSTRAK. Kata kunci : distribusi materi kuliah, PHP, MYSQL, Dreamweaver. Universitas Kristen Maranatha

BAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi

BAB II TINJAUAN PUSTAKA

ABSTRAK. Kata Kunci: information retrieval, rekomendasi, wanita, web portal UNIVERSITAS KRISTEN MARANATHA

BAB III METODOLOGI PENELITIAN

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

BAB I PENDAHULUAN 1.1 Latar Belakang

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

APLIKASI PENCARIAN GEDUNG SERBAGUNA DI JAKARTA BERBASIS WEB

DAFTAR ISI PHP... 15

SKRIPSI PEMBUATAN SITUS PORTAL BERITA MENGGUNAKAN PHP DAN MYSQL

APLIKASI BERBASIS WEB SISTEM INFORMASI MANAJEMEN WIDYAISWARA MENGGUNAKAN FRAMEWORK YII

RANCANG BANGUN SISTEM PENYELARASAN KATA BERBAHASA INDONESIA DENGAN MENGGUNAKAN ALGORITMA LEVENSHTEIN DISTANCE

TRANSFORMASI DOKUMEN XML MENJADI MODEL BASIS DATA RELASIONAL DENGAN MENGGUNAKAN METODE PARSING SAX

BAB I PENDAHULUAN. Dalam suatu basis data, pendekatan model data relasional masih banyak dimanfaatkan untuk penyimpanan data dan informasi terhadap

PERANCANGAN SISTEM PENGENDALIAN KERJA LEMBUR KARYAWAN BERBASIS WEB. Laporan Tugas Akhir

BAB 1 PENDAHULUAN. 1.1.Latar Belakang

Transkripsi:

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan Ilmu Komputer/ Informatika Disusun oleh: ABDUL MAGHFIR ZAKIR 24010311130054 JURUSAN ILMU KOMPUTER/INFORMATIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO 2015 i

HALAMAN PERNYATAAN KEASLIAN SKRIPSI Saya yang bertanda tangan di bawah ini : Nama : Abdul Maghfir Zakir NIM : 24010311130054 Judul : Aplikasi Mesin Pencari Dokumen Cross Language Bahasa Inggris Bahasa Indonesia Menggunakan Vector Space Model. Dengan ini saya menyatakan bahwa dalam tugas akhir/ skripsi ini tidak terdapat karya yang pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain, kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan di dalam daftar pustaka. ii

HALAMAN PENGESAHAN Judul : Aplikasi Mesin Pencari Dokumen Cross Language Bahasa Inggris Bahasa Indonesia Menggunakan Vector Space Model. Nama : Abdul Maghfir Zakir NIM : 24010311130054 Telah diujikan pada sidang tugas akhir tanggal 22 Desember 2015 dan dinyatakan lulus pada tanggal 14 Januari 2016. Semarang, Januari 2016 iii

HALAMAN PENGESAHAN Judul : Aplikasi Mesin Pencari Dokumen Cross Language Bahasa Inggris Bahasa Indonesia Menggunakan Vector Space Model. Nama : Abdul Maghfir Zakir NIM : 24010311130054 Telah diujikan pada sidang tugas akhir tanggal 22 Desember 2015. iv

ABSTRAK Fenomena banjirnya informasi seiring berkembangnya teknologi dapat ditangani dengan kajian-kajian yang ada pada information retrieval (IR). Namun permasalahan pada IR semakin berkembang karena adanya perbedaan bahasa antar negara. Oleh karena itu dibutuhkan suatu aplikasi cross-language information retrieval (CLIR) yang mampu mengoptimalkan hasil pencarian dokumen lintas bahasa. Aplikasi mesin pencari dokumen ini dapat melakukan penerjemahan pada masukan query lalu dihitung kemiripannya terhadap dokumen yang memiliki bahasa yang berbeda. Nilai kemiripan ini dapat ditentukan berdasarkan nilai similaritas dokumen terhadap query dengan Vector Space Model. Sepuluh dokumen dengan nilai kemiripan tertinggi akan diambil dan dihitung nilai ketepatannya (precision). Berdasarkan hasil evaluasi dengan menggunakan 8 user dan 10 query, didapatkan nilai Mean Average Precision (MAP) keseluruhan sebesar 0.912 atau sekitar 91%. Kata kunci : mesin pencari dokumen, CLIR, vector space model v

ABSTRACT The information flooding phenomenon as technology growth can be handled by existing studies on information retrieval (IR). However, the problem in IR keep on growing because of language differences between countries. Therefore, it needs a cross-language information retrieval (CLIR) application which is able to optimize cross-language document search result. This document search engine application can translate the query input, then calculate its similarity to the document that has a different language. The similarity value can be determined based on the similarity of the document to the query with Vector Space Model. Ten documents with the highest similarity value will be taken and its value of accuracy (precision) will be calculated. Based on the evaluation results by using 8 users and 10 queries, it was discovered that its overall Mean Average Precision (MAP) is 0.912 or about 91%. Keyword: document search engine, CLIR, vector space model vi

KATA PENGANTAR Segala puji syukur bagi Tuhan Yang Maha Esa atas karunia-nya yang diberikan kepada penulis sehingga penulis dapat menyelesaikan penulisan laporan tugas akhir yang berjudul Aplikasi Mesin Pencari Dokumen Cross Language Bahasa Inggris Bahasa Indonesia Menggunakan Vector Space Model. Laporan tugas akhir ini disusun sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu pada Jurusan Ilmu Komputer/ Informatika Fakultas Sains dan Matematika Universitas Diponegoro Semarang. Dalam penyusunan laporan ini penulis banyak mendapat bimbingan dan bantuan dari berbagai pihak. Untuk itu, pada kesempatan ini penulis mengucapkan rasa hormat dan terima kasih kepada: 1. Ragil Saputra, S.Si, M.Cs selaku Ketua Jurusan Ilmu Komputer/Informatika 2. Helmie Arif Wibawa,S.Si, M.Cs selaku Koordinator Tugas Akhir 3. Sukmawati Nur Endah, S.Si, M.Kom selaku dosen pembimbing 4. Semua pihak yang telah membantu kelancaran dalam penyusunan tugas akhir, yang tidak dapat penulis sebutkan satu persatu. Penulis menyadari bahwa dalam laporan ini masih banyak kekurangan baik dari segi materi ataupun dalam penyajiannya karena keterbatasan kemampuan dan pengetahuan penulis. Oleh karena itu, kritik dan saran sangat penulis harapkan. Semoga laporan ini dapat bermanfaat bagi pembaca dan penulis pada umumnya. Semarang, Januari 2016 Penulis, Abdul Maghfir Zakir 24010311130054 vii

DAFTAR ISI HALAMAN PERNYATAAN KEASLIAN SKRIPSI... ii HALAMAN PENGESAHAN... iii ABSTRAK... v ABSTRACT... vii KATA PENGANTAR... vii DAFTAR ISI... viii DAFTAR GAMBAR... x DAFTAR TABEL... xii DAFTAR LAMPIRAN... xiii BAB I PENDAHULUAN... 1 1.1. Latar Belakang... 1 1.2. Rumusan Masalah... 2 1.3. Tujuan dan Manfaat... 2 1.4. Ruang Lingkup... 3 1.5. Sistematika Penulisan... 3 BAB II TINJAUAN PUSTAKA... 5 2.1. Information Retrieval... 5 2.1.1. Cross-Language Information Retrieval... 6 2.2. Arsitektur Information Retrieval... 7 2.2.1. Tokenisasi... 8 2.2.2. Penghapusan Stopword... 8 2.2.3. Stemming... 9 2.2.4. Pembobotan... 11 2.3. Proses Pengembangan Perangkat Lunak... 12 2.3.1. System/Information Engineering... 12 2.3.2. Analysis... 13 2.3.2.1. Pemodelan Fungsional... 13 2.3.3. Design... 17 2.3.3.1. Perancangan Struktur... 17 2.3.3.2. Perancangan Fungsional... 17 2.3.3.3. Perancangan Antarmuka... 17 2.3.4. Code... 17 2.3.5. Test... 17 2.4. PHP... 18 viii

2.5. MySQL... 19 2.6. Vector Space Model... 19 2.7. Evaluasi... 22 2.7.1. Precision dan Recall... 23 2.7.2. Average Precision... 24 2.7.3. Mean Average Precision... 25 BAB III ANALISIS DAN PERANCANGAN... 26 3.1. Analisis... 26 3.1.1. Deskripsi Umum Aplikasi... 26 3.1.2. Kebutuhan Fungsional dan Non Fungsional... 27 3.1.3. Pemodelan Fungsional... 28 3.1.3.1. Context Diagram (CD)... 28 3.1.3.2. Diagram Flow Diagram (DFD)... 29 3.2. Perancangan Sistem... 30 3.2.1. Perancangan Struktur Data... 31 3.2.2. Perancangan Antarmuka... 33 3.2.3. Perancangan Fungsi... 39 BAB IV IMPLEMENTASI DAN PENGUJIAN... 59 4.1. Implementasi... 59 4.1.1. Lingkungan Implementasi Sistem... 59 4.1.2. Implementasi Data... 59 4.1.3. Implementasi Antarmuka... 62 4.1.4. Implementasi Fungsi... 66 4.2. Pengujian... 66 4.2.1. Rencana Pengujian... 67 4.2.1.1. Rencana Pengujian Fungsional Sistem... 67 4.2.1.2. Rencana Evaluasi Vector Space Model... 67 4.2.2. Pengujian dan Hasil Uji... 69 4.2.2.1. Pengujian dan Hasil Uji Fungsional Sistem... 70 4.2.2.2. Evaluasi dan Hasil Evaluasi Vector Space Model... 70 4.2.3. Analisa Hasil Evaluasi... 72 BAB V PENUTUP... 73 5.1. Kesimpulan... 73 5.2. Saran... 73 DAFTAR PUSTAKA... 74 LAMPIRAN... 76 ix

DAFTAR GAMBAR Gambar 2.3. Model Waterfall... 12 Gambar 2.4. Cosine dari θ didapatkan dari dj dan q (Yates R, 1999).... 20 Gambar 3.1. Gambaran Umum Aplikasi... 26 Gambar 3.2. Context Diagram Aplikasi Mesin Pencari Dokumen Cross Language Bahasa Inggris Bahasa Indonesia Menggunakan Vector Space Model.... 29 Gambar 3.3. DFD Aplikasi Mesin Pencari Dokumen Cross-Language Bahasa Inggris Bahasa Indonesia Menggunakan Vector Space Model.... 30 Gambar 3.4. Desain Antarmuka Halaman Utama Aplikasi... 34 Gambar 3.5. Desain Antarmuka Halaman Utama Aplikasi... 34 Gambar 3.6. Desain Antarmuka Halaman Log in... 34 Gambar 3.7. Desain Antarmuka Halaman Upload Dokumen... 35 Gambar 3.8. Desain Antarmuka Halaman Gagal Upload Dokumen... 36 Gambar 3.9. Desain Antarmuka Halaman Stemming Dokumen... 36 Gambar 3.10. Desain Antarmuka Halaman Stemming Dokumen Berhasil... 37 Gambar 3.11. Desain Antarmuka Halaman Hasil Pencarian Dokumen... 38 Gambar 3.12. Desain Antarmuka Halaman Detail Proses Pencarian... 38 Gambar 3.13. Desain Antarmuka Halaman Detail Proses Pencarian... 39 Gambar 3.15. Flowchart Proses Fungsi-Fungsi pada Admin... 40 Gambar 3.16. Flowchart Proses Fungsi-Fungsi pada User... 54 Gambar 3.17. Flowchart Proses Login Aplikasi... 41 Gambar 3.18. Flowchart Proses Upload Dokumen... 42 Gambar 3.19. Flowchart Proses Preprocess Dokumen... 43 Gambar 3.20. Flowchart Proses Stemming Dokumen... 44 Gambar 3.21. Flowchart Proses Porter Stemmer... 45 Gambar 3.22. Flowchart Lanjutan Proses Porter Stemmer... 46 Gambar 3.23. Flowchart Proses Nazief dan Andriani... 51 Gambar 3.24. Flowchart Pengindeksan Dokumen... 52 Gambar 3.25. Flowchart Proses Pembobotan... 53 Gambar 3.26. Flowchart Proses Pencarian Dokumen... 55 Gambar 3.27. Flowchart Preprocess Query... 56 Gambar 3.28. Flowchart Proses Vector Space Model... 57 Gambar 4.1. Struktur Tabel eng_ind pada MySQL... 60 Gambar 4.2. Struktur Tabel ind_eng pada MySQL... 60 Gambar 4.3. Struktur Tabel Admin pada MySQL... 60 x

Gambar 4.4. Struktur Tabel Kata Dasar pada MySQL... 61 Gambar 4.5. Struktur Tabel Stopwords_eng pada MySQL... 61 Gambar 4.6. Struktur Tabel Stopwords_ind pada MySQL... 61 Gambar 4.7. Struktur Folder Korpus... 61 Gambar 4.8. Antarmuka Halaman Utama... 62 Gambar 4.9. Antarmuka Halaman Log In... 63 Gambar 4.10. Antarmuka Halaman Upload Dokumen... 63 Gambar 4.11. Antarmuka Gagal Upload Dokumen... 64 Gambar 4.12. Antarmuka Stemming Dokumen... 64 Gambar 4.13. Antarmuka Stemming Dokumen Berhasil... 65 Gambar 4.14. Antarmuka Hasil Pencarian Dokumen... 65 Gambar 4.15. Antarmuka Detail Proses Pencarian... 66 Gambar 4.16. Antarmuka Detail Proses Pencarian... 66 Gambar 4.17. Grafik Average Precision... 71 Gambar 4.18. Grafik Mean Average Precision Setiap User... 71 xi

DAFTAR TABEL Tabel 2.1. Contoh SRS... 13 Tabel 2.2 Tabel Penomoran DFD... 14 Tabel 2.3 Tabel Notasi DFD... 16 Tabel 2.4. Nilai bobot kata dari contoh Vector Space Model... 21 Tabel 2.5. Perhitungan Recall dan Precision... 23 Tabel 3.1. Kebutuhan Fungsional... 27 Tabel 3.2. Kebutuhan Non Fungsional... 27 Tabel 3.3. Struktur Tabel Kamus Inggris Indonesia... 31 Tabel 3.4. Struktur Tabel Kamus Indonesia Inggris... 31 Tabel 3.5. Struktur Tabel Kata Dasar... 31 Tabel 3.6. Struktur Tabel Admin... 32 Tabel 3.7. Struktur Tabel Stopwords Inggris... 32 Tabel 3.8. Struktur Tabel Stopwords Inggris... 32 Tabel 3.9. Struktur Folder Korpus... 33 Tabel 4.1. Rencana Pengujian Fungsional Sistem... 67 Tabel 4.2. Daftar Dokumen yang Digunakan dalam Pengujian... 68 Tabel 4.3. Daftar Penggunaan Query... 69 Tabel 4.4. Hasil Perhitungan Average Precision... 70 Tabel 4.5. Hasil Mean Average Precision setiap user... 71 Tabel 7.1 Sampel Daftar Data Stopwords... 76 Tabel 7.2 Sampel Daftar Data Kata Dasar... 78 Tabel 7.3 Sampel Daftar Data Kamus... 80 Tabel 7.4. Deskripsi dan Hasil Uji Log In Admin... 82 Tabel 7.5. Deskripsi dan Hasil Uji Upload Dokumen... 83 Tabel 7.6. Deskripsi dan Hasil Uji Stemming Dokumen... 84 Tabel 7.7. Deskripsi dan Hasil Uji Pengindeksan Dokumen... 84 Tabel 7.8. Deskripsi dan Hasil Uji Pencarian Dokumen... 85 Tabel 7.9. Deskripsi dan Hasil Uji Download Dokumen... 85 Tabel 7.10. Deskripsi dan Hasil Uji Menampilkan Detail Proses Pencarian... 86 Tabel 7.11. Hasil Perhitungan Precision dan Recall... 87 xii

DAFTAR LAMPIRAN Lampiran 1. Sampel Daftar Data Stopwords... 76 Lampiran 2. Sampel Daftar Data Kata Dasar... 78 Lampiran 3. Sampel Daftar Data Kamus... 80 Lampiran 4. Pengujian dan Hasil Uji Fungsional Sistem... 82 Lampiran 5. Hasil Evaluasi Vector Space Model... 87 Lampiran 6. Source Code Fungsi Pencarian Dokumen... 91 xiii

BAB I PENDAHULUAN 1.1. Latar Belakang Jumlah informasi yang tersedia di internet saat ini sangat banyak dan terus bertambah setiap saat. Hal ini dikarenakan perkembangan teknologi yang dimanfaatkan sangat membantu dalam penyebaran informasi. Seiring dengan peningkatan jumlah dan keragaman informasi yang beredar, pengguna semakin sulit mendapatkan informasi yang diinginkan. Kebutuhan penggunapun mulai bergeser dari yang dulunya mencari informasi secara kuantitatif menjadi kualitatif. Salah satu bidang yang membahas tentang pencarian informasi yaitu information retrieval (IR). Fenomena banjirnya informasi dapat diselesaikan dengan kajian-kajian yang ada pada IR agar pengguna dapat menemukan informasi yang sesuai keinginan. Permasalahan pada IR semakin berkembang karena adanya perbedaan bahasa dari berbagai negara. Misalnya dilakukan pencarian informasi dengan memasukkan query dengan bahasa tertentu, maka hasil yang diterima pengguna hanya dokumen berisi informasi yang ditulis dengan bahasa tersebut. Sehingga hasil pencarian tidak dapat memberikan hasil yang maksimum untuk pengguna. Peningkatan hasil pencarian agar lebih optimal pada search engine ini dapat diselesaikan dengan cross-language information retrieval (CLIR). CLIR pada dasarnya memiliki metode yang sama dengan IR, hanya saja CLIR memiliki tahap penerjemahan pada query atau pada dokumen korpus. Kedua metode penerjemahan tersebut memiliki kekurangan masing-masing. Metode dengan menerjemahkan dokumen korpus akan memiliki proses yang lama dan tidak praktis sedangkan untuk menerjemahkan query menjadi sulit pada saat query bersifat ambigu. Penerapan CLIR ini terbagi lagi menjadi beberapa model, antara lain Probabilistic Model, Set-theoretic Model dan Algebratic Model. Probabilistic Model contohnya pada penerapan Teorema Bayes, penerapan Set-theoretic Models pada Standard Boolean dan Extended, dan Algebratic Model contohnya adalah Vector Space Model. Dari tiga model yang telah disebutkan, Algebratic Model dengan contoh Vector Space Model adalah model yang paling sederhana dalam pencarian kata. Vector Space Model telah terbukti memiliki efektifitas dalam pencarian kata 1

dengan menampilkan hasil pencariannya berdasar kemiripan vector query dan vector dokumen (Bari & Saputra, 2011). Penelitian terdahulu yang menggunakan metode ini antara lain Fatkhul Amin dalam publikasinya yang berjudul Sistem Temu Kembali Informasi dengan Pemeringkatan Metode Vector Space Model (Amin, 2013). Penelitian ini membahas tentang mesin pencari dokumen menggunakan Vector Space Model dengan hasil evaluasi presisi mencapai 99%. Selain itu dari publikasi Andre Hesel, Ricky Dwiputra dan Hendra yang berjudul Studi dan Evaluasi Kinerja Model-Model Information Retrieval Berbasiskan Dokumen Teks menyimpulkan bahwa dalam memilih model information retrieval sebaiknya menggunakan Vector Space Model. Hal ini dikarenakan pada penelitian diketahui bahwa Vector Space Model memberikan Mean Average Precision yang lebih besar yaitu 71,25% dibanding dengan Boolean Model dan Latent Semantic Indexing (LSI) (Hesel, et al., 2013). Berdasarkan uraian diatas maka akan dibangun sebuah aplikasi mesin pencari dokumen cross language Bahasa Inggris Bahasa Indonesia Menggunakan vector space model. 1.2. Rumusan Masalah Berdasarkan latar belakang yang telah diuraikan, maka dapat dirumuskan masalah yaitu bagaimana membuat aplikasi mesin pencari dokumen cross language Bahasa Inggris Bahasa Indonesia Menggunakan vector space model. 1.3. Tujuan dan Manfaat Penelitian Tugas Akhir ini bertujuan untuk menghasilkan suatu aplikasi yang dapat mencari dokumen dengan kemampuan cross-language Bahasa Inggris Bahasa Indonesia Menggunakan vector space model. Aplikasi mesin pencari ini diharapkan bisa bermanfaat dalam menemukan dokumen yang relevan dengan Menggunakan query Bahasa Inggris untuk menemukan dokumen yang relevan dalam Bahasa Indonesia sekalipun, begitupun sebaliknya. 2

1.4. Ruang Lingkup Ruang lingkup dari pengembangan Aplikasi Mesin Pencari Dokumen Cross Language Bahasa Inggris Bahasa Indonesia Menggunakan Vector Space Model adalah sebagai berikut: 1. Penerapan CLIR yang digunakan adalah penerjemahan pada query. 2. Bahasa yang digunakan adalah Bahasa Inggris dan Bahasa Indonesia. 3. Dokumen diolah berasal dari korpus lokal, bukan menggunakan web crawling. 4. Dokumen yang diolah menggunakan korpus menggunakan format file txt. 5. Dokumen yang ter-retrieve dapat diunduh dengan format pdf. 6. Evaluasi metode menggunakan minimal 20 dokumen jurnal Bahasa Indonesia dan 20 dokumen jurnal Bahasa Inggris. 7. Pengembangan aplikasi menggunakan model proses pengembangan perangkat lunak waterfall. 8. Pembangunan aplikasi menggunakan Bahasa Pemrograman PHP dan Database Management System MySQL. 1.5. Sistematika Penulisan Sistematika penulisan yang digunakan dalam tugas akhir ini dibagi menjadi dalam beberapa pokok bahasan, yaitu: BAB I PENDAHULUAN Bab ini membahas latar belakang, rumusan masalah, tujuan dan manfaat, ruang lingkup dan sistematika penulisan dalam pembuatan tugas akhir megenai Aplikasi Mesin Pencari Dokumen Cross- Language Bahasa Inggris Bahasa Indonesia Menggunakan Vector Space Model. BAB II TINJAUAN PUSTAKA Bab ini menyajikan tinjauan pustaka yang berhubungan dengan topik tugas akhir. Tinjauan pustaka yang digunakan dalam penyusunan tugas akhir ini meliputi information retrieval, arsitektur information retrieval, proses pengembangan perangkat lunak, PHP, MySQL, Vector Space Model, dan evaluasi. 3

BAB III ANALISIS DAN PERANCANGAN Bab ini menyajikan mengenai pembahasan tahapan dari model pengembangan perangkat lunak waterfall yang meliputi tahap analisis dan perancangan dari Aplikasi Mesin Pencari Dokumen Cross-Language Bahasa Inggris Bahasa Indonesia Menggunakan Vector Space Model. BAB IV IMPLEMENTASI DAN PENGUJIAN Bab ini menyajikan mengenai pembahasan tahapan dari model pengembangan perangkat lunak waterfall yang meliputi tahap implementasi dan pengujian dari Aplikasi Mesin Pencari Dokumen Cross-Language Bahasa Inggris Bahasa Indonesia Menggunakan Vector Space Model. BAB V PENUTUP Bab ini merupakan kesimpulan dari bab-bab yang telah dibahas sebelumya serta saran untuk pengembangan penelitian tugas akhir lebih lanjut. 4