Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

dokumen-dokumen yang mirip
BAB I PENDAHULUAN Latar Belakang

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

TEMU KEMBALI INFORMASI

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

BAB 2 TINJAUAN PUSTAKA

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

Information Retrieval

EVALUASI SISTEM TEMU KEMBALI INFORMASI MODEL RUANG VEKTOR DENGAN PENDEKATAN USER JUDGEMENT

SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

Pemanfaatan Permodelan Ruang Vektor untuk Pengecekan Kemiripan

DAFTAR ISI. SKRIPSI... ii

Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

PENCARIAN DOKUMEN BERDASARKAN KOMBINASI ANTARA MODEL RUANG VEKTOR DAN MODEL DOMAIN ONTOLOGI

commit to user BAB II TINJAUAN PUSTAKA

Implementasi Generalized Vector Space Model Menggunakan WordNet

BAB II TINJAUAN PUSTAKA

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

IMPLEMENTASI VECTOR SPACE MODEL UNTUK PENCARIAN DOKUMEN

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

BAB III METODOLOGI PENELITIAN

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

Pemanfaatan Aljabar Vektor Pada Mesin Pencari

Sistem Temu-Kembali Informasi Pengantar Perkuliahan

Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

VECTOR SPACE MODEL. Tujuan 4/2/13. Budi Susanto

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)

JURNAL ITSMART Vol 4. No 2. Desember 2015 ISSN :

Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL. Budi Susanto

IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN

BAB II LANDASAN TEORI

BAB I PERSYARATAN PRODUK

PENDAHULUAN. Latar belakang

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer

PROGRAM BANTU PEMILIHAN LAGU PUJIAN BERDASARKAN TEMA KEBAKTIAN DENGAN MENGGUNAKAN METODE COSINUS SIMILARITY Studi Kasus: GKI Ngupasan

BAB II LANDASAN TEORI. karya rekam secara profesional dengan sistem yang baku guna memenuhi

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

BAB II TINJAUAN PUSTAKA

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

PENERAPAN ALGORITMA DEPTH FIRST SEARCH PADA SISTEM PENCARIAN DOKUMEN APPLYING DEPTH FIRST ALGORITHM ON DOCUMENT SEARCHING SYSTEM

KOM341 Temu Kembali Informasi

Sistem Deteksi Kemiripan Identitas...

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN UKDW

JURNAL INFORMATIKA IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL

Mengukur Tingkat Kesamaan Paragraf Menggunakan Vector Space Model untuk Mendeteksi Plagiarisme

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

BAB II LANDASAN TEORI

Perancangan Sistem Temu Kembali Informasi Menggunakan Metode Vector Space Model Pada Pencarian Dokumen Berbasis Teks Berita

BAB I PENDAHULUAN. Dalam suatu basis data, pendekatan model data relasional masih banyak dimanfaatkan untuk penyimpanan data dan informasi terhadap

Fatkhul Amin Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang

BAB V EKSPERIMEN TEXT CLASSIFICATION

PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK PENCARIAN WEB SERVICE MENGGUNAKAN LUCENE

Mengenal Information Retrieval

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Penerapan Model Gravitasi Newton Versi Continuous dan Diskrit pada Sistem Temu Balik Informasi

SISTEM TEMU KEMBALI INFORMASI

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

DETEKSI KEMIRIPAN TOPIK PROPOSAL JUDUL TUGAS AKHIR DAN SKRIPSI MENGGUNAKAN LATENT SEMANTIC ANALYSIS DI STMIK BUMIGORA MATARAM

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

SISTEM INFORMATION RETRIEVAL PENCARIAN KESAMAAN AYAT TERJEMAHAN AL QURAN BERBAHASA INDONESIA DENGAN QUERY EXPANSION DARI TAFSIRNYA

PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN

Indexing dan Bahasa Penelusuran

PENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA.

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE

SISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR

Aplikasi Pencarian Karya Tulis Ilmiah Berbasis Web Menggunakan Sistem Rekomendasi

BAB 1 PENDAHULUAN Latar Belakang

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011

IMPLEMENTASI ALGORITMA VECTOR SPACE MODEL DALAM PENCARIAN E-BOOK

SISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ

Matriks Sebagai Representasi Orientasi Objek 3D

Mencari dokumen yang dituliskan dalam berbagai bahasa

BAB II LANDASAN TEORI

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK

TEMU BALIK INFORMASI PADA DOKUMEN TEKS BERBAHASA INDONESIA DENGAN METODE VECTOR SPACE RETRIEVAL MODEL

Perangkingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

Transkripsi:

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System) IF3 Aljabar Geometri Oleh: Rinaldi Munir Program Studi Informatika, STEI-ITB Rinaldi Munir - IF3 Aljabar Geometri

Sistem Temu-balik Informasi Sistem temu-balik informasi: menemukan kembali (retrieval) informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Sumber gambar:https://sites.google.com/site/berbagiinformasidanekspresi/arsip/ pengantar-temu-kembali-informasi-information-retrieval Rinaldi Munir - IF3 Aljabar Geometri

IR tidak sama dengan pencarian di dalam basisdata (database) IR umumnya digunakan pada pencarian informasi yang isinya tidak terstruktur Informasi terstruktur: tabel-tabel di dalam basisdata (database) Rinaldi Munir - IF3 Aljabar Geometri 3

Informasi tak-terstruktur: - dokumen (isinya bergantung pembuatnya) - laman web (webpage) Rinaldi Munir - IF3 Aljabar Geometri 4

Aplikasi IR: search engine uery Rinaldi Munir - IF3 Aljabar Geometri 5

Hasil pencarian: Rinaldi Munir - IF3 Aljabar Geometri 6

Rinaldi Munir - IF3 Aljabar Geometri 7

IR dengan Model Ruang Vektor Salah satu model IR adalah model ruang vektor Model ini menggunakan teori di dalam aljabar vector Misalkan terdapat n kata berbeda sebagai kamus kata (vocabulary) atau indeks kata (term index). Kata-kata tersebut membentuk ruang vektor berdimensi n Setiap dokumen maupun query dinyatakan sebagai vektor w = (w, w,..., w n ) di dalam R n. Nilai w i menyatakan bobot setiap kata i di dalam query atau dokumen Nilai w i dapat menyatakan jumlah kemunculan kata tersebut dalam dokumen (term frequency) Rinaldi Munir - IF3 Aljabar Geometri 8

Contoh: Misalkan terdapat tiga buah kata (T, T, dan T 3 ), dua buah dokumen ( dan ) serta sebuah query. Masing-masing dinyatakan sebagai vector: = (, 3, 5), = (3, 7, ), = (0, 0, ) = (, 3, 5) artinya dokumen mengandung buah kata T, 3 buah kata T, dan 5 buah kata T 3. = (3, 7, ) artinya dokumen mengandung 3 buah kata T, 7 buah kata T, dan satu buah kata T 3. = (0, 0, ) artinya query hanya mengandung buah kata T 3. Representasi grafis ketiga vektor di atas diperlihatkan pada halaman berikut ini. Rinaldi Munir - IF3 Aljabar Geometri 9

Representasi grafik vektor Contoh: = (, 3, 5) = (3, 7, ) = (0, 0, ) 5 T 3 3 T T 7 0

Penentuan dokumen mana yang relevan dengan query dipandang sebagai pengukuran kesamaan (similarity measure). Semakin sama suatu vektor dokumen dengan vektor query, semakin relevan dokumen tersebut dengan query. Kesamaan (sim) antara dua vektor = (q, q,, q n ) dan = (d, d,, d n ) diukur dengan rumus perkalian titik dan sudut antara dua vektor: sim(, ) cos dengan adalah perkalian titik yang didefinisikan sebagai q d q d... q n d n Rinaldi Munir - IF3 Aljabar Geometri

T 3 T T Jika cos =, berarti = 0, vektor dan berimpit, yang berarti dokumen sesuai dengan query. Jadi, nilai cosinus yang besar (mendekati ) mengindikasikan bahwa dokumen cenderung sesuai dengan query. Rinaldi Munir - IF3 Aljabar Geometri

Setiap dokumen di dalam koleksi dokumen dihitung kesamaannya dengan query dengan rumus cosinus di atas. Selanjutnya hasil perhitungan di-ranking berdasarkan nilai cosinus dari besar ke kecil sebagai proses pemilihan dokumen yang yang dekat dengan query. Pe-ranking-an tersebut menyatakan dokumen yang paling relevan hingga yang kurang relevan dengan query. Nilai cosinus yang besar menyatakan dokumen yang relevan, nilai cosinus yang kecil menyatakan dokumen yang kurang relevan dengan query. Rinaldi Munir - IF3 Aljabar Geometri 3

Pada contoh di atas: = ()(0) + (3)(0) + (5)() = 0 = (3)(0) + (7)(0) + ()() = Rinaldi Munir - IF3 Aljabar Geometri 4 59 49 9 7 3 38 5 9 4 5 3 4 0 0 0.3 59 cos ), ( 0.8 38 0 cos ), ( sim sim Karena 0.8 > 0.3, maka dokumen lebih sesuai dengan query dibandingkan dengan dokumen

Untuk mendalami lebih lanjut tentang model-model lain di dalam Sistem Temu-balik Informasi, maka anda dapat mengambil mata kuliah pilihan IF404 Sistem Temu Balik Informasi di Semester 7. Rinaldi Munir - IF3 Aljabar Geometri 5

Referensi. Prof. ik Lee, Vector Space Retrieval Models, Univ. of Science and Tech, Hong Kong.. Hendra Bunyamin, Information Retrieval System dengan Metode Latent Semantic Indexing, Tesis S Informatika ITB, 005. Rinaldi Munir - IF3 Aljabar Geometri 6