TEMU KEMBALI INFORMASI

dokumen-dokumen yang mirip
TEMU KEMBALI INFORMASI

KOM341 Temu Kembali Informasi

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

JULIO ADISANTOSO - ILKOM IPB 1

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

Sistem Temu Kembali Informasi/ Information Retrieval

BAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi

TEMU KEMBALI INFORMASI

Information Retrieval

PENDAHULUAN. Latar belakang

Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB I PENDAHULUAN Latar Belakang

BAB II TINJAUAN PUSTAKA

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA

UKDW BAB I PENDAHULUAN Latar Belakang Masalah

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning

Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES. Budi Susanto

Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL. Budi Susanto

VECTOR SPACE MODEL. Tujuan 4/2/13. Budi Susanto

METODE PENELITIAN. Gambar 2 Metodologi penelitian.

JULIO ADISANTOSO - ILKOM IPB 1

RETRIEVAL STRATEGIES. Tujuan 4/9/13. Budi Susanto

Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information

Pemanfaatan Permodelan Ruang Vektor untuk Pengecekan Kemiripan

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

BAB I PENGANTAR Pendahuluan Penyajian 1.1 Latar Belakang 1.2 Algoritma dan Struktur Data

Mencari dokumen yang dituliskan dalam berbagai bahasa

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah

Pembuatan Kakas Komunikasi Antar Pengembang Perangkat Lunak

JURNAL ITSMART Vol 4. No 2. Desember 2015 ISSN :

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

BAB 2 TINJAUAN PUSTAKA

Pengujian Kerelevanan Sistem Temu Kembali Informasi

PENDAHULUAN. Latar belakang

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

BAB 1 PENDAHULUAN UKDW

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

V HASIL DAN PEMBAHASAN

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

PENGUKUR SEMANTIC SIMILARITY PADA ARTIKEL WEB DALAM UPAYA PENCEGAHAN PLAGIARISME

EVALUASI SISTEM TEMU KEMBALI INFORMASI MODEL RUANG VEKTOR DENGAN PENDEKATAN USER JUDGEMENT

SISTEM TEMU KEMBALI INFORMASI

KULIAH 12. Multimedia IR. Image Retrieval. BAB 11: Baeza-Yates & Ribeiro-Neto. Fakultas Ilmu Komputer Universitas Indonesia

Sistem Temu-Kembali Informasi Perhitungan Kemiripan

PENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM

II TINJAUAN PUSTAKA. * adalah operasi konvolusi x dan y, adalah fungsi yang merepresentasikan citra output,

SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS

BAB 2 LANDASAN TEORI Sistem Rekomendasi

TEMU KEMBALI INFORMASI

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

Temu-Kembali Informasi 2017

PENCARIAN DOKUMEN BERDASARKAN KOMBINASI ANTARA MODEL RUANG VEKTOR DAN MODEL DOMAIN ONTOLOGI

Implementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

SISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ

BAB 1 PENDAHULUAN. Universitas Indonesia. Perbandingan metode..., Heninggar Septiantri, FASILKOM UI, 2009

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

ROCCHIO CLASSIFICATION

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

JURNAL INFORMATIKA IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL

BAB 1 PENDAHULUAN UKDW

BAB II TINJAUAN PUSTAKA

BAB 3 PROSEDUR DAN METODOLOGI. perhitungan LSI dan juga interface yang akan dibuat oleh penulis.

Principal Component Analysis

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA

BAB IV PREPROCESSING DATA MINING

BAB IV ANALISA DAN PERANCANGAN

Dr. R. Rizal Isnanto, S.T., M.M., M.T.

BAB I PERSYARATAN PRODUK

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011

Aplikasi Pencarian Karya Tulis Ilmiah Berbasis Web Menggunakan Sistem Rekomendasi

Pemodelan Pengukuran Tingkat Kematangan Kerangka Kerja COBIT Menggunakan Ontology

Aljabar Linier Elementer. Kuliah ke-9

Mardi Siswo Utomo Fakultas Teknologi Informasi Universitas Stikubank Semarang

BAB III METODOLOGI. 3.1 Vector Median Filtering (VMF)

BAB I PENDAHULUAN. Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan

BAB I PENDAHULUAN 1.1 Latar Belakang

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

SKRIPSI TEMU KEMBALI INFORMASI DENGAN EKSPANSI PERMINTAAN MENGGUNAKAN MATRIKS ASOSIASI

Pertemuan 7 Deteksi Koheren dan Deteksi non-koheren Sinyal Bandpass

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB I PENDAHULUAN 1.1 Latar Belakang

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

BAB V EKSPERIMEN TEXT CLASSIFICATION

Transkripsi:

JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 3 IR MODEL

Mengapa Model? 1 Banyak pengembangan teknologi IR seperti web search, translator system, spam filter, dsb membutuhkan teori dan percobaan. 2 Percobaan menggunakan data empiris dengan berbagai situasi dibutuhkan agar teknologi IR yang dikembangkan dapat sesuai dengan yang diharapkan oleh user 3 Model dapat membantu menjelaskan teori dan hasil percobaan dengan lebih terstruktur dan mudah.

Proses IR Tiga proses dasar IR: 1 representasi isi dokumen, 2 representasi informasi yang dibutuhkan user (disebut query) 3 membandingkan kedua representasi tersebut

Pemodelan IR IR terdiri atas 4 komponen yang dinotasikan masing-masing sebagai [D, Q, F, R(d j, q)] Keterangan: D adalah kumpulan dokumen (korpus) Q adalah query F adalah representasi isi dokumen dan query R(d j, q) adalah fungsi yang membandingkan representasi isi dokumen d j dengan query q Bentuk model IR tergantung pada: Bagaimana representasi isi dokumen dan query Bagaimana fungsi R(d j, q)

Exact match atau best match model Boolean Model Region Model Statistical model Vector space model Probabilistic model Latent semantic model Linguistic and knowledge-based models

Boolean Model Keuntungan: Mudah diimplementasikan dan membutuhkan komputasi yang tidak rumit User mudah menyusun query dengan menggunakan operator logika, misalnya OR untuk menyatakan hubungan sinonim, AND untuk frasa Query dapat ditulis lebih mudah dipahami (tidak ambigu) Kekurangan: Sulit untuk menyusun query yang kompleks Tidak ada pemeringkatan kesesuaian antara dokumen dengan query Tidak mengenal pembobotan

Contoh Query Boolean

Region Model Merupakan pengembangan dari Boolean Model Dokumen terkelompok dalam beberapa bagian, biasanya ditandai oleh tag dalam format XML Menggunakan sedikitnya 2 operator dalam query: CONTAINING atau CONTAINED BY Contoh mencari semua baris dimana Hamlet berkata farewell : (<LINE> CONTAINING farewell) CONTAINED BY (<SPEECH> CONTAINING (<SPEAKER> CONTAINING Hamlet))

Contoh Dokumen

Vector Space Model Dokumen dan query direpresentasikan sebagai vektor dalam ruang berdimensi tinggi Memungkinkan partial matching dan pemeringkatan dokumen. Cenderung sebagai best matching Dokumen dan query dibandingkan dengan cara membandingkan vektor masing-masing, misalnya menggunakan ukuran jarak antar vektor, atau menggunakan ukuran kemiripan antar vektor. Dokumen yang memiliki jarak dekat (atau ukuran kesamaan tinggi) dengan query, dianggap sebagai dokumen yang relevan dengan query

Ukuran Jarak vs Kemiripan

Ukuran Jarak Ukuran jarak yang sering digunakan adalah Euclidean. Jarak antara vektor dokumen d dengan vektor query q adalah: δ(d, q) = (d q) (d q)

Ukuran Kemiripan Cosine Ukuran kemiripan sebagai nilai Cosinus dari sudut θ. Ukuran kemiripan Cosine antara vektor dokumen d dengan vektor query q adalah: d q sim(d, q) = d d q q

Urutkan Dokumen Berdasarkan Query!

Model Lainnya... Akan dibahas pada pertemuan selanjutnya... TUGAS/PR (sebagai materi diskusi kelas minggu depan): Pelajari Extended Boolean Kerjakan soal pada Manning et al (2008) nomor 2.9, 6.8, 6.9, 6.10, 6.11, 6.19