Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI

dokumen-dokumen yang mirip
KOM341 Temu Kembali Informasi

Information Retrieval

Mengenal Information Retrieval

JULIO ADISANTOSO - ILKOM IPB 1

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III METODOLOGI PENELITIAN

BAB 3 PERANCANGAN DAN PEMBUATAN SISTEM

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

... BAB 2 LANDASAN TEORI. 2.1 Citra

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2005/2006

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

comparing the search results using the method GCHs with the search results using the method LCHs or use both types of these histograms. So get a color

BAB I PENDAHULUAN. Perkembangan teknologi komputer dan internet semakin maju

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENCARIAN CITRA VISUAL BERBASIS ISI CITRA MENGGUNAKAN FITUR WARNA CITRA. Abstract

BAB I PENDAHULUAN Latar Belakang

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

PENERAPAN SEMANTIC SEARCHING BERBASIS ONTOLOGI PADA PERPUSTAKAAN DIGITAL

PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK PENCARIAN WEB SERVICE MENGGUNAKAN LUCENE

Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information

BAB 2 TINJAUAN PUSTAKA

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB I PERSYARATAN PRODUK

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

BAB I PENDAHULUAN. Begitu juga halnya pada perkembangan Internet, hampir semua bidang teknologi

SISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

Pengolahan Citra Digital FAJAR ASTUTI H, S.KOM., M.KOM

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

Implementasi Generalized Vector Space Model Menggunakan WordNet

PENCARIAN ISI CITRA MENGGUNAKAN METODE MINKOWSKI DISTANCE

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra

2.Landasan Teori. 2.1 Konsep Pemetaan Gambar dan Pengambilan Data.

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

TEMU KEMBALI INFORMASI

Pencocokan Citra Berbasis Graph untuk Pengenalan dan Pemilihan Kembali (Retrieval) Oleh: Yureska Angelia ( )

LEMBAR PENGESAHAN TUGAS AKHIR...

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI

APLIKASI CONTENT BASED IMAGE RETRIEVAL DENGAN FITUR WARNA DAN BENTUK

PEMBANGUNAN SISTEM CONTENT-BASED IMAGE RETRIEVAL MENGGUNAKAN KODE FRAKTAL DARI DOKUMEN CITRA TESIS ARIF RAHMAN NIM :

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011

TEMU KEMBALI INFORMASI

KULIAH 12. Multimedia IR. Image Retrieval. BAB 11: Baeza-Yates & Ribeiro-Neto. Fakultas Ilmu Komputer Universitas Indonesia

Fatkhul Amin Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang

BAB 3 ANALISIS DAN PERANCANGAN

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

BAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

Implementasi Content Based Image Retrieval Untuk Menganalisa Kemiripan Bakteri Yoghurt Menggunakan Metode Latent Semantic Indexing

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Penerapan Berbagai Teknik Sistem Temu-Kembali Informasi Berbasis Hiperteks

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

Sistem Temu Kembali Informasi/ Information Retrieval

BAB II TINJAUAN PUSTAKA

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Gambar 1.1 Tahapan Penelitian

Implementasi Rancangan Aplikasi Ekstraksi Ciri Citra Digital berbasis Client-Server

SISTEM TEMU KEMBALI CITRA GEDUNG BERDASARKAN INFORMASI GARIS PADA BENTUK GEDUNG

Sistem Temu-Kembali Informasi Pengantar Perkuliahan

PEMEROLEHAN INFORMASI MENGGUNAKAN INVERTED INDEX DENGAN STRUKTUR DATA KLASIK VS ORDBMS

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

BROWSING DAN SEARCHING SEBAGAI SARANA TEMU KEMBALI SUMBER- SUMBER INFORMASI DALAM PERPUSTAKAAN DIGITAL

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

KOM341 Temu Kembali Informasi

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

BAB 2 TINJAUAN PUSTAKA

Search Engines. Information Retrieval in Practice

IMAGE COLOR FEATURE. Achmad Basuki Politeknik Elektronika Negeri Surabaya

JULIO ADISANTOSO - ILKOM IPB 1

BAB II TINJAUAN PUSTAKA

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

JURNAL INFORMATIKA IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL

ANALISIS PERBANDINGAN KINERJA SEARCH ENGINE MENGGUNAKAN PENELUSURAN PRECISION DAN RECALL UNTUK INFORMASI ILMIAH BIDANG ILMU KEDOKTERAN

Sistem perolehan citra berbasis isi Berdasarkan tekstur menggunakan metode Gray level co-occurrence matrix dan Euclidean distance

BAB III ANALISIS MASALAH DAN RANCANGAN PROGRAM

BAB II LANDASAN TEORI

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

KATA PENGANTAR Sistem Pencarian Informasi Data-Teks Menggunakan Model Ruang Vektor

BAB 1 PENDAHULUAN UKDW

PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI

LEMBAR PENGESAHAN TUGAS AKHIR...

Transkripsi:

Search Engine Text Retrieval dan Image Retrieval YENI HERDIYENI 14 JUNI 2008 Search engine atau mesin pencari merupakan bagian dari teknologi inte rnet yang sangat penting untuk pencarian informasi. Dewasa ini perkembangan teknologi search engine sangat pesat. Bagaimana sebenernya teknologi search engine itu dikembangkan?? DEPARTEMEN ILMU KOMP UTER FMIPA IPB HTTP://Y ENIH ERDIYEN I.WOR DPRESS.COM

SEARCH ENGINE Google, Yahoo!, MSN, AOL, dan Altavista merupakan mesin pencari (search engine) berbasis web yang paling popular saat ini. Dengan memasukkan kueri berupa kata kunci kedalam mesin pencari, informasi yang inginkan dapat ditampilkan. Bagaimana mesin pencari melakukan pencarian informasi tersebut sementara jumlah informasi yang tersedia sangat banyak dan tidak terstruktur.?? Adalah temu-kembali informasi (information retrieval) bidang ilmu yang dapat menjelaskan bagaimana pencarian informasi tersebut dilakukan.

Secara umum, proses temu-kembali (retrieval) adalah sebagai berikut: Gambar 1 Proses temu-kembali Sistem temu-kembali dengan bidang-bidang lain (Gambar 2) informasi memiliki keterkaitan keilmuan Gambar 2 Keterkaitan sistem temu kembali informasi dengan bidang lain.

MODEL TEMU-KEMBALI INFORMASI Pada IR terdapat dua aktivitas utama pengguna yaitu retrieval dan browsing. Gambar 3 menjelaskan model IR. U s e r T a s k Retrieval: Adhoc Filtering Browsing Classic Models boolean vector probabilistic Structured Models Non-Overlapping Lists Proximal Nodes Browsing Flat Structure Guided Hypertext Set Theoretic Fuzzy Extended Boolean Algebraic Generalized Vector Lat. Semantic Index Neural Networks Probabilistic Inference Network Belief Network Gambar 3 Model temu-kembali informasi TEMU-KEMBALI TEKS (TEKS RETRIEVAL) Sistem temu-kembali teks (teks retrieval) adalah sistem penemuan kembali informasi dalam bentuk dokumen dengan mengukur kemiripan (similarity) antara informasi yang tersimpan dalam basis data dengan kueri yang dimasukkan oleh pengguna (Salton, 1998). Teknik pencarian informasi pada sistem IR berb eda dengan sistem pencarian pada sistem manajemen basisdata (DBMS). Berikut perbedaan antara basisdata dengan Information Retrieval.

Tabel 1. Perbedaan DBMS dengan sistem temu kembali informasi DBMS Information Retrieval Data Terstruktur Tidak terstruktur Field Memiliki field Tidak memiliki field Kueri Menggunakan sintak bahasa SQL (Structured Query Language) Pengukuran Pengukuran kemiripan Kemiripan pasti (exact matching) Menggunakan bahasa alami (free text), Boolean Pengukuran kemiripan tidak pasti (imprecise measurement) Dalam sistem temu kembali terdapat dua bagian utama yaitu bagian pengindeksan (indexing) dan pencarian (searching). Kedua bagian tersebut memiliki peran penting dalam proses temu kembali informasi. Gambar 4 menjelaskan proses temu kembali informasi. User Interface Text user need Text Text Operations logical view logical view user feedback Query Operations Indexing DB Manager Module query inverted file Searching Index ranked docs retrieved docs Ranking Text Database Gambar 4. Proses temu kembali informasi

Pada sistem temu-kembali infomasi, kumpulan dokumen direpresentasikan dengan dalam bentuk matriks dokumen (D) dan kata (T). Notasi W merupakan frekuensi kata dalam dokumen. T1 T2. Tt D1 w11 w21 wt1 D2 w12 w22 wt2 : : : : : : : : Dn w1n w2n wtn TEMU-KEMBALI CITRA Sama seperti halnya sistem temu-kembali informasi berbentuk dokumen, sistem temu kembali citra adalah sistem penemuan kembali informasi dalam bentuk citra (gambar) dengan mengukur kemiripan (similarity) antara citra yang tersimpan dalam basis data dengan kueri yang dimasukkan oleh pengguna. Content based image retrieval (CBIR) merupakan suatu pendekatan dalam temu kembali citra yang didasarkan pada informasi yang terkandung di dalam citra itu sendiri seperti warna, bentuk dan tekstur dari citra. Gambar 5 menunjukkan skema CBIR. Koleksi CBIR User Hasil : Gambar 5 Skema CBIR

Pada CBIR sebuah citra direpresentasikan sebagai fungsi dua dimensi f(x,y) di mana x dan y adalah pasangan koordinat spasial, sementara nilai f disebut sebagai derajat tingkat keabuan (gray level) atau intensitas dari citra digital pada koordinat tersebut (Gonzalez et al. 2004). Citra digital direpresentasikan dalam bentuk matriks persegi yang mewakili ukuran dari citra tersebut. Misalkan terdapat sebuah citra digital dengan ukuran NxM, maka citra dapat direpresentasikan dalam sebuah matriks i berukuran NxM sebagai berikut: i i(1,1) i(2,1) i( N,1) i(1,2) i(2,2) i( N,2) i(1, M ) i(2, M ) i( N, M ) Gambar 1 Representasi citra digital. Sumber Pustaka: 1. Salton. 1998. Introduction to Modern Information Retrieval. 2. Deb, S. dan Zhang, Y. 2004. An Overview of Content-Based Image Retrieval Techniques. IEEE. 3. Gonzales dan Woods. 2004. Digital Image Processing Using Matlab. Addison Wesley.