Mengenal Information Retrieval

dokumen-dokumen yang mirip
UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

FM-UDINUS-BM-08-04/R0 SILABUS MATAKULIAH. Silabus: Information Retrieval Hal: 1 dari 5. Revisi : - Tanggal Berlaku : Januari 2015

Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI

Sistem Temu-Kembali Informasi Pengantar Perkuliahan

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document

TEMU KEMBALI INFORMASI

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

KOM341 Temu Kembali Informasi

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

JULIO ADISANTOSO - ILKOM IPB 1

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Information Retrieval

TEMU KEMBALI INFORMASI

Search Engines. Information Retrieval in Practice

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System

Temu-Kembali Informasi

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

INFORMATION RETRIEVAL TUGAS AKHIR DAN PERHITUNGAN KEMIRIPAN DOKUMEN MENGACU PADA ABSTRAK MENGGUNAKAN VECTOR SPACE MODEL

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

1. Pendahuluan. 1.1 Latar belakang

Sistem Terdistribusi (SisTer)

ANALISIS SKEMA-SKEMA KEMIRIPAN VEKTOR PADA SISTEM PENILAIAN UJIAN ESSAY ONLINE

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN Latar Belakang

Rekayasa Web. (Web-E: Web Engineering) Husni Pertemuan 01: Pengantar Perkuliahan, 01 Mar. 2016

PEMEROLEHAN INFORMASI MENGGUNAKAN INVERTED INDEX DENGAN STRUKTUR DATA KLASIK VS ORDBMS

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

PERTEMUAN 6 PROMOSI DAN PEMELIHARAAN WEB

PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK PENCARIAN WEB SERVICE MENGGUNAKAN LUCENE

Keywords: information retrieval system, cosine similarity, mean average precision. Jurnal Ilmu Komputer - Volume 5 - No 2 September 2012

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

JURNAL INFORMATIKA IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL

Text dan Web Mining. Budi Susanto Teknik Informatika UKDW Yogyakarta

ROCCHIO CLASSIFICATION

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

BAB I PENDAHULUAN! 1.1 Latar Belakang

IMPLEMENTASI VECTOR SPACE MODEL UNTUK PENCARIAN DOKUMEN

PENDEKATAN KUANTITATIF UNTUK PENELlJSURAN INFORMASI

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

PERANCANGAN DAN PEMBUATAN WEB CRAWLER APLIKASI PANDUAN PEMBELIAN SPESIFIKASI KOMPUTER RAKITAN ONLINE DENGAN MEMANFAATKAN GOOGLE GEARS

Clusterisasi Dokumen Web (Berita) Bahasa Indonesia Menggunakan Algoritma K-Means

DAFTAR PUSTAKA. [2] Berlianty, I. dan Arifin, M Teknik-Teknik Optimasi Heuristik. Yogyakarta : Graha Ilmu.

SISTEM PEMEROLEHAN INFORMASI KARYA ILMIAH BERBASIS CLUSTER DENGAN G-MEANS CLUSTERING

Heru Suryono ( ) 1, Arief Senja Fitroni S.Kom. 2 ABSTRAK

PENDAHULUAN BASIS DATA. Institut Teknologi Sumatera

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

BAB 1 PENDAHULUAN Latar Belakang

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)

(Semester Gasal 2011/2012) Noor Ifada weblog:

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

SISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ

SATUAN ACARA PERKULIAHAN MATA KULIAH APLIKASI MULTIMEDIA TEKNIK INFORMATIKA ITP KODE / SKS : TIS6663 /3 SKS

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

KULIAH 12. Multimedia IR. Image Retrieval. BAB 11: Baeza-Yates & Ribeiro-Neto. Fakultas Ilmu Komputer Universitas Indonesia

Fauzan Azmi Apa itu Search Engine. Cara Kerja Search Engine. Lisensi Dokumen:

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2005/2006

Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

ANALISIS DAN PERANCANGAN SEARCH ENGINE DOKUMEN PAPER BERBASIS WEB NASKAH PUBLIKASI. diajukan oleh Aldrik Saddermi

BAB 1 PENDAHULUAN UKDW

BAB I PENDAHULUAN I-1

SISTEM INFORMATION RETRIEVAL PENCARIAN KESAMAAN AYAT TERJEMAHAN AL QURAN BERBAHASA INDONESIA DENGAN QUERY EXPANSION DARI TAFSIRNYA

BAB 3 ANALISA DAN PERANCANGAN

PENERAPAN SEMANTIC SEARCHING BERBASIS ONTOLOGI PADA PERPUSTAKAAN DIGITAL

Garis-garis Besar Program Pembelajaran (GBPP)

BAB I PERSYARATAN PRODUK

KONTRAK PERKULIAHAN. Kontrak Perkuliahan Sistem Basis Data oleh Saiful Bahri STMIK SINUS -1-

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENGENALAN KOMPUTER DAN SOFTWARE II. Semester: 2 Pengenalan Komputer dan Software II. Introduction to Computer and Software II

KNOWLEDGE IN TEXT (IR-2)

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE

KONTRAK PEMBELAJARAN (KP) MATA KULIAH. Algoritma dan Pemrograman

BAB I PENDAHULUAN. Dalam suatu basis data, pendekatan model data relasional masih banyak dimanfaatkan untuk penyimpanan data dan informasi terhadap

Kontrak Kuliah Basis Data II (Semester Genap 2009/2010)

Transkripsi:

STBI-2011 Sistem Temu Balik Informasi 2011 Mengenal Information Retrieval Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress.com

2

3

Amazon.com 4

Amazon.com 5

6

7

8

9

Wordpress.com 10

11

12

13

14

15

16

17

18

Dosen Pengampu Husni, S.Kom. MT. Lab. Sistem Terdistribusi (SisTer) Departemen Teknik Informatika Universitas Trunojoyo Rumah di Internet Komputasi.wordpress.com Husni.trunojoyo.ac.id husni@if.trunojoyo.ac.id Facebook: Husni Ilyas Muda Intan 19

Perkualiahan (1) Halaman web Kuliah http://komputasi.wordpress.com Waktu: 07.30-09.30, Selasa (C) dan Kamis (D) Ruangan: RKB-A 201 (C), RKB-A 103 (D) Buku Teks Wajib: Christopher D. Manning, Prabhakar Raghavan and Hinrich Schuetze, Introduction to Information Retrieval, Cambridge University Press, 2008. (Tersedia online, free) Prasyarat : Pengetahuan dasar mengenai struktur data, algoritma, aljabar linier dan teori peluang. Pengalaman pemrograman diperlukan untuk menyelesaikan proyek 20

Perkualiahan (2) Referensi Pendukung (penting): Ricardo Baeza-Yates and Berthier Ribeiro-Neto, Modern Information Retrieval: The Concepts and Technology behind Search, Addison-Wesley, 2011. Stefan Buettcher, Charles L.A. Clarke, and Gordon V. Cormack, Information Retrieval: Implementing and Evaluating Search Engines, MIT Press, 2010. Bruce Croft, Donald Metzler, and Trevor Strohman, Search Engines: Information Retrieval in Practice, Addison-Wesley, 2010. Gerald Kowalski, Information Retrieval Architecture and Algorithms, Springer, 2011. 21

Buku lain tentang IR Gerald Salton, Automatic information organization and retrieval, McGraw-Hill, 1968. Gerald Salton and M.J. McGill, Introduction to modern information retrieval, McGraw-Hill, 1983. C. J. van Rijsbergen, Information Retrieval, Butterworths, 1979. K. Sparck Jones, P. Willett, Readings in Information Retrieval, Morgan Kaufmann, 1997. I.H. Witten, A. Moffat, T.C. Bell. Morgan Kaufmann, Managing Gigabytes, 1999. 22

Penilaian UTS 25% UAS 30% Proyek 30% (termasuk proposal) Tugas 25% Semua komponen penilaian bersifat wajib. Ketiadaan nilai pada salah satu komponen, nilai akhir otomatis E. 23

Tugas Pemrograman dan Proyek Setidaknya ada dua tugas pemrograman Team-based (maksimal 4 mahasiswa per tim) Boleh menulis kode sendiri, boleh menggunkaan ulang open source Topik: (diumumkan kemudian ) Proyek akhir Boleh pengembangan sistem berbasis tim (sama dengan tugas pemrograman) Boleh juga presentasi makalah akademis berbahasa Inggris Makalah 2 tahun terakhir Bersifat individu, bukan team-based Batas pengumpulan proposal (hardcopy, 1 halaman A4): UTS Latar belakang, metode, rancangan eksperiman 24

Kuliah ini Tidak Mengajari... Tip & trik ketika menggunakan search engine, meskipun ide-ide lebih baik diperlukan dalam menggunakan search engine Silakan membaca buku tentang itu Bagaimana mendapatkan buku di perpustakaan, meskipun ilmu IR berawal dari sana Bagaimana memperoleh uang di Web, meskipun sekarang banyak ditawarkan oleh search engine 25

Information Retrieval? 26

Wikipedia 27

Google Maps 28

Google News 29

Blogs 30

Information Retrieval? Information retrieval is a field concerned with the structure, analysis, organization, storage, searching, and retrieval of information. (Salton, 1968) 31

Goal (Tujuan) Information retrieval (IR): suatu bidang penelitian yang menargetkan pencarian informasi secara efektif dan efisien dalam dokumen text dan multimedia Kuliah ini akan memperkenalkan model dasar teks dan query dalam IR, evaluasi retrieval, indexing dan searching, dan aplikasi bagi IR 32

Menurut Wikipedia Information retrieval (IR) adalah sains tentang pencarian dokumen, informasi dalam dokumen dan metadata mengenai dokumen, baik pencarian itu terhadap database relasional atau melibatkan Web. IR merupakan pengetahuan antar-bidang keilmuan, termasuk ilmu komputer (informatika), matematika, ilmu perpustakaan, psikologi, linguistika dan statistika. Sistem IR otomatis digunakan untuk mengurangi efek dari information overload. Search engine adalah aplikasi IR yang paling banyak digunakan. 33

Gambaran Besar 34

user need User Interface Text Operations Text user feedback Query Expansion quer y Retrieval retrieved docs Ranking ranked docs logical view inverted file Indexing Inverted Index Doc representation Document Collection 35

Topik dalam IR Text IR Indexing and Searching Query Languages and Operations Retrieval Evaluation Modeling Boolean model Vector space model Probabilistic model Applications for IR Multimedia IR Web Search Digital Libraries 36

Organisasi Buku Teks Dasar IR (fokus) Inverted indexes for boolean queries (Ch.1-5) Term weighting and vector space model (Ch. 6-7) Evaluation in IR (Ch. 8) Topik Lanjut Relevance feedback (Ch. 9) XML retrieval (Ch. 10) Probabilistic IR (Ch. 11) Language models (Ch. 12) Pembelajaran Mesin dalam IR Text classification (Ch. 13-15) Document clustering (Ch. 16-18) Pencarian Web Web crawling and indexes (Ch. 19-20) Link analysis (Ch. 21) 37

Topik lain (diluar kuliah ini) Cross-language IR Image, video, and multimedia IR Speech retrieval Music retrieval User interfaces Parallel, distributed, and P2P IR Digital libraries Information science perspective Logic-based approaches to IR Natural language processing techniques 38

Jadwal (Tentatif) Sebelum UTS Boolean retrieval (1 pertemuan) Indexing (3 pertemuan) Vector space model (2 pertemuan) Setelah UTS Evaluasi (1 pertemuan) Relevance feedback (1 pertemuan) Web search (2 pertemuan) Text classification (1 pertemuan) Document clustering (1 pertemuan) Presentasi Proyek (5 minggu terakhir, 1 jam) 39

Acuan Awal Wikipedia: http://en.wikipedia.org/wiki/information_retrieval Sumber lebih lengkap: http://nlp.stanford.edu/ir-book/informationretrieval.html 40

Pertanyaan? 41