JULIO ADISANTOSO - ILKOM IPB 1

dokumen-dokumen yang mirip
KOM341 Temu Kembali Informasi

TEMU KEMBALI INFORMASI

TEMU KEMBALI INFORMASI

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

Mengenal Information Retrieval

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

FM-UDINUS-BM-08-04/R0 SILABUS MATAKULIAH. Silabus: Information Retrieval Hal: 1 dari 5. Revisi : - Tanggal Berlaku : Januari 2015

Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

KONTRAK PERKULIAHAN, SILABUS (GBPP), DAN SATUAN ACARA PENGAJARAN (SAP)

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract

KULIAH 12. Multimedia IR. Image Retrieval. BAB 11: Baeza-Yates & Ribeiro-Neto. Fakultas Ilmu Komputer Universitas Indonesia

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

Sistem Temu-Kembali Informasi Pengantar Perkuliahan

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE

ABSTRAK. Kata kunci: Sistem Tanya Jawab, Semantic Web, Ontology, domain terbatas. v Universitas Kristen Maranatha

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

KONTRAK PERKULIAHAN. [1] Manfaat Mata Kuliah. Mahasiswa mampu membuat program komputer dengan menggunakan bahasa pemrograman C.

JULIO ADISANTOSO - ILKOM IPB 1

PENERAPAN SEMANTIC SEARCHING BERBASIS ONTOLOGI PADA PERPUSTAKAAN DIGITAL

KONTRAK PERKULIAHAN BAHASA PEMROGRAMAN KOM204

SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS

Information Retrieval

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document

KONTRAK PERKULIAHAN Program Alih Jenis ALGORITME DAN PEMROGRAMAN KOM202

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

IMPLEMENTASI VECTOR SPACE MODEL UNTUK PENCARIAN DOKUMEN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Alat Bahasa isyarat alat peraga gambar Bahasa verbal Teks (symbol atau huruf) Interaksi: Langsung Tidak langsung. sumber media tujuan

Konsep dan Arsitektur Basis Data. IKI20410 Basis Data Aniati Murni Fakultas Ilmu Komputer Universitas Indonesia

Temu-Kembali Informasi

RENCANA PEMBELAJARAN SEMESTER (RPS)

Bahasa Pemrograman :: Pendahuluan

BAB I PENDAHULUAN. Begitu juga halnya pada perkembangan Internet, hampir semua bidang teknologi

KNOWLEDGE IN TEXT (IR-2)

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

ROCCHIO CLASSIFICATION

Penelusuran Informasi (Information Retrieval)

BAB IV HASIL PERBANDINGAN DAN PEMBAHASAN

PERTEMUAN 6 PROMOSI DAN PEMELIHARAAN WEB

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI

Bab 1 Pendahuluan. 1.1 Latar Belakang

ANALISIS SKEMA-SKEMA KEMIRIPAN VEKTOR PADA SISTEM PENILAIAN UJIAN ESSAY ONLINE

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

JURNAL INFORMATIKA IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL

KBKF53110 WEB PROGRAMMING

beberapa tag-tag lain yang lebih spesifik di dalamnya.

RENCANA PEMBELAJARAN SEMESTER (RPS)

BAB I PENDAHULUAN Latar Belakang

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA

SISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ

ANALISIS DAN PERANCANGAN SEARCH ENGINE DOKUMEN PAPER BERBASIS WEB NASKAH PUBLIKASI. diajukan oleh Aldrik Saddermi

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal

Rata-rata token unik tiap dokumen

ABSTRAK. Kata Kunci : Latent Semantic Indexing, pencarian, dokumen, Singular Value Decomposition.

Administrasi Perkuliahan Pendahuluan BAHASA PEMROGRAMAN. TIM PENGAJAR PEMROGRAMAN Departemen Ilmu Komputer IPB. Pertemuan 1

APLIKASI PERSONAL STUDY ASSISTANCE BERBASIS CHATBOT MENGGUNAKAN ALGORITMA NAIVE BAYES CLASSIFIER VIVE VIO PERMANA

Penerapan Algoritma K-Means untuk Clustering

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

STUDI PERBANDINGAN FASILITAS DAN KINERJA SEARCH ENGINES DALAM PENCARIAN DOKUMEN BERBASIS WEB HERY WIDHIARTO

Pengujian Kerelevanan Sistem Temu Kembali Informasi

RENCANA PEMBELAJARAN SEMESTER (RPS)

KONTRAK PERKULIAHAN ALGORITME DAN PEMROGRAMAN KOM202

Pengenalan Database Management System MySQL. Pokok Bahasan: Pengenalan DataBase Pembangunan database berbasis Client-Server Dasar-Dasar MySQL

Implementasi Generalized Vector Space Model Menggunakan WordNet

E-R Diagram. Bagian IIb Relationship Terminologi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

ANALISIS DAN IMPLEMENTASI METODE LATENT SEMANTIC INDEXING PADA SISTEM PENCARIAN DOKUMEN SKRIPSI ARIANI

ALGORITME :: Pengantar Pemrograman

KOREKSI EJAAN QUERY BAHASA INDONESIA MENGGUNAKAN ALGORITME DAMERAU LEVENSHTEIN

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

Penelusuran online dan Pelaporan

Mencari dokumen yang dituliskan dalam berbagai bahasa

TEMU KEMBALI INFORMASI

JULIO ADISANTOSO - ILKOM IPB 1

BAB I PENDAHULUAN. Information retrieval (IR) adalah ilmu yang mempelajari pencarian

RENCANA PEMBELAJARAN SEMESTER (RPS)

ABSTRAK. Kata kunci : Informasi, Information Retreival, Ant Colony Optimization, Graph, Fitur dokumen. vii

Transkripsi:

KOM341 Temu Kembali Informasi KULIAH #1 Kontrak Perkuliahan Pendahuluan Matakuliah Nama Matakuliah : Temu Kembali Informasi Kode Matakuliah : KOM431 Beban Kredit : 3(3-0) Semester : Gasal, 2009/2010 Koordinator : Julio Adisantoso Pengajar : 1Julio Adisantoso (JAS) 2Sony Hartono Wijaya (SHW) 3Yeni Herdiyeni (YHY) Manfaat dan Tujuan Matakuliah ini akan memberi manfaat bagi mahasiswa dalam menerapkan konsep temu kembali informasi untuk membuat sistem aplikasi temu kembali informasi teks Setelah mengikuti matakuliah ini, i mahasiswa diharapkan mampu menjelaskan konsep dalam temu kembali informasi, serta menerapkannya untuk membuat sistem aplikasi temu kembali informasi teks Deskripsi Matakuliah ini menjelaskan pengantar temu kembali informasi, dasar-dasar temu kembali informasi: pemodelan, evaluasi, query, operasi teks dan multimedia, indexing and searching Topik dalam temu kembali informasi: relevance feedback, query expansion, text classification, text clustering, summarization, cross-language, question answering, web search Strategi Mahasiswa S1 Mayor Ilmu Komputer IPB, sebagai matakuliah pilihan Perkuliahan dilakukan sebanyak 14 kali pertemuan kuliah tatap muka Metode perkuliahan adalah kombinasi antara ceramah, diskusi, dan diakhiri dengan presentasi proyek akhir Mahasiswa WAJIB mengikuti perkuliahan minimal 80 persen, dan presentasi proyek akhir 100 persen Strategi Mahasiswa pengulang matakuliah Temu Kembali Informasi WAJIB mengikuti keseluruhan kegiatan kuliah dan presentasi proyek akhir selama satu semester Untuk membantu mahasiswa memahami materi kuliah, disediakan website matakuliah online pada alamat http://webipbacid/~julio/tki0910 1

Tugas Matakuliah Tugas terdiri atas dua jenis: Perorangan Kelompok (dalam bentuk proyek akhir) berupa tugas pemrograman, dan setiap kelompok terdiri atas 2-3 orang Topik dipilih bebas, tidak ada yang sama di antara kelompok Produk berupa program komputer, laporan hasil kajian, dan slide presentasi Presentasi proyek akhir dilakukan di luar jadwal kuliah yang telah ditetapkan Referensi Christopher D Manning, Prabhakar Raghavan, and Hinrich Schutze 2008 Introduction to Information Retrieval Cambridge University Press C J van Rijsbergen Information Retrieval Information Retrieval Group, University of Glasgow Richardo Baeza-Yates and Berthier Rieiro-Neto Neto Modern Information Retrieval PERL Programming Henk Blanken, etal 2007 Multimedia Retrieval Text Summarization Tutorial ACM SIG, Sheffield, UK July 25, 2004 TREC Question Anwsering System and Cross Language Informastion Retrieval Kriteria Penilaian Nilai akhir (NA) = kumulatif dari UTS (1-6) dan UAS (7-14), ujian tertulis dengan bobot masing-masing 35% Nilai Tugas Perorangan adalah rata-rata dari semua tugas yang diberikan, dan diberi bobot 10% Nilai Proyek Akhir (program komputer, laporan, dan presentasi), dengan bobot 20% Selang nilai untuk menetapkan huruf mutu A, B, C, D, atau E ditentukan berdasarkan nilai rataan sebaran normal, berlaku sama untuk semua mahasiswa baru maupun pengulang Jadwal Kuliah Kuliah dilaksanakan pada hari Kamis pukul 08:00-10:30 di ruang A000GMKL (Ruang Kuliah GMSK L-H) Mohon dicarikan pengganti waktu karena bentrok dengan jadwal JAS (selain waktu di bawah ini) Senin, 08:00-11:00 dan 13:00-15:00 Selasa, 08:00-11:00 Kamis, 08:00-12:00 What is this course about? Processing Indexing Retrieving textual data PENDAHULUAN Fits in four lines, but much more complex and interesting than that 2

Need for With the advance of WWW - more than 8 Billion documents indexed on Yahoo, Google Various needs for information: Search for documents that fall in a given topic Search for a specific information Search an answer to a question Search for information in a different language Search for images Search for music Search for a (candidate) friend Some definitions of Salton (1989): Information-retrieval systems process files of records and requests for information, and identify and retrieve from the files certain records in response to the information requests The retrieval of particular records depends on the similarity between the records and the queries, which in turn is measured by comparing the values of certain attributes to records and information requests Information retrieval mempelajari algoritme dan model untuk memperoleh informasi dari koleksi dokumen Information retrieval system : sistem untuk merepresentasikan, menyimpan, mengorganisasikan, dan memproses informasi (Beeza-Yates & Ribeiro-Neto) Examples of systems Library Conventional (library catalog) Search by keyword, title, author, etc Eg : You are probably familiar with wwwlibraryuntedu Text-based (Lexis-Nexis, Google, FAST) Search by keywords Limited search using queries in natural language Multimedia (QBIC, WebSeek, SaFe) Search by visual appearance (shapes, colors, ) Question answering systems (AskJeeves, Answerbus) Search in (restricted) natural language Other: cross language information retrieval, music retrieval The most popular search engine systems on the Web Search for Web pages http://wwwgooglecom Search for images http://wwwpicsearchcom Search for image content http://wangistpsuedu/image/ Search for answers to questions http://wwwaskjeevescom Music retrieval http://wwwfxpalcom/people/foote/musicr/ 3

vs Data Retrieval berkaitan dengan natural language text unstructured and semantically ambigous spesifikasi set of words untuk menentukan semantics dari information needed Data Retrieval berkaitan dengan data well defined structure and semantic spesifikasi query expression untuk menentukan constrain yang harus dipenuhi untuk obyek yang akan menjadi himpunan jawaban vs Databases Structured vs unstructured data Structured data tends to refer to information in tables Employee Manager Salary Smith Jones 50000 Chang Smith 60000 Ivy Smith 50000 Typically allows numerical range and exact match (for text) queries, eg, Salary < 60000 AND Manager = Smith vs Databases Principal The indexing and retrieval of textual documents Searching for pages on the World Wide Web is the most recent and perhaps most widely used application Concerned firstly with retrieving relevant documents to a query Concerned secondly with retrieving from large sets of documents efficiently retrieve semua dokumen yang relevan terhadap kueri pengguna & seminimum mungkin retrieve dokumen yang tidak relevan Typical Task System Architecture Given: A corpus of textual natural-language documents A user query in the form of a textual string Find: A ranked set of documents that are relevant to the query Query String Document corpus System Ranked Documents 1 Doc1 2 Doc2 3 Doc3 4

Web Search System Proses Perolehan Informasi Sederhana Web Spider Document corpus Query String System 1 Page1 2 Page2 3 Page3 Ranked Documents 5