Sistem Temu-Kembali Informasi Pengantar Perkuliahan

dokumen-dokumen yang mirip
KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

Mengenal Information Retrieval

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

Sistem Terdistribusi (SisTer)

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

FM-UDINUS-BM-08-04/R0 SILABUS MATAKULIAH. Silabus: Information Retrieval Hal: 1 dari 5. Revisi : - Tanggal Berlaku : Januari 2015

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

Temu-Kembali Informasi

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

BAB II TINJAUAN PUSTAKA

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

BAB I PERSYARATAN PRODUK

Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

Hybrid Recommendation System Memanfaatkan Penggalian Frequent Itemset dan Perbandingan Keyword

WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

Fatkhul Amin Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang

Clusterisasi Dokumen Web (Berita) Bahasa Indonesia Menggunakan Algoritma K-Means

SISTEM QUR AN RETRIEVAL TERJEMAHAN BAHASA INDONESIA BERBASIS WEB DENGAN REORGANISASI KORPUS

ROCCHIO CLASSIFICATION

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

BAB III METODOLOGI PENELITIAN

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERDASARKAN PREFERENSI DAN KEAHLIAN DOSEN MENGGUNAKAN EUCLIDIEN DISTANCE TUGAS AKHIR

Temu-Kembali Informasi 2017

DETEKSI KEMIRIPAN TOPIK PROPOSAL JUDUL TUGAS AKHIR DAN SKRIPSI MENGGUNAKAN LATENT SEMANTIC ANALYSIS DI STMIK BUMIGORA MATARAM

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Pengguna Internet (31 Desember 2000) Afrika 1,037,524,058 4,514, ,609,620 2,527.4%

Sistem Temu Kembali Informasi Menggunakan Model Ruang Vektor dan Inverted Index

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR

BAB I PENDAHULUAN A. Latar Belakang

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL

BAB III Landasan Teori

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

PENGEMBANGAN APLIKASI LOST & FOUND BERBASIS WEBSITE DENGAN FITUR PENCARIAN MENGGUNAKAN COSINE SIMILARITY. Tugas Akhir

RENCANA PEMBELAJARAN SEMESTER

BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Information retrieval (IR) adalah ilmu yang mempelajari pencarian

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

SISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ

Rekomendasi Anime dengan Latent Semantic Indexing Berbasis Sinopsis Genre

BAB V EKSPERIMEN TEXT CLASSIFICATION

APLIKASI DETEKSI KEMIRIPAN TUGAS PAPER

RENCANA PEMBELAJARAN SEMESTER (RPS)

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI

BAB II TINJAUAN PUSTAKA

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

BAB 1 PENDAHULUAN Latar Belakang

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

SISTEM TEMU KEMBALI INFORMASI

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

SISTEM INFORMATION RETRIEVAL PENCARIAN KESAMAAN AYAT TERJEMAHAN AL QURAN BERBAHASA INDONESIA DENGAN QUERY EXPANSION DARI TAFSIRNYA

1. Pendahuluan. 1.1 Latar belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era

BAB 1 PENDAHULUAN UKDW

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN

Pedoman pelatihan ini dimaksudkan untuk dapat digunakan semua pihak dalam merancang dan melaksanakan pelatihan penulisan bahan ajar non cetak.

BAB I PENDAHULUAN 1.1 Latar Belakang

Information Retrieval

JURNAL INFORMATIKA IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang Masalah

BAB III METODOLOGI PENELITIAN

Aplikasi Pencarian Karya Tulis Ilmiah Berbasis Web Menggunakan Sistem Rekomendasi

BAB 3 ANALISA DAN PERANCANGAN

TEMU KEMBALI INFORMASI

Pembuatan Kakas Komunikasi Antar Pengembang Perangkat Lunak

BAB 2 LANDASAN TEORI Sistem Rekomendasi

ANALISIS SKEMA-SKEMA KEMIRIPAN VEKTOR PADA SISTEM PENILAIAN UJIAN ESSAY ONLINE

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

RENCANA PEMBELAJARAN SEMESTER (RPS)

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

BAB III LANDASAN TEORI

Information Retrieval

Transkripsi:

Sistem Temu-Kembali Informasi Pengantar Perkuliahan Husni Program Studi Teknik Informatika Universitas Trunojoyo Madura Semeter Gasal 2015-03 Sep. 2015

Perkenalan... Husni (UGM, ITB) Bidang Minat Sistem Terdistribusi dan Web Data Mining (Social Network Analysis, Web Retrieval) Lab. CC dan Lab. SisTer Email: husni@if.trunojoyo.ac.id FB: facebook.com/lunix96 Jam Diskusi Perkuliahan: Kamis (13.00 s.d 17.00) Jumat (10.00 s.d 11.30) Web kuliah: Husni.trunojoyo.ac.id 2

Bentuk Perkuliahan 14 kali kuliah di kelas: 14 x 3 x 50 menit Lab: Mandiri, sesuai kebutuhan (tentatif) Jadwal Kuliah: Kamis, 07.20 09.30 dan 09.30 11.40, ruang F403 Tugas: Kelompok (4 s.d 5 mahasiswa): Proyek pembuatan search engine mini Web Crawler, Preprocessing, Indexing, Searching, Ranking, Classification Presentasi proposal pada pertemuan ke-7 Presentasi akhir pada pertemuan ke-14 Penilaian: UTS (closed, 40%), UAS (30%), Proyek (40%) 3

Motivasi WWW atau Web telah menjadi sumber utama informasi bagi kebutuhan kerja maupun pengisi waktu Kandungan raksasa WWW akan terbuang jika informasi tidak dapat ditemukan (lagi), dianalisis dan dimanfaatkan. Setiap pengguna sebaiknya mampu dengan cepat menemukan informasi yang relevan dan komprehensif sesuai kebutuhannya WWW telah menjadi penggerak utama dari inovasi dan sederet teknik baru telah diperkenalkan untuk menjinakkan dan memanfaatkan kandungan informasinya Recommender systems: Tool (web, mobile, standalone) yang sangat terkenal untuk mendukung pengguna menemukan dan memilih produk, layanan dan informasi. 4

Teknik Pengelolaan Data 5

Silabus Konsep dasar Information Retrieval (IR) Boolean retrieval, Indexing Model ruang vektor (vector space model, VSM) Klasifikasi Teks dan Ruang Vektor Evaluasi dalam Information Retrieval Web search & crawling dan link analysis Sistem Perekomendasi (Recommender) Collaborative & Content-based filtering and Social Filtering Hybrid recommender systems, Knowledge based recommenders, Conversational recommender systems, Context-dependent recommender systems, Group recommendations 6

Apa yang harus dipelajari? Dasar-dasar ilmiah dari bidang Pencarian & Temu-Kembali Informasi (Searching & IR) Teknik & Tool pencarian & penemuan informasi yang dapat dimanfaatkan untuk merancang danmengimplementasikan situs web khusus (ecommerce, egovernment) Kelebihan & kekurangan berbagai teknik yang ada Analisis tentang manfaat dan keterbatasan teknik dan sistem terhadap aktor yang terlibat dalam proses IR Kemampuan untuk memutuskan kapan (untuk jenis produk atau layanan apa) suatu teknik dapat berguna atau tidak Mengidentifikasi aplikasi baru dari teknik-teknik tersebut. 7

Bahan Bacaan Topik-topik Information Retrieval: C. D. Manning, P. Raghavan and H. Schutze. Introduction to Information Retrieval, Cambridge University Press, 2008. http://nlp.stanford.edu/ir-book/informationretrievalbook.html Penelitian mengenai Recommender Systems termasuk baru, lahir sekitar 95. Koleksi paper dalam bentuk review ada di: Ricci, F.; Rokach, L.; Shapira, B.; Kantor, P.B. (Eds.), Recommender Systems Handbook. 1st Edition., 2011, 845p. 20 illus., Hardcover, ISBN: 978-0-387-85819-7. http://www.springerlink.com/content/978-0-387-85819-7 Harus membaca paper juga, tidak hanya buku dan slide 8

Tugas dan Proyek (1) Semua tugas dan proyek dikerjakan dalam kelompok (3 s.d 5 Mahasiswa) (1) Tugas Pemrograman: Preprocessing terhadap dokumen teks bahasa Indonesia: Tokenisasi, Stemming, Stopword Removal dan Indexing Perhitungan kemiripan antar dokumen (atau dokumen dengan query) dan perankingannya (pada model ruang vektor) Evaluasi hasil pencarian/perhitungan kemiripan: Presisi, Recall, F-Measure Setiap anggota kelompok harus mampu menguasai 3 proses di atas secara manual (di atas kertas, boleh ber-kalkulator) 9

Tugas dan Proyek (2) (2) Tugas membaca dan merangkum paper tentang Web Search, Information Retrieval atau Recommender System 2 tahun terakhir (2014 s.d 2015) untuk melihat trend. Paper ini dijadikan sebagai salah satu referensi pada proyek Search Engine Mini Dipresentasikan pada pertemuan ke-7, sebagai bagian dari proposal proyek. Dikumpulkan: paper asli dan rangkumannya (A4, 1 spasi, Time New Roman 11 poin, 1 halaman) Presentasi Proposal Proyek: maks. 15 menit, harus tepat 3 slide, mahasiswa lain boleh bertanya. 10

Tugas dan Proyek (3) (3) Proyek Pembuatan prototipe Search Engine Mini Proposal proyek dipresentasikan pada pertemuan ke-7. Hasil: Layak (lanjut) atau ganti proyek (cari kasus lain) Laporan proyek (dikumpulkan): (1) latar belakang, (2) masalah yang diselesaikan, (3) solusi yang dipilih, (4) langkah-langkah dari metode/teknik dari solusi yang dipilih, (5) penjelasan kode program, (6) hasil yang diperoleh, (7) kesimpulan, (8) referensi, (9) peran dan tanggungjawab setiap anggota tim. Panjang laporan 5 halaman A4, 1.5 spasi. Dipresentasikan & didemokan pada pertemuan ke-14, maks. 20 menit. 11

Bagaimana Agar Lulus? Baca dan Pahami paper/bab yang akan didiskusikan di setiap perkuliahan slide hanya memberikan pemahaman secara garis besar Jika ada hal yang tidak jelas selama perkuliahan, segera membuat catatan dan ajukan pertanyaan. Tidak ber-social media selama perkuliahan Tim segera memulai proyek, agar: Punya waktu cukup untuk menyiapkan laporan Mengirimkan laporan (draft) agar lekas direview Mampu menjelaskan dengan baik aplikasi dari teknik yang dipilih (saat dipresentasikan). 12

Penilaian Ujian Tengah Semester (UTS): 40% (kemampuan membangun inverted index, menghitung kemiripan antar dokumen dan cara evaluasinya) Laporan & Presentasi Proyek Recommender System: 40% Ujian Akhir Semester (UAS): 30% (kemampuan memahami klasifikasi dokumen dan recommender system) Tugas Tambahan/Bonus Nilai? TIDAK ADA 13

14

15

Search Engine 16

Arsitektur Search Engine 17

18

Area Kerja Dalam Proses IR Web Crawling: menghimpun data dari Web Data Extraction: mengambil informasi dan URL dari halaman web Preprocessing: menerapkan aturan bahasa untuk menyederhanakan proses IR Indexing: membuat index (pemetaan term ke dokumen) Penanganan Query: mendapatkan dokumen yang relevan dengan Query (kebutuhan informasi pengguna) Klasifikasi dan Clusterisasi Recommendation: memberikan dokumen yang sesuai dengan kebutuhan/profil pengguna, berdasarkan kemiripan dokumen atau kemiripan pengguna Evaluasi sistem IR: Presisi, Recall, F-Measure 19

Amazon.com 20

movielens.org 21

Lain-lain Facebook Youtube igoogleportal 22

Pertanyaan 23