Penelusuran Informasi (Information Retrieval)

dokumen-dokumen yang mirip
Penerapan Graf dalam Algoritma PageRank Mesin Pencari Google

Penelusuran Informasi (Information Retrieval)

Aplikasi Teori Graf dalam Algoritma PageRank dan Optimasi SEO Website

SEO SEO ( Search Engine Optimization)

Julio Adisantoso, IPB 1

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

Search Engines. Information Retrieval in Practice

Penelusuran Informasi (Information Retrieval) Taufik Fuadi Abidin. Web Search

IPB. PEMUTAKHIRAN WEB UNIT KERJA (Periode Maret 2017) Institut Pertanian Bogor Auditorium Toyib Hadiwijaya, Maret 2017

Analisis Graf Berarah Pada Algoritma PageRank di Mesin Pencari

E-MARKETING. On Page SEO

BAB I PENDAHULUAN. Teknologi Informasi saat ini mengalami perkembangan yang signifikan.

BAB I PENDAHULUAN. 1.1 Latar Belakang

IMPLEMENTASI SEARCH ENGINE OPTIMIZATION (SEO) UNTUK MENINGKATKAN PERINGKAT DI SERP PADA GOOGLE HUMMINGBIRD

STUDI WORLD WIDE WEB SEBAGAI SEBUAH GRAF BERARAH

Webometrics Best Practice. Beni Rio Hermanto, ITB webmaster team.

Internasionalisasi Jurnal

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

Penerapan Graf pada PageRank

TEMU KEMBALI INFORMASI

PENDAHULUAN TINJAUAN PUSTAKA. untuk meningkatkan trafik pengunjung situs web (Malaga 2007).

Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI

PERANCANGAN DAN PEMBUATAN PERANGKAT LUNAK PENELUSUR WEB (WEB CRAWLER) MENGGUNAKAN ALGORITMA PAGERANK

HASIL DAN PEMBAHASAN. untuk langkah berikutnya hingga tercapai hasil maksimal.

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

Cara Mendapat Backlink dari Wikipedia

SEARCH ENGINE OPTIMIZATION (SEO) CHECKLIST

Penelusuran online dan Pelaporan

Peranan Web Spider Dalam Internet Search Engine

2. BAB II LANDASAN TEORI

Auditorium Toyib Hadiwijaya, 31 Agustus PEMUTAKHIRAN WEB UNIT KERJA (Periode Agustus 2017) IPB. Institut Pertanian Bogor

DAFTAR ISI Transformasi data... 47

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

BAB 2 TINJAUAN PUSTAKA

IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR

PERANCANGAN WEB RANK MENGGUNAKAN COLLABORATIVE FILTERING BERDASARKAN KEMIRIPAN KONTEN

TIK Agribisnis UMY 2016 Heri Akhmadi, S.P., M.A.

JULIO ADISANTOSO - ILKOM IPB 1

Ahmad Royani, S.Kom. Ahmad Royani, S.Kom SMK NEGERI 3 DEPOK JUDUL MATERI EVALUASI PENUGASAN KELUAR

Search Engine Optimization

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

MEMBUAT KONTEN. 3.1 Apakah konten itu?

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

TUTORIAL ADMINISTRATOR WORDPRESS WP-ADMIN Contents Management Wordpress Selfhosting

Pengenalan Internet 1. Rudi Susanto, M.Si

Evaluasi Aplikasi DNS sebagai Search Engine untuk Pencarian Nama Domain Best Universities dan Top Leading Banks di Indonesia.

Novita Hosama 2) Arifin Puji Widodo 3) Teguh Sutanto

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

Implementasi BFS dan Analisis Page Rank pada Google Search Engine

ANALISIS DAN PERANCANGAN SEARCH ENGINE DOKUMEN PAPER BERBASIS WEB NASKAH PUBLIKASI. diajukan oleh Aldrik Saddermi

KNOWLEDGE IN TEXT (IR-2)

OPTIMALISASI POTENSI PENGUNJUNG PADA WEBSITE SHOPPINGMAGZ.COM DENGAN SEARCH ENGINE OPTIMIZATION (SEO)

Implementasi Graf pada Metode Crawling dan Indexing di dalam Mesin Pencari Web

Binary Search Tree (BST)

KOM341 Temu Kembali Informasi

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

APLIKASI WEB GRABBER UNTUK MENGAMBIL HALAMAN WEB SESUAI DENGAN KEYWORD YANG DIINPUTKAN

3. BAB III METODE PENELITIAN. untuk mendapatkan strategi peningkatan visibility/impact dan activity pada

IKI 20100: Struktur Data & Algoritma

Teddy Mantoro.

Dr. Taufik Fuadi Abidin, S.Si., M.Tech

Bogor Agricultural University (IPB) Sosialisasi Lomba Web Unit Kerja 2017

ANALISIS SEARCH MATCHING PADA SEARCH ENGINE

IMPLEMENTASI METODE ANALYTICAL NETWORK PROCESS UNTUK MEMBANGUN APLIKASI EXECUTIVE SUPPORT SYSTEM PADA PERUSAHAAN KONSULTAN IT. Ngurah Agus Sanjaya ER

Materi. I. Pengenalan HTML II. Basic Tag HTML III. Table IV. Image

STUDI PERBANDINGAN FASILITAS DAN KINERJA SEARCH ENGINES DALAM PENCARIAN DOKUMEN BERBASIS WEB HERY WIDHIARTO

BAB II TINJAUAN PUSTAKA

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document

BAB 2 LANDASAN TEORI

WEBSITE UNSIKA DALAM PEMERINGKATAN WEBSITE PERGURUAN TINGGI DI INDONESIA (PUSDATIN BPM, 2014)

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

DAFTAR ISI. KATA PENGANTAR... vii. DAFTAR TABEL... xi. 1.1 Latar Belakang Masalah Perumusan Masalah Pembatasan Masalah...

Internet Marketing Jaeni

GOOGLE SEARCH. Google. pencari. hari. peringkat. berbagai pilihan. alternatif

1 SEO

ABSTRAK. Kata kunci : Informasi, Information Retreival, Ant Colony Optimization, Graph, Fitur dokumen. vii

MANAJEMEN RISIKO 1 (INDONESIAN EDITION) BY IKATAN BANKIR INDONESIA

Preorder Tree Traversal

MINGGU#5. Telekomunikasi, Internet, Teknologi Nirkabel (wireless)

GUIDELINE PENGUJIAN MENGGUNAKAN SPSS

Organisasi dan Arsitektur Komputer : Perancangan Kinerja

IMPLEMENTASI VECTOR SPACE MODEL UNTUK PENCARIAN DOKUMEN

Implementasi Generalized Vector Space Model Menggunakan WordNet

ALGORITMA-ALGORITMA PARALLEL RANDOM ACCESS MACHINE (PRAM = pea ram) Ver

Search Engine. Adri Priadana ilkomadri.com

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

BAB 2 TINJAUAN PUSTAKA

KAJIAN MODEL PERKIRAAN AWAL BIAYA PADA-PROYEK PENINGKATAN JALAN KABUPATEN DI KABUPATEN SUMEDANG TESIS MAGISTER. Oleh: AGUS SUTOPO NIM :

ANALISIS SKEMA-SKEMA KEMIRIPAN VEKTOR PADA SISTEM PENILAIAN UJIAN ESSAY ONLINE

Transkripsi:

Introduction to Information Retrieval Penelusuran Informasi (Information Retrieval) Sumber: CS276: Information Retrieval and Web Search Pandu Nayak and Prabhakar Raghavan Taufik Fuadi Abidin Link Analysis

Pembahasan Minggu Ini Hypertext dan Link (tautan): melihat lebih jauh, tidak hanya aspek tektual dari dokumen HTML Makna dari keterkaitan Aplikasi terkait 2

Hyperlink (tautan) Link dapat dimanfaatkan sebagai sumber daya yang potensial dalam menentukan authenticity& authority Jenis Link: Good, Bad& Unknown Good Bad 3

Simple Iterative Logic Link yang Goodtidak akan tunjuk ke node yang Bad Jika Goodnode link ke Badnode maka Goodnode akan menjadi Bad node Jika Goodnode link ke node tertentu, maka node tersebut merupakan node yang Good Good Bad 4

Simple Iterative Logic Good Bad Good Bad 5

Contoh Link Analysis Social networks Page Ranks http://www.cs.cornell.edu/home/kleinber/networks-book/ 6

Sec. 21.1 Web Merupakan Directed Graph Page A Anchor hyperlink Page B Asumsi 1:hyperlink antara halaman HTML menyatakan authority dari halaman tersebut (quality signal) Asumsi 2:Text yang ada pada anchor dari sebuah hyperlink menggambarkan (a glance) halaman target/tujuan (textual context)

Introduction to Information Retrieval Asumsi 1: Site Dengan Reputasi Baik 8

Introduction to Information Retrieval Asumsi 2: Menggambarkan Target 9

Sec. 21.1.1 Indexing Anchor Text Ketika mengindeks documen D, dengan bobot tertentu, anchor textyang tunjuk ke dokumen D juga di-include-kan Armonk, NY-based computer giant IBM announced today Big Blue today announced record profits for the quarter www.ibm.com Joe s computer hardware links Sun HP IBM Anchor text weight tergantung authority dari anchor page s website Jika diasumsikan bahwa konten dari cnn.com atau yahoo.com adalah authoritative (bagus) maka percaya semua anchor text dari web itu

Citation Analysis (Part of Link Analysis) Citation frequency Bibliographic coupling frequency Articles that co-cite the same articles are related Citation indexing Who is this author cited by (Garfield 1972)

Isu: Web isn t scholarly citation Miliaran partisipan, setiap partisipan punya tujuan sendiri-sendiri Spam ada dimana-mana Ketika SE mulai menggunakan link untuk ranking, (sekitar tahun 1998), spam terkait link tumbuh berkembang 12

Link Analysis Page Rank (Google) A link analysis algorithm that assigns a weight to each page to measure the relative importance of the page within the set. It interprets a link from page A to page B as a vote, by page A, for page B (see The Anatomy of a Large-Scale Hypertextual Web Search Engine. Brin, S.; Page, L., 1998) ExpertRank (Ask.com) Subject-Specific Popularity: analyzed links in context to rank a web page's importance within its specific subject. Ex. a web page about basketball would rank higher if other web pages about basketball' link to it Presented at the General Lecture, Mathematics Department, Syiah Kuala University, May 2007 13

Page Rank Algorithm Diketahui node A, B, C, and D. Initial PR adalah 0.25 Jika B, C, D tunjuk ke A maka PR(A) = PR(B) + PR(C) + PR(D) B A D C Namun, jika B jika tunjuk (link) ke C, dan D link ke semau (A, B, dan C), maka vote untuk setiap node dinormalisasi dengan B membagi jumlah outbound links ke halaman tersebut. Vote B adalah 0.125 untuk node A dan C Vote D = 0.25/3 = 0.081 untuk node A, B, dan C A C D PR(A) = PR(B)/OL(B) + PR(C)/OL(C) + PR(D)/OL(D) = 0.456 Presented at the General Lecture, Mathematics Department, Syiah Kuala University, May 2007 14

Sec. 21.3 Hyperlink-Induced Topic Search (HITS) In response to a query, instead of an ordered list of pages each meeting the query, find twosets of interrelated pages: Hub pagesare good lists of links on a subject. e.g., Bob s list of cancer-related links. Authority pagesoccur recurrently on good hubs for the subject.

Sec. 21.3 Hubs and Authorities Thus, a good hub page for a topic pointsto many authoritative pages for that topic. A good authority page for a topic is pointed to by many good hubs for that topic.

Sec. 21.3 High-level scheme Extract from the web a base setof pages that couldbe good hubs or authorities. From these, identify a small set of top hub and authority pages; iterative algorithm.

Sec. 21.3 Representasi n n adjacency matrix A: each of the npages in the base set has a row and column in the matrix. Entry A ij = 1if page ilinks to page j, else = 0. 1 2 3 1 2 3 1 2 3 0 1 0 1 1 1 1 0 0