JULIO ADISANTOSO - ILKOM IPB 1

dokumen-dokumen yang mirip
KOM341 Temu Kembali Informasi

TEMU KEMBALI INFORMASI

Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI

RETRIEVAL STRATEGIES. Tujuan 4/9/13. Budi Susanto

Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES. Budi Susanto

KOM341 Temu Kembali Informasi

Information Retrieval

PERANCANGAN INFORMATION RETRIEVAL SYSTEM UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN EXTENDED BOOLEAN

Data Mining. Metode Klasterisasi K-Means

VIII. ALIRAN MELALUI LUBANG DAN PELUAP

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning

BAB I PENDAHULUAN Latar Belakang

Sistem Temu Kembali Informasi/ Information Retrieval

BAB II TINJAUAN PUSTAKA

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

dan E 3 = 3 Tetapi integral garis dari keping A ke keping D harus nol, karena keduanya memiliki potensial yang sama akibat dihubungkan oleh kawat.

=== BENTUK KANONIK DAN BENTUK BAKU ===

MAKALAH TUGAS AKHIR DIMENSI METRIK PADA PENGEMBANGAN GRAPH KINCIR DENGAN POLA K 1 + mk n

BAB 1 PENDAHULUAN UKDW

Ax b Cx d dan dua persamaan linier yang dapat ditentukan solusinya x Ax b dan Ax b. Pada sistem Ax b Cx d solusi akan

BAB II TINJAUAN PUSTAKA

Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor

Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information

BAB II TINJAUAN PUSTAKA

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

BAB V KAPASITOR. (b) Beda potensial V= 6 volt. Muatan kapasitor, q, dihitung dengan persamaan q V = ( )(6) = 35, C = 35,4 nc

Penerapan Aljabar Max-Plus Pada Sistem Produksi Meubel Rotan

PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL. Budi Susanto

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

BAB II DASAR TEORI. II.1 Saham

VECTOR SPACE MODEL. Tujuan 4/2/13. Budi Susanto

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

PEMODELAN Deskripsi Masalah

Sistem Temu Kembali Informasi Menggunakan Model Ruang Vektor dan Inverted Index

1 Kapasitor Lempeng Sejajar

BAB III KONTROL PADA STRUKTUR

IMPLEMENTASI TEKNIK FEATURE MORPHING PADA CITRA DUA DIMENSI

, serta notasi turunan total ρ

FUNGSI TRANSENDEN J.M. TUWANKOTTA

GROUP YANG DIBANGUN OPERATOR LINEAR TERBATAS SEBAGAI SUATU PENYELESAIAN MCA HOMOGEN

JULIO ADISANTOSO - ILKOM IPB 1

PEMODELAN PENJADWALAN LINIER DENGAN ALOKASI SUMBER DAYA MANUSIA PADA PROYEK PERUMAHAN. Hedwig A Tan 1, Ratna S Alifen 2

Arus Melingkar (Circular Flow) dalam Perekonomian 2 Sektor

1 Kapasitor Lempeng Sejajar

Bayesian Belief Network untuk Menghasilkan Fuzzy Association Rules

DIFERENSIAL FUNGSI SEDERHANA

1.1. Sub Ruang Vektor

SISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

BAB 3 MODEL DASAR DINAMIKA VIRUS HIV DALAM TUBUH

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

METODE PENELITIAN Data Langkah-Langkah Penelitian

KAPASITOR. Pengertian Kapasitor

PENGARUH KECEPATAN ANGIN TERHADAP EVAPOTRANSPIRASI BERDASARKAN METODE PENMAN DI KEBUN STROBERI PURBALINGGA

Hukum Coulomb. a. Uraian Materi

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL

Fatkhul Amin Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang

BAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi

APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA

BAB II TINJAUAN PUSTAKA

BAB III INTERFERENSI SEL

SISTEM TEMU KEMBALI INFORMASI

3. Kegiatan Belajar Medan listrik

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

BAB 3 ANALISA DAN PERANCANGAN

JURNAL ITSMART Vol 4. No 2. Desember 2015 ISSN :

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK

BAB 2 LANDASAN TEORI Sistem Rekomendasi

JULIO ADISANTOSO - ILKOM IPB 1

BAB III UJICOBA KALIBRASI KAMERA

PENDAHULUAN. Latar belakang

PROGRAM KOMPUTER UNTUK PEMODELAN SEBARAN PERGERAKAN. Abstrak

commit to user BAB II TINJAUAN PUSTAKA

JULIO ADISANTOSO - ILKOM IPB 1

1 PRINSIP DASAR PEMODELAN

BAB I PENDAHULUAN 1.1 Latar Belakang

PANJANG PENYALURAN TULANGAN

BAB II LANDASAN TEORI

BAB 4 IMPLEMENTASI DAN EVALUASI

Universitas Indonusa Esa Unggul Fakultas Ilmu Komputer Teknik Informatika. Integral Lipat Dua

BAB IV PREPROCESSING DATA MINING

Sudaryatno Sudirham. Diferensiasi

DETEKSI KEMIRIPAN TOPIK PROPOSAL JUDUL TUGAS AKHIR DAN SKRIPSI MENGGUNAKAN LATENT SEMANTIC ANALYSIS DI STMIK BUMIGORA MATARAM

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

ANALISAPERHITUNGANWAKTU PENGALIRAN AIR DAN SOLAR PADA TANGKI

Pendahuluan Definisi Aturan Problems DERIVATIVE (TURUNAN) Kus Prihantoso Krisnawan. November 18 th, Yogyakarta. Krisnawan Pertemuan 1

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

beberapa tag-tag lain yang lebih spesifik di dalamnya.

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011

UJIAN TENGAH SEMESTER KALKULUS/KALKULUS1

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

BAB III LANDASAN TEORI. Beton bertulang merupakan kombinasi antara beton dan baja. Kombinasi

Transkripsi:

KOM341 Temu Kembali Informasi Proses Temu-Kembali KULIAH #4 Pemoelan IR Boolean moel Vector space moel Konsep IR Pemoelan IR Moel IR iefinisikan sebagai empat komponen [D, F, Q, R(q, )] Keterangan: D aalah kumpulan okumen Q aalah query F menunukkan pemoelan okumen an query R(q, ) aalah fungsi peringkat yang ikaitkan engan suatu nilai R, imana q Q an D Set Theoretic Moel IR Classic Moels Fuzzy Extene Boolean Boolean Moel U s e r T a s k Retrieval: Ahoc Filtering Browsing boolean vector probabilistic Structure Moels Non-Overlapping Lists Proximal Noes Browsing Flat Structure Guie Hypertext Algebraic Generalize Vector Lat. Semantic Inex Neural Networks Probabilistic Inference Network Belief Network Exact match, pencocokan secara tepat sama. Query berbentuk ekspresi boolean. Dokumen bisa cocok atau tiak cocok engan query yang iberikan. Hasilnya berupa sekumpulan okumen yang cocok. Tiak aa peringkat okumen sesuai engan query yang iberikan. 1

Boolean Moel Bobot w t, {0,1} Query q teriri ari kata, frase, atau konsep yang ihubungkan engan operator Boolean AND, OR, atau NOT. Contoh: q = [k a (k b k c )] = k a && (k b!k c ) Contoh 1 An the angels, all palli an wan, 2 Uprising, unveiling, affirm 3 That the play is the tragey, Man, 4 Angel an its hero the Conqueror Worm. Hasil Tokenisasi: 1) affirm 7) play 2) angel 8) tragey 3) conqueror 9) unveil 4) hero 10) uprise 5) man 11) wan 6) palli 12) worm Pembobotan Boolean Contoh query: hero AND (angel OR NOT man) Formulasi query : = [k 4 {k 2 kk 5 }] = [(0 1 0 1) {(1 0 0 0} (0 0 1 0)}] = (0 1 0 1) Hasil query (tiak aa urutan): 2 an 4 Boolean Moel Keuntungan Implementasi muah an seerhana Query muah isusun an imengerti Operator AND, OR, NOT sesuai engan bahasa alami Kelemahan Tiak aa peringkat okumen sesuai engan query yang iberikan Exact matching Repot untuk query yang kompleks Boolean Scoring : Linear zone combinations Contoh: tiap okumen memiliki ua zona, yaitu title an boy (atau text). Untuk setiap w [0,1] apat ihitung: score(,q)=w.s T (,q) + (1-w).s B (,q) s T (, q) {0,1} : nilai Boolean q alam Title s B (, q) {0,1} : nilai Boolean q alam Boy Vector Space Moel Moel berbasis token Memungkinkan partial matching an pemeringkatan okumen. Cenerung sebagai best matching. Prinsip asar: Dokumen sebagai vektor token Terapat t kumpulan token Query sebagai vektor token Kesamaan vektor okumen an query ihitung berasarkan arak atau kesamaan antar vektor 2

Moel Geometrik Kesamaan Antar Vektor Dok-1 Token-3 Dok-2 Query Dok-4 Dok-3 Token-2 Dokumen mana yang paling ekat engan query? Urutkan setiap okumen berasarkan ukuran kesamaan/keekatannya engan vektor query Ukuran kemiripan Cosine Ukuran kemiripan Cosine t 3 1 Ukuran kesamaan Cosine antara an k k sim(, k ) Panang vektor k t 1 Ukuran kemiripan sebagai nilai Cosinus ari suut t 2 '. Nilai koefisien vektor Koefisien vektor menunukkan seberapa penting suatu kata VSM tiak memberi ketentuan mengenai nilai koefisien vektor (bobot kata) Beberapa contoh nilai bobot {0, 1} tf tf.if 3

Ukuran kemiripan Dot Prouct Dot prouct vektor an q sim (, q ) q sim(d1, Q) = 0.106 sim(d2, Q) = 0.016 sim(d3, Q) = 0.000 sim(d4, Q) = 0.922 Ukuran kemiripan Cosine Panang vektor Q = 0.912 D1 = 0.615 D3 = 1.126 D2 = 0.748 D4 = 1.385 Ukuran kesamaan Cosine sim(d1, Q) = 0.189 sim(d2, Q) = 0.023 sim(d3, Q) = 0.000 sim(d4, Q) = 0.730 Proseur Masalah komputasi Jika ukuran koleksi = N sangat besar (utaan, milyaran, ), berapa nilai kompleksitas untuk menentukan urutan okumen ari satu query paa N okumen paa koleksi? Sangat besar sehingga waktu komputasi akan sangat lama. Cluster pruning : preprocessing untuk mengelompokkan okumen alam koleksi sesuai engan keekatan vektor. Cluster pruning Visualisasi Cluster pruning Proseur (preprocessing): Ambil secara acak N okumen. Disebut sebagai leaers. Untuk setiap okumen yang bukan leaer (isebut followers), hitung keekatannya engan leaer. Query Proses query q: Dapatkan leaer L yang ekat engan q. Cari K okumen terekat q i antara follower ari L Leaer Follower 4

Latihan Gunakan tf.if an Cosine Dokumen: 1 : "Shipment of gol amage in a fire" 2 : "Delivery of silver arrive in a silver truck" 3 : "Shipment of gol arrive in a truck" 3 Query: "gol silver truck Asumsi : N=1000 5