Temu-Kembali Informasi 2017
|
|
- Sri Gunardi
- 6 tahun lalu
- Tontonan:
Transkripsi
1 Temu-Kembali Informasi : Penskoran, Pembobotan Term & Model Ruang Vektor Husni Modifikasi dari slide kuliah Stanford CS276
2 Rekap Kuliah Sebelumnya Statistika koleksi dan kosa kata: Hukum Heaps dan Zipf Kompresi kamus untuk indeks boolean String kamus, blocks dan front coding Kompresi postings: Gap encoding, prefix-unique codes Variable-Byte dan kode gamma Koleksi (text, xml markup etc) 3,600.0 Koleksi (text) Term-doc incidence matrix 40,000.0 postings, uncompressed (32-bit words) postings, uncompressed (20 bits) postings, variable byte encoded postings, g-encoded MB
3 Kuliah Hari Ini; IIR Sub-Bab Temu-kembali berperingkat Penskoran dokumen Frekuensi term Statistika koleksi Skema pembobotan Penskoran ruang vektor Ranked retrieval Scoring documents Term frequency Collection statistics Weighting schemes Vector space scoring
4 Ch. 6 Temu-Kembali Berperingkat Sejauh ini, query kita semuanya berbentuk Boolean. Dokumennya cocok atau tidak. Bagus bagi pengguna pakar dengan pemahaman ketepatan dari kebutuhan mereka dan koleksinya. Juga bagus bagi aplikasi: Aplikasi dapat dengan mudah mengkonsumsi ribuah hasil. Tidak bagus bagi mayoritas pengguna. Sebagian besar pengguna tidak mampu menuliskan query boolean (atau mampu tetapi berpikir itu pekerjaan yang terlalu banyak). Sebagian besar pengguna tidak ingin mmemriksa ribuan hasil. Ini terutama benar pada pencarian web.
5 Masalah dengan Pencarian Boolean: Pesta atau Kelaparan Ch. 6 Query boolean sering mengakibatkan terlalu sedikit (=0) atau terlalu banyak (1000) hasil. Query 1: standard user dlink ,000 hits Query 2: standard user dlink 650 no card found : 0 hits Diperlukan banyak keterampilan hadir Bersama dengan suatu query yang menghasilkan sejumlah hit yang dapat dikelola. AND memberikan terlalu sedikit; OR memberikan terlalu banyak
6 Model Temu-Kembali Berperingkat Daripada sehimpuan dokumen yang memenuhi suatu ekspresi query, dalam model retrieval berperingkat, sistem mengembalikan suatu pengurutan terhadap dokumen (top) dalam koleksi yang berkaitan dengan query Query teks bebas: Daripada suatu bahasa query berisi operators dan ekspresi, query pengguna hanya satu atau lebih kata dalam suatu bahasa manusia (alami) Prinsipnya, ada dua pilihan terpisah di sini, tetapi praktisnya, model retrieval berperingkat normalnya telah diasosiasikan dengan query teks bebas dan sebaliknya. 6
7 Pesta atau Lapar: Bukan Masalah dalam Temu-Kembali Berperingkat Ch. 6 Ketika suatu sistem memproduksi sehimpunan hasil berperingkat, himpunan hasil yang besar bukanlah persoalan lagi Betul, ukuran dari himpunan hasil bukanlah suatu persoalan Kita hanya menampilkan top k ( 10) hasil Kita tidak membanjari pengguna dengan dokumen hasil Alasan (premis): Algoritma pemeringkatan bekerja.
8 Ch. 6 Penskoran: Basis Temu-Kembali Berperingkat We wish to return in order the documents most likely to be useful to the searcher How can we rank-order the documents in the collection with respect to a query? Berikan suatu skor: katakana dalam [0, 1] untuk setiap dokumen Skor ini mengukur seberapa baik dokumen dan query cocok.
9 Ch. 6 Skor Relevansi Query-Dokumen Kita perlu suatu cara penentuan skor terhadap suatu paangan query/dokumen Mari kita mulai dengan suatu query satu term Jika term query tidak muncul di dalam dokumen: skor menjadi 0 Semakin sering term query dalam dokumen, akan semakin tinggi skornya Kita akan melihat sejumlah alternatif untuk ini.
10 Ch. 6 #1: Koefisien Jaccard Ingat dari Bab 3: Ukuran overlap dua himpunan A dan B yang umum digunakan jaccard(a,b) = A B / A B jaccard(a,a) = 1 jaccard(a,b) = 0 if A B = 0 A dan B tidak harus berukuran sama. Selalu berikan nilai antara 0 dan 1.
11 Ch. 6 Koefisien Jaccard: Contoh Penskoran Berapakah skor kesesuaian query-dokumen yang dihitung dengan koefisien Jaccard untuk masing-masing dokumen di bawah ini? Query: ides of march Dokumen 1: caesar died in march Dokumen 2: the long march
12 Persoalan dengan Penskoran Jaccard Tidak mempertimbangkan term frequency (berapa kali suatu term muncul di dalam suatu dokumen) Term yang jarang dalam koleksi lebih informatif daripada term yang sering Jaccard tidak melibatkan informasi ini Kita perlu cara lebih canggih untuk menormalisasi panjang Dalam kuliah ini, akan digunakan A B / A B... Menggantikan A B / A B (Jaccard) untuk normalisasi panjang.
13 Sec. 6.2 Ingat: Matrisk Biner Hubungan Term-Dokumen Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Antony Brutus Caesar Calpurnia Cleopatra mercy worser Setiap dokumen direpresentasikan oleh vektor biner {0,1} V
14 Sec. 6.2 Matriks Hitungan Term-Dokumen Perhatikan jumlah kemunculan term dalam suatu dokumen: Setiap dokumen adalah suatu vektor jumlah dalam N v : kolom berikut Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Antony Brutus Caesar Calpurnia Cleopatra mercy worser
15 Model Bag of Words Representasi vektor tidak mempertimbangkan urutan dari kata di dalam suatu dokumen John is quicker than Mary dan Mary is quicker than John mempunyai vektor yang sama Ini disebut model bag of words (tas berisi kata-kata). Dalam arti, ini adalah langkah mundur: Indeks berposisi telah mampu membedakan dua dokumen ini. Kita akan lihat pemulihan informasi posisi di kuliah selanjutnya. Untuk sekarang: model bag of words
16 Frekuensi Term: tf Frekuensi term tf t,d dari term t di dalam dokumen d didefinisikan sebagai jumlah kali yang t muncul di dalam d. Kita akan menggunakan tf saat menghitung skor kecocokan querydokumen. Tapi bagaimana? Frekuensi term mentah bukanlah apa yang diinginkan: Suatu dokumen dengan 10 kemunculan dari term adalah lebih relevan daripada suatu dokumen dengan 1 kemunculan dari term tersebut. Tetapi tidak 10 kali lebih relevan. Relevansi tidak bertambah secara proporsional dengan frekuensi term. NB: Frekuensi = jumlah dalam IR
17 Sec. 6.2 Pembobotan Log-frekuensi Bobot frekuensi log dari term t dalam dokumen d adalah w t,d 1 log10 tft,d, if tft,d 0 0, otherwise 0 0, 1 1, 2 1.3, 10 2, , dll. Skor untuk suatu pasangan dokumen-query: akumulasi term t dalam kedua q dan d: Skor t q d (1 log tf t, d ) Skor bernilai 0 jika tidak ada term query yang hadir di dalam dokumen tersebut.
18 Sec Frekuensi Dokumen Term yang jarang muncul sebetulnya lebih informatif daripada term yang sering Ingat kembali stop words Perhatikan suatu term dalam query yang jarang dalam koleksi (misal: arachnocentric) Suatu dokumen yang mengandung term ini sangatlah besar kemungkinan relevan dengan query arachnocentric Kita ingin bobot tinggi untuk term yang jarang seperti arachnocentric.
19 Sec Frekuensi Dokumen (Lanj.) Term yang sering muncul dalam dokumen sifatnya kurang informatif dibandingkan term yang jarang Perhatikan suatu term query yang sering dalam koleksi (seperti high, increase, line) Suatu dokumen yang mengandung term demikian lebih mungkin relevan daripada dokumen yang tidak Tetapi itu bukalah indikator pasti dari relevansi. Untuk term yang sering, kita ingin bobot positif tinggi untuk kata-kata seperti high, increase, dan line Tetapi bobot lebih rendah daripada untuk term yang jarang. Kita akan gunakan frekuensi dokumen (document frequency, df) untuk menangkap ini.
20 Sec Bobot idf df t adalah frekuensi dokumen dari t: jumlah dokumen yang mengandung term t df t adalah ukuran inversi dari sifat informatif suatu term t df t N Kita definisikan idf (inverse document frequency) dari t dengan idf t log10 ( N/dft Kita gunakan log (N/df t ) sebagai ganti dari N/df t untuk menperkecil pengaruh dari idf. ) Perubahan basis log tidaklah penting
21 Sec Contoh idf, Anggap N = 1 juta term df t idf t calpurnia 1 animal 100 sunday 1,000 fly 10,000 under 100,000 the 1,000,000 idf log ( N/df t 10 t ) Ada satu nilai idf untuk setiap term t dalam suatu koleksi.
22 Pengaruh dari idf Terhadap Pemeringkatan Apakah idf mempunyaui efek pada pemeringkatan untuk query satu term, seperti iphone idf tidak berpengaruh pada perankingan query satu term idf mempengaruhi pemeringkatan dokumen untuk query dengan panjang minimal dua term Untuk query capricious person, pembobotan idf membuat kemunculan capricious terhitung lebih besar dalam pemerinkatan dokumen akhir daripada kemunculan person. 22
23 Sec Koleksi vs. Frekuensi Dokumen Frekuensi koleksi dari t adalah jumlah kehadiran dari t di dalam koleksi, menghitung banyaknya kemunculan. Contoh: Kata Frekuensi Koleksi Frekuensi Dokumen insurance try Kata mana yang merupakan term pencarian yang lebih baik (dan harus mendapatkan bobot yang lebih tinggi)?
24 Sec Pembobotan tf-idf Bobot tf-idf dari suatu term adalah perkalian antara bobot tf dan bobot idf-nya. w (1 log tf ) log t, d 10 ( N / df t, d t ) Skema pembobotan paling terkenal dalam information retrieval Catat: - dalam tf-idf adalah suatu hyphen, bukan tanda minus! Nama alternatif: tf.idf, tf x idf Meningkat mengikuti jumlah kemunculan di dalam dokumen Meningkat mengikuti kejarangan dari term di dalam koleksi.
25 Sec Peringkat Akhir dari Dokumen terhadap Query Skor( q, d) tf.idf t q d t, d 25
26 Sec. 6.3 Biner Jumlah Matriks Bobot (tf-idf) Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Antony Brutus Caesar Calpurnia Cleopatra mercy worser Setiap dokumen sekarang direpresentasikan oleh suatu vektor dari bobot tf-idf R V bernilai ril
27 Sec. 6.3 Dokumen Sebagai Vektor Jadi kita punya suatu ruang vektor berdimensi V - Term-term adalah sumbu dari ruang tersebut Dokumen adalah titik-titik atau vektor di dalam ruang ini Berdimensi sangat tinggi: puluhan juta dimensi saat diterapkan pada suatu web search engine (jutaan dokumen) Ini merupakan vektor yang sangat sparse (jarang): sebagian besar entri bernilai nol.
28 Sec. 6.3 Query juga Menjadi Vektor Gagasan Kunci 1: Lakukan yang sama terhadap query: representasikan sebagai vektor dalam ruang tersebut Gagasan Kunci 2: Ranking dokumen sesuai dengan kedekatannya terhadap query di dalam ruang ini Proximity (kedekatan) = kemiripan antar vektor Proximity kebalikan dari jarak Ingat: Ini dilakukan karena kita ingin keluar dari model Boolean. Gantinya: Beri peringkat (ranking) lebih tinggi kepada dokumen yang lebih relevan, lebih rendah untuk dokumen yang kurang relevan.
29 Sec. 6.3 Merumuskan Kedekatan dalam Ruang Vektor Cara pertama: jarak antara dua titik ( = jarak antara titik ujung dari dua vektor) Euclidean distance? Euclidean distance merupakan gagasan yang kurang bagus karena Euclidean distance bernilai besar untuk vektor-vektor dengan selisih panjang sangat jauh.
30 Sec. 6.3 Mengapa Jarak adalah Gagasan Kurang Baik? Euclidean distance antara q dan d 2 adalah besar padahal distribusi term dalam query q dan distribusi term dalam dokumen d 2 sangat mirip.
31 Sec. 6.3 Menggunakan Sudut, Bukan Jarak Eksperimen gagasan: ambil suatu dokumen d dan tambahkan ke dirinya. Namakan dokumen ini sebagai d. Secara semantik d dan d mempunyai isi yang sama Euclidean distance antara dua dokumen ini menjadi sangat jauh Sudut antara dua dokumen ini adalah 0, sesuai dengan kemiripan maksimal. Gagasan kunci: Rankingkan dokumen-dokumen berdasarkan sudutnya dengan query.
32 Sec. 6.3 Dari Sudut ke Kosinus Dua kalimat berikut sama maknanya: Rankingkan dokumen dalam urutan MENURUN dari sudut antara query dan dokumen Rankingkan dokumen dalam urutan NAIK dari cosinus(query, dokumen) Kosinus adalah fungsi yang menurun secara monoton untuk interval [0 o, 180 o ]
33 Sec. 6.3 Dari Sudut ke Kosinus Tetapi bagaimana dan mengapa kita harus menghitung kosinus?
34 Sec. 6.3 Normalisasi Panjang Suatu vektor dapat dinormalisasikan (panjangnya) dengan membagi setiap komponennya dengan panjangnya digunakan norma L 2 : x 2 Pembagian suatu vektor dengan norma L 2 ini mengubahnya menjadi vektor satuan (panjang, pada permukaan dari unit hypersphere) Pengaruh pada dua dokumen d dan d (d yang ditambahkan ke dirinya dari slide sebelumnya): keduanya mempunyai vektor identic setelah normalisasi panjang. Sehingga dokumen panjang dan pendek mempunyai boot yang comparable. i x 2 i
35 cos(query, dokumen) V i i V i i V i i i d q q d d d q q d q d q d q ), cos( Dot product Vektor satuan q i adalah bobot tf-idf dari term i di dalam query d i adalah bobot tf-idf dari term i di dalam dokumen cos(q,d) adalah kemiripan cosinus dari q dan d atau sama dengan cosinus sudut antara q dan d. Sec. 6.3
36 Kosinus Vektor dengan Panjang Ternormalisasi Untuk vektor dengan panjang ternormalisasi, kemiripan kosinus adalah dot product (atau perkalian skalar): cos( q, d) q V d i 1 q d i i untuk q, d sudah ternormalisasi panjang. 36
37 Ilustrasi Kemiripan Cosinus 37
38 Sec. 6.3 Kemiripan Kosinus Antara 3 Dokumen Seberapa mirip novel-novel: SaS: Sense and Sensibility PaP: Pride and Prejudice WH: Wuthering Heights? term SaS PaP WH affection jealous gossip wuthering Frekuensi Term (jumlah) Catatan: untuk menyederhanakan contoh ini, tidak dilakukan pembobotan idf.
39 Sec. 6.3 Contoh 3 Dokumen (Lanj.) Pembobotan frekuensi Log term SaS PaP WH affection jealous gossip wuthering Setelah normalisasi panjang term SaS PaP WH affection jealous gossip wuthering cos(sas,pap) cos(sas,wh) 0.79 cos(pap,wh) 0.69 Mengapa diperoleh cos(sas,pap) > cos(sas,wh)?
40 Menghitung Skor Kosinus Sec. 6.3
41 Sec. 6.4 Varian Pembobotan tf-idf Kolom yang berjudul 'n' adalah akronim untuk skema bobot. Mengapa dasar log dalam idf tidak penting?
42 Sec. 6.4 Pembobotan Berbeda thd. Query vs. Dokumen Banyak search engines membolehkan pembobotan berbeda untuk query vs. dokumen Notasi SMART: merupakan kombinasi yang digunakan dalam suatu engine, dengan notasi ddd.qqq, menggunakan akronim dari tabel sebelumnya Skema pembobotan standard: lnc.ltc Dokumen: logarithmic tf (l sebagai karakter pertama), no idf dan normalisasi kosinus Query: logarithmic tf (l dalam kolom paling kiri), idf (t dalam kolom kedua), normalisasi kosinus Gagasan Kurang Bagus?
43 Sec. 6.4 Contoh tf-idf: lnc.ltc Dokumen: car insurance auto insurance Query: best car insurance Term Query Document Prod tf-raw tf-wt df idf wt n lize tf-raw tf-wt wt n lize auto best car insurance Latihan: Berapa N, jumlah dokumen? Panjang dokumen = Skor = = 0.8
44 Rangkuman: Pemeringkatan Ruang Vektor Merepresentasikan query sebagai suatu vector tf-idf berbobot Merepresentasikan setiap dokumen sebagai vector tf-idf berbobot Menghitung skor kemiripan kosinus antara vektor query dan setiap vektor dokumen Meranking (memeringkatkan) dokumen-dokumen sesuai dengan skornya terhadap query Mengembalikan top K (misal K = 10) kepada pengguna
45 Ch. 6 Referensi Kuliah Hari Ini IIR Tutorial pembobotan term dan kemiripan cosinus!
46 Latihan Ada 3 dokumen dalam koleksi: Document 1: The game of life is a game of everlasting learning Document 2: The unexamined life is not worth living Document 3: Never stop learning Dan terdapat query: Query: life learning Berapa dekat Q dengan D1, D2 dan D3 jika dihitung dengan cosine similarity? Seperti apa rangking yang hasilkan?
47 Langkah 1: Term Frequency (TF)
48 Normalized TF
49 Python: Perhitungan Normalized TF def termfrequency(term, document): normalizedocument = document.lower().split() return normalizedocument.count(term.lower()) / float(len(normalizedocument))
50 Langkah 2: Inverse Document Frequency (IDF) IDF(game) = 1 + log e (Jumlah total dokumen / Jumlah dokumen dengan term game di dalamnya) Total ada 3 dokumen = Document1, Document2, Document3 Term game hadir dalam Document1 IDF(game) = 1 + log e (3 / 1) = =
51
52 Python: Perhitungan IDF def inversedocumentfrequency(term, alldocuments): numdocumentswiththisterm = 0 for doc in alldocuments: if term.lower() in alldocuments[doc].lower().split(): numdocumentswiththisterm = numdocumentswiththisterm + 1 if numdocumentswiththisterm > 0: return log(float(len(alldocuments)) / numdocumentswiththisterm) else: return 1.0
53 Langkah 3: TF * IDF
54 Langkah 4: Cosine Similarity dalam VSM Cosine Similarity (d1, d2) = Dot product(d1, d2) / d1 * d2 Dot product (d1,d2) = d1[0] * d2[0] + d1[1] * d2[1] * * d1[n] * d2[n] d1 = square root(d1[0] 2 + d1[1] d1[n] 2 ) d2 = square root(d2[0] 2 + d2[1] d2[n] 2 )
55 TF*IDF Untuk Query
56 Cosine Similarity Query dan Document1
57 Cosine Similarity Q dengan Semua Dokumen
58 Cosine Similarity Q dengan Semua Dokumen
59 UTS: Ujian Tengah Semester Dokumen D 1 D 2 D 3 D 4 D 5 Isi Dokumen information retrieval students work hard hard-working information retrieval students take many classes the information retrieval workbook is well written the probabilistic model is an information retrieval paradigm the Boolean information retrieval model was the first to appear 1. Buat matriks kemunculan term dari 5 dokumen tersebut 2. Buat inverted index dari 5 dokumen tersebut. Struktur datanya harus mencantumkan frekuensi dokumen dan posisinya dalam dokumen tersebut 3. Jika ada Query: working in information retrieval, seperti apa rangking yang dikembalikan oleh perhitungan cosine similarity?
Sistem Temu-Kembali Informasi Perhitungan Kemiripan
Sistem Temu-Kembali Informasi Perhitungan Kemiripan (Pembobotan Term dan Penskoran dalam Model Ruang Vektor, Penskoran dalam Sistem Pencarian Lengkap) Husni Program Studi Teknik Informatika Universitas
Lebih terperinciText & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Parametric dan zone Index Sebuah dokumen, selain tersusun dari deretan term, juga
Lebih terperinciVECTOR SPACE MODEL. Tujuan 4/2/13. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model index berdasar pada bobot untuk binary retrieval model Memahami
Lebih terperinciDocument Indexing dan Term Weighting. M. Ali Fauzi
Document Indexing dan Term Weighting M. Ali Fauzi Document Indexing Setelah melakukan preprocessing, kita akan mendapatkan sebuah set term yang bisa kita jadikan sebagai indeks. Indeks adalah perwakilan
Lebih terperinciSistem Temu Kembali Informasi/ Information Retrieval
Sistem Temu Kembali Informasi/ Information Retrieval Pemodelan IR Imam Cholissodin S.Si., M.Kom. Table Of Content 1. Boolean Retrieval Model Boolean Index Inverted Index 2. Boolean Query Retrieval 3. Vector
Lebih terperinciSistem Temu-Kembali Informasi Perhitungan Kemiripan
Sistem Temu-Kembali Informasi Perhitungan Kemiripan (Pembobotan Term dan Penskoran dalam Model Ruang Vektor, Penskoran dalam Sistem Pencarian Lengkap) Husni Program Studi Teknik Informatika Universitas
Lebih terperinciContoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor
Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor Persoalan 1: Ada 4 dokumen (D1 s.d D4): D1: dolar naik harga naik penghasilan turun D2: harga naik harusnya gaji juga naik D3: Premium tidak
Lebih terperinciBAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciPemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi
Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami
Lebih terperinciINFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER
INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,
Lebih terperinciAplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)
Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System) IF3 Aljabar Geometri Oleh: Rinaldi Munir Program Studi Informatika, STEI-ITB Rinaldi Munir - IF3 Aljabar Geometri
Lebih terperinciRETRIEVAL STRATEGIES. Tujuan 4/9/13. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model probabilitistic retrieval dengan metode Simple Term Weights.
Lebih terperinciSISTEM TEMU KEMBALI INFORMASI
SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik
Lebih terperinciText & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model probabilitistic retrieval dengan metode Simple Term Weights.
Lebih terperinciTEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 3 MODEL IR Konsep IR Model IR Konsep Boolean Model Pemodelan IR Model IR Konsep Boolean Model Model IR didefinisikan sebagai empat komponen, yaitu:
Lebih terperinciIMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI
IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik
Lebih terperinciTEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 3 IR MODEL Mengapa Model? 1 Banyak pengembangan teknologi IR seperti web search, translator system, spam filter, dsb membutuhkan teori dan percobaan.
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &
Lebih terperincicommit to user BAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Cosine Similarity Secara umum, fungsi similarity adalah fungsi yang menerima dua buah objek dan mengembalikan nilai kemiripan (similarity) antara kedua objek
Lebih terperinciInformation Retrieval
Information Retrieval Budi Susanto Information Retrieval Information items content Feature extraction Structured Structured Document Document representation representation Retrieval model: relevance Similarity?
Lebih terperinciAnalisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem
Lebih terperinciTemu-Kembali Informasi 2017
Temu-Kembali Informasi 2017 02: Temu-Kembali Boolean Husni Husni@Trunojoyo.ac.id Modifikasi dari slide kuliah Stanford CS276 Temu-Kembali Informasi Information Retrieval Information Retrieval (IR) adalah
Lebih terperinciPERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY
Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik
Lebih terperinciAnalisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1 Tes Secara harfiah kata tes berasal dari kata bahasa prancis kuno: testum yang berarti piring untuk menyisihkan logam-logam mulia, dalam bahasa Indonesia diterjemahkan dengan
Lebih terperinciROCCHIO CLASSIFICATION
DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi
Lebih terperinciPengujian Kerelevanan Sistem Temu Kembali Informasi
Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem
Lebih terperinci1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah
1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari
Lebih terperinciRANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan
RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem
Lebih terperinciBAB II TINJAUAN PUSTAKA
digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter
Lebih terperinciV HASIL DAN PEMBAHASAN
22 V HASIL DAN PEMBAHASAN 5.1 Karakteristik Video dan Ektraksi Frame Video yang digunakan di dalam penelitian ini merupakan gabungan dari beberapa cuplikan video yang berbeda. Tujuan penggabungan beberapa
Lebih terperinciIMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN
Seminar Nasional Informatika 205 IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN Dedi Leman, Khusaeri Andesa 2 Teknik Informasi, Magister Komputer, Universitas
Lebih terperinciTEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK
F.13 TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK Bania Amburika 1*,Yulison Herry Chrisnanto 1, Wisnu Uriawan 2 1 Jurusan Informatika, Fakultas MIPA, Universitas
Lebih terperinciBAB II TINJAUAN PUSTAKA
7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan
Lebih terperinciPEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN
PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi
Lebih terperinciTEMU BALIK INFORMASI PADA DOKUMEN TEKS BERBAHASA INDONESIA DENGAN METODE VECTOR SPACE RETRIEVAL MODEL
TEMU BALIK INFORMASI PADA DOKUMEN TEKS BERBAHASA INDONESIA DENGAN METODE VECTOR SPACE RETRIEVAL MODEL Giat Karyono 1, Fandy Setyo Utomo 2 1 Program Studi Teknik Informatika, STMIK AMIKOM Purwokerto E-mail
Lebih terperinciIntegrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction
Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko
Lebih terperinciII TINJAUAN PUSTAKA. * adalah operasi konvolusi x dan y, adalah fungsi yang merepresentasikan citra output,
5 II INJAUAN PUSAKA.1 Fitur Scale Invariant Feature ransform (SIF) Fitur lokal ditentukan berdasarkan pada kemunculan sebuah objek pada lokasi tertentu di dalam frame. Fitur yang dimaksudkan haruslah bersifat
Lebih terperinciKOM341 Temu Kembali Informasi
KOM341 Temu Kembali Informasi KULIAH #4 Pemodelan IR Boolean model Vector space model Proses Temu-Kembali 1 Konsep IR Pemodelan IR o Model IR didefinisikan sebagai empat komponen [D, F, Q, R(q, d j )]
Lebih terperinciPENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL
Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Text Mining Text mining merupakan suatu teknologi untuk menemukan suatu pengetahuan yang berguna dalam suatu koleksi dokumen teks sehingga diperoleh tren, pola, atau kemiripan
Lebih terperinciSTBI Sistem Temu Balik Informasi Temu-Balik Boolean. Husni. Husni.trunojoyo.ac.id Komputasi.wordpress.
STBI-2011 Sistem Temu Balik Informasi 2011 Temu-Balik Boolean Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress.com Pemrolehan-Kembali Informasi Information Retrieval (IR) Pencarian
Lebih terperinciPemanfaatan Aljabar Vektor Pada Mesin Pencari
Pemanfaatan Aljabar Vektor Pada Mesin Pencari Anwar Ramadha 13514013 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Indonesia
Lebih terperinciPENDAHULUAN. 1.1 Latar Belakang
DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan
Lebih terperinciBAB 2 LANDASAN TEORI. membuat sebuah komputer dapat melakukan hal yang membutuhkan intelegensi
7 BAB 2 LANDASAN TEORI 2.1 Intelegensia Semu Intelegensia semu adalah bidang studi yang mempelajari bagaimana cara untuk membuat sebuah komputer dapat melakukan hal yang membutuhkan intelegensi ketika
Lebih terperinciInera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
IMPLEMENTASI MODEL RUANG VEKTOR SEBAGAI PENERJEMAH QUERY PADA CROSS-LANGUAGE INFORMATION RETRIEVAL SISTEM IMPLEMENTATION OF VECTOR SPACE MODEL AS QUERY TRANSLATION FOR CROSS-LANGUAGE INFORMATION RETRIEVAL
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciAPLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA
APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA Adhit Herwansyah Jurusan Sistem Informasi, Fakultas
Lebih terperinciPenerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi
Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:
Lebih terperinciImplementasi Generalized Vector Space Model Menggunakan WordNet
Implementasi Generalized Vector Space Model Menggunakan WordNet Adi Wibowo*, Andreas Handojo**, Charistian Widjaja*** Jurusan Teknik Informatika Fakultas Teknologi Industri, Universitas Kristen Petra E-Mail:
Lebih terperinciImplementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information
Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information Ratnadira Widyasari 13514025 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi
Lebih terperinciImplementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas
Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan
Lebih terperinciSISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak
SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF Muh. Alfarisi Ali¹, Moh. Hidayat Koniyo², Abd. Aziz Bouty³ ¹Mahasiswa Teknik Informatika Universitas
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan
Lebih terperinciAplikasi Pencarian Karya Tulis Ilmiah Berbasis Web Menggunakan Sistem Rekomendasi
Aplikasi Pencarian Karya Tulis Ilmiah Berbasis Web Menggunakan Sistem Rekomendasi Husni Program Studi Teknik Informatika, Universitas Trunojoyo Jl. Telang Raya PO BOX 2 Kamal, Bangkalan 69162 E-mail: husni@if.trunojoyo.ac.id
Lebih terperinciBAB II LANDASAN TEORI. karya rekam secara profesional dengan sistem yang baku guna memenuhi
BAB II LANDASAN TEORI 2.1 Perpustakaan Perpustakaan adalah institusi pengelola karya tulis, karya cetak, atau karya rekam secara profesional dengan sistem yang baku guna memenuhi kebutuhan pendidikan,
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Information Retrieval Stefan Buttcher, (MIT 2010) Information Retrieval System atau Sistem Temu Balik Informasi merupakan bagian dari computer science tentang pengambilan informasi
Lebih terperinciPERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency
PERSETUJUAI\ ARTIKEL ILMIAH Artikel ilmiah hasil penelitian mahasiswa: Nama NIM Mashar Eka Putra Dai 53 1409036 Program Studi S1-Sistem Informasi Jurusan Teknik Informatika Fakultas Teknik Judul Karya
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk
Lebih terperinciSISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR
SISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Pada Jurusan Teknik
Lebih terperinciBAB 3 ANALISA DAN PERANCANGAN
BAB 3 ANALISA AN PERANCANGAN 3.1 Gambaran Umum Pada masa sekarang ini, proses pencarian dokumen dalam web seperti Google, Yahoo, dan sebagainya dilakukan dengan menginput query yang diinginkan pada kotak
Lebih terperinciPerangkingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing
Wahib, Perangkingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing 83 Perangkingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing Aminul Wahib 1, Pasnur 2, Putu Praba Santika
Lebih terperinciPemanfaatan Permodelan Ruang Vektor untuk Pengecekan Kemiripan
Pemanfaatan Permodelan Ruang Vektor untuk Pengecekan Kemiripan Andri Hardono Hutama - 13514031 1 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian
Lebih terperinciFatkhul Amin Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang
45 Dinamika Teknik Januari IMPLEMENTASI SEARCH ENGINE (MESIN PENCARI) MENGGUNAKAN METODE VECTOR SPACE MODEL Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang Abstract Growth of Machine
Lebih terperinciPENCARIAN ALAMAT FASILITAS UMUM MENGGUNAKAN METODE VECTOR SPACE MODEL ( STUDI KASUS KOTA PEKANBARU ) TUGAS AKHIR
PENCARIAN ALAMAT FASILITAS UMUM MENGGUNAKAN METODE VECTOR SPACE MODEL ( STUDI KASUS KOTA PEKANBARU ) TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Pada Jurusan Teknik
Lebih terperinciBAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen
BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada era ini perkembangan teknologi informasi sangat pesat. Hal ini ditandai dengan semakin populernya penggunaan internet dan perangkat lunak komputer sebagai
Lebih terperinciJURNAL ITSMART Vol 4. No 2. Desember 2015 ISSN :
Analisis Perbandingan Metode Vector Space Model dan Weighted Tree Similarity dengan Cosine Similarity pada kasus Pencarian Informasi Pedoman Pengobatan Dasar di Puskesmas Viko Basmalah Wicaksono Jurusan
Lebih terperinciPROGRAM BANTU PEMILIHAN LAGU PUJIAN BERDASARKAN TEMA KEBAKTIAN DENGAN MENGGUNAKAN METODE COSINUS SIMILARITY Studi Kasus: GKI Ngupasan
PROGRAM BANTU PEMILIHAN LAGU PUJIAN BERDASARKAN TEMA KEBAKTIAN DENGAN MENGGUNAKAN METODE COSINUS SIMILARITY Studi Kasus: GKI Ngupasan Hanto Harianto Kristanto Abstrak Pertimbangan untuk menentukan lagu
Lebih terperinciSistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Lebih terperinciSistem Temu-Kembali Informasi Temu-Kembali Boolean
Sistem Temu-Kembali Informasi Temu-Kembali Boolean Husni Program Studi Teknik Informatika Universitas Trunojoyo Madura Semeter Gasal 2015-17 Sep. 2015 Boolean Retrieval: Outline Matriks dokumen-term Kebutuhan
Lebih terperinciText dan Web Mining - Budi Susanto TI UKDW 1 INDEXING. Budi Susanto
Text dan Web Mining - Budi Susanto TI UKDW 1 INDEXING Budi Susanto Text dan Web Mining - Budi Susanto TI UKDW 2 Tujuan Memaham pengertian dari information retrieval Memahami pembentukan struktur inverted
Lebih terperinciInformation Retrieval
Information Retrieval Selayang Pandang Husni.Trunojoyo.ac.id Bagian I Internet (Web) Mutakhir Apa itu Information Retrieval Representasi Teks dalam IR Model Temu-Kembali Boolean Model Ruang Vektor Retrieval
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciDETEKSI KEMIRIPAN TOPIK PROPOSAL JUDUL TUGAS AKHIR DAN SKRIPSI MENGGUNAKAN LATENT SEMANTIC ANALYSIS DI STMIK BUMIGORA MATARAM
DETEKSI KEMIRIPAN TOPIK PROPOSAL JUDUL TUGAS AKHIR DAN SKRIPSI MENGGUNAKAN LATENT SEMANTIC ANALYSIS DI STMIK BUMIGORA MATARAM I Putu Hariyadi 1, Hartarto Junaedi 2 (1) STMIK Bumigora Mataram, putu.hariyadi@stmikbumigora.ac.id
Lebih terperinciBAB V EKSPERIMEN TEXT CLASSIFICATION
BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan
Lebih terperinciIMPLEMENTASI VECTOR SPACE MODEL UNTUK PENCARIAN DOKUMEN
IMPLEMENTASI VECTOR SPACE MODEL UNTUK PENCARIAN DOKUMEN Abdul Azis Abdillah 1, Indra Bayu Muktyas 2 Program Studi Pendikan Matematika, STKIP Surya, Tangerang, Banten abdul.azis.a@stkipsurya.ac. 1, recobayu@gmail.com
Lebih terperinciBAB I. Pendahuluan. 1. Latar Belakang Masalah
BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan
Lebih terperincibeberapa tag-tag lain yang lebih spesifik di dalamnya.
metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista
Lebih terperinciBAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Di era globalisasi seperti sekarang ini, perkembangan teknologi komputer berpengaruh besar pada tingkat kebutuhan manusia di berbagai bidang seperti bidang
Lebih terperinciPENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM
Pengukuran Kemiripan Dokumen dengan Menggunakan Tools Gensim (Sekarwati dkk.) PENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM Kemal Ade Sekarwati 1*, Lintang Yuniar Banowosari 2, I Made Wiryana
Lebih terperinciPENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA
PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA Suprianto 1), Sunardi 2), Abdul Fadlil 3) 1 Sistem Informasi STMIK PPKIA Tarakanita Rahmawati 2,3 Magister Teknik Informatika Universitas
Lebih terperinciBAB III Landasan Teori
BAB III Landasan Teori 3.1 Sistem Rekomendasi Sistem rekomendasi merupakan suatu aplikasi untuk menyediakan dan merekomendasikan suatu item dalam membuat suatu keputusan yang diinginkan oleh pengguna (Ungkawa,
Lebih terperinciRecommender System di Perpustakaan Universitas Kristen Petra menggunakan Rocchio Relevance Feedback dan Cosine Similarity
Recommender System di Perpustakaan Universitas Kristen Petra menggunakan Rocchio Relevance Feedback dan Cosine Similarity Adi Wiboo, Andreas Handoo, Minardi Taliang adi@petra.ac.id, handoo@petra.ac.id,
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Document summarization adalah proses pengambilan teks dari sebuah dokumen dan membuat sebuah ringkasan yang mempunyai informasi yang lebih berguna bagi user
Lebih terperinciKeywords: information retrieval system, cosine similarity, mean average precision. Jurnal Ilmu Komputer - Volume 5 - No 2 September 2012
PENINGKAAN RELEVANSI HASIL PENCARIAN KAA KUNCI DENGAN PENERAPAN MODEL RUANG VEKOR PADA SISEM INFORMASI RUANG BACA DI JURUSAN ILMU KOMPUER UNIVERSIAS UDAYANA Ngurah Agus Sanjaya ER a, Agus Muliantara b,
Lebih terperinciSearch Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI
Search Engine Text Retrieval dan Image Retrieval YENI HERDIYENI 14 JUNI 2008 Search engine atau mesin pencari merupakan bagian dari teknologi inte rnet yang sangat penting untuk pencarian informasi. Dewasa
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.
Lebih terperinciSistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)
Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Wahyudi,MT Laboratorium Sistem Informasi Fakultas Sains dan Teknologi UINSUSKA RIAU Jl.HR.Subrantas KM.15
Lebih terperinciUNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI
UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester
Lebih terperinciBAB III PERANCANGAN APLIKASI & MEKANISME PEMBOBOTAN SICBI
BAB III PERANCANGAN APLIKASI & MEKANISME PEMBOBOTAN SICBI 3.1. KONSEP APLIKASI SIMPLE-O adalah aplikasi penilaian esai otomatis berbasis web yang dikembangkan di Indonesia, tepatnya di Departemen Teknik
Lebih terperinci