TEMU KEMBALI INFORMASI
|
|
- Inge Tedja
- 6 tahun lalu
- Tontonan:
Transkripsi
1 JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 4 TOLERANCE RETRIEVAL
2 Tugas Extended Boolean Pelajari Extended Boolean Mengapa dikembangkan model ini? Bagaimana prinsip dasar model ini? Bagaimana teknis komputasi model ini? Kerjakan soal pada Manning et al (2008) nomor 2.9, 6.8, 6.9, 6.10, 6.11, 6.19
3 Extended Boolean Extended Boolean Maka... Model Boolean yang baku tidak menghasilkan pemeringkatan dokumen Operator Boolean dalam model Boolean yang baku terlalu strict Dikembangkan model Boolean yang memungkinkan memberi pemeringkatan dokumen... extended Boolean Ada 3 model: 1 Mixed Min and Max (MMM) Model 2 Paice Model 3 P-norm Model
4 Extended Boolean Extended Boolean Diketahui matrik term-document: w 11 w w 1n w i1 w i2 w in w t1 w t2 w tn sedangkan w ij adalah bobot term i pada dokumen j, untuk i = 1, 2,..., t dan j = 1, 2,..., n
5 MMM Model Extended Boolean Misalkan terdapat query: Q OR = (T 1 or T 2 or... or T t ) Q AND = (T 1 and T 2 and... and T t ) Maka ukuran kemiripan dokumen j dengan query adalah: sim(q OR, j) = α max(w 1j, w 2j,..., w tj )+ (1 α) min(w 1j, w 2j,..., w tj ) sim(q AND, j) = β min(w 1j, w 2j,..., w tj )+ (1 β) max(w 1j, w 2j,..., w tj ) Hasil percobaan Lee & Fox (1988): nilai α > 0.2 dan β [0.5, 0.8]
6 Paice Model Extended Boolean Ukuran kemiripan dokumen j dengan query adalah: sim(q, j) = n i=1 ri 1 d i n i=1 ri 1 sedangkan d i adalah urutan menurun untuk query OR dan menaik untuk AND. Percobaan Lee & Fox (1988) menghasilkan nilai r yang optimum adalah 1.0 untuk query AND, dan 0.7 untuk query OR.
7 P-norm Model Extended Boolean Ukuran kemiripan dokumen j dengan query adalah: sim(q OR, j) = p w p 1j +wp 2j + +wp tj t sim(q AND, j) = 1 p (1 w 1j ) p +(1 w 2j ) p + +(1 w tj ) p Misal query Q = (T 1 and T 2 ) or T3, maka untuk p = 2, ukuran kemiripan Q dengan dokumen j adalah: ( ) 2 (1 w 1 1j ) 2 +(1 w 2j ) 2 + w 2 3j sim(q, j) = 2 t
8 Retrieval Retrieval Bagaimana metode matching antara term pada query dengan term pada inverted index (dictionaries)? terkait ekspansi query?
9 Phonetic Problem Retrieval
10 Retrieval Beberapa metode Retrieval: WordNet and Thesaurus Wildcard queries Spelling correction 1 Jarak edit (edit distance) 2 n-gram Phonetic Sangat situasional
11 Wildcard Queries Retrieval Mengapa Wildcard Queries?: User tidak tahu pasti spelling dari suatu term. Misalnya Sydney vs Sidney, University Stuttgart vs Universitet Stuttgard, etc. User khawatir pada sistem yang memiliki ragam spelling. Misalnya colour vs color, center vs centre, etc. User ingin mencari beberapa varian dari term. Misalnya pertanian, bertani, petani, dsb. Alternatif: Menggunakan wildcard queries, misalnya s*dney, universi* stuttg*, colo*r, etc. Menggunakan aturan RE. Misalnya [ a][mad$],
12 Spelling Correction Retrieval Bedanya dengan Wildcard Queries? User mengetik query, namun mungkin ada kesalahan. Misalnya Information Sistem Menggunakan teknik ekspansi query, artinya term pada query disempurnakan oleh sistem. : Memberi alternatif query pada user berupa term yang mirip. Ukuran kemiripan ditentukan dengan banyak metode, antara lain jarak edit dan n-gram.
13 n-gram Retrieval Berbasis karakter: Merupakan potongan n karakter dari suatu string (kata/term). Contoh: kata komputer Nama n-gram karakter uni-gram k,o,m,p,u,t,e,r bi-gram k,ko,om,mp,pu,ut,te,er,r tri-gram k, ko,kom,omp,mpu,put,ute,ter,er,r dst.
14 n-gram Retrieval Berbasis kata: Merupakan potongan n kata dari suatu kalimat. Contoh: musim kemarau, bogor mulai kering Nama uni-gram bi-gram dst. n-gram karakter musim, kemarau, bogor, mulai, kering musim kemarau, kemarau bogor, bogor mulai, mulai kering Dapat dikembangkan juga n-gram berbasis kalimat... antara lain digunakan dalam QAS (Question Answering System)
15 Ukuran Kemiripan Retrieval Misalkan S 1 dan S 2 adalah himpunan n-gram dari string 1 dan 2. Ukuran kemiripan dapat diukur dengan berbagai cara, antara lain menggunakan koefisien Jaccard, yaitu: J(S 1, S 2 ) = S 1 S 2 S 1 S 2 Contoh (bi-gram) kata achmad dan ahmad S achmad = { a, ac, ch, hm, ma, ad, d } S ahmad = { a, ah, hm, ma, ad, d } Maka: J(S achmad, S ahmad ) = 5 8 = 0.625
16 Jarak Edit Retrieval Pengukuran berdasarkan kesalahan ketik: (1) penyisipan, (2) penghilangan, (3) penukaran karakter Jarak edit (edit distance) sering dikenal sebagai Levenshtein distance. Misalkan S 1 dan S 2 adalah himpunan karakter dari string 1 dan 2. Jarak edit S 1 dan S 2 menggunakan dynamic programming algorithm sbb: Jika S 1 [i] = S 2 [j], maka: m[i, j] = min(m[i 1, j 1], m[i 1, j] + 1, m[i, j + 1] + 1) Jika S 1 [i] S 2 [j], maka: m[i, j] = min(m[i 1, j 1] + 1, m[i 1, j] + 1, m[i, j + 1] + 1)
17 Algoritme Jarak Edit Retrieval 1: m[i, j] 0 2: for i 1 to S 1 do 3: m[i, 0] i 4: end for 5: for j 1 to S 2 do 6: m[0, j] j 7: end for 8: for i 1 to S 1 do 9: for j 1 to S 2 do 10: m[i, j] = min(m[i 1, j 1] +X, m[i 1, j]+1, m[i, j+1]+1) 11: end for 12: end for 13: return m[ S 1, S 2 ]
18 Contoh Retrieval S 1 = {f, a, s, t} dan S 1 = {c, a, t, s} Jarak edit S 1 dan S 2 adalah 3.
19 Phonetic Correction Retrieval Pengukuran berdasarkan kemiripan bunyi pengucapan. Menggunakan algoritme Soundex, mengubah string menjadi 4 karakter dengan aturan: 1 Ambil karakter pertama 2 Ubah setiap karakter menjadi angka dengan aturan sbb: A, E, I, O, U, H, W, Y 0. B, F, P, V 1. C, G, J, K, Q, S, X, Z 2. D,T 3. L 4. M, N 5. R 6. 3 Ubah angka sama bersebelahan menjadi satu angka 4 Hapus semua angka 0
20 Implementasi dalam IR Retrieval
TEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 3 IR MODEL Mengapa Model? 1 Banyak pengembangan teknologi IR seperti web search, translator system, spam filter, dsb membutuhkan teori dan percobaan.
Lebih terperinciTEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 3 MODEL IR Konsep IR Model IR Konsep Boolean Model Pemodelan IR Model IR Konsep Boolean Model Model IR didefinisikan sebagai empat komponen, yaitu:
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.
Lebih terperinciKOREKSI EJAAN QUERY BAHASA INDONESIA MENGGUNAKAN ALGORITME DAMERAU LEVENSHTEIN
KOREKSI EJAAN QUERY BAHASA INDONESIA MENGGUNAKAN ALGORITME DAMERAU LEVENSHTEIN Utis Sutisna 1), Julio Adisantoso 2) 1,2 Departemen Ilmu Komputer, Institut Pertanian Bogor Kampus Darmaga, Wing 20 Level
Lebih terperinciKONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431
KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :
Lebih terperinciOPTIMASI QUERY UNTUK PENCARIAN DATA MENGGUNAKAN PENGURAIAN KALIMAT DAN ALGORITME LEVENSHTEIN DISTANCE
OPTIMASI QUERY UNTUK PENCARIAN DATA MENGGUNAKAN PENGURAIAN KALIMAT DAN ALGORITME LEVENSHTEIN DISTANCE M. El Bahar Conoras 1, Aprian Dwi Kurnawan 2 1,2 Magister Teknik Informatika, UNIVERSITAS AMIKOM YOGYAKARTA
Lebih terperinciImplementasi Pencocokan String Tidak Eksak dengan Algoritma Program Dinamis
Implementasi Pencocokan String Tidak Eksak dengan Algoritma Program Dinamis Samudra Harapan Bekti 13508075 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,
Lebih terperinciRETRIEVAL STRATEGIES. Tujuan 4/9/13. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model probabilitistic retrieval dengan metode Simple Term Weights.
Lebih terperinciInformation Retrieval
Information Retrieval Budi Susanto Information Retrieval Information items content Feature extraction Structured Structured Document Document representation representation Retrieval model: relevance Similarity?
Lebih terperinciIMPLEMENTASI ALGORITMA CAVERPHONE 2.0 UNTUK PENCARIAN KATA BERDASARKAN KEMIRIPAN PENGUCAPAN PADA APLIKASI KAMUS INGGRIS- INDONESIA
IMPLEMENTASI ALGORITMA CAVERPHONE 2.0 UNTUK PENCARIAN KATA BERDASARKAN KEMIRIPAN PENGUCAPAN PADA APLIKASI KAMUS INGGRIS- INDONESIA Andreas Tommy Christiawan, Arief Andy Soebroto, Achmad Ridok Prodi Teknik
Lebih terperinciRata-rata token unik tiap dokumen
Percobaan Tujuan percobaan ini adalah untuk mengetahui kinerja algoritme pengoreksian ejaan Damerau Levenshtein. Akan dilihat apakah algoritme tersebut dapat memberikan usulan kata yang cukup baik untuk
Lebih terperinciSaintek Vol 5, No 2 Tahun 2010 ANALISIS EDIT DISTANCE MENGGUNAKAN ALGORITMA DYNAMIC PROGRAMMING. Arip Mulyanto
Saintek Vol 5, No 2 Tahun 2010 ANALISIS EDIT DISTANCE MENGGUNAKAN ALGORITMA DYNAMIC PROGRAMMING Arip Mulyanto Fakultas Teknik Universita Negeri Gorontalo Abstract Edit distance merupakan jumlah minimum
Lebih terperinciText & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model probabilitistic retrieval dengan metode Simple Term Weights.
Lebih terperinciUNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI
UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester
Lebih terperinciText dan Web Mining - Budi Susanto TI UKDW 1 INDEXING. Budi Susanto
Text dan Web Mining - Budi Susanto TI UKDW 1 INDEXING Budi Susanto Text dan Web Mining - Budi Susanto TI UKDW 2 Tujuan Memaham pengertian dari information retrieval Memahami pembentukan struktur inverted
Lebih terperinciPENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI
PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciTEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 1 Identitas Mata Kuliah Nama Mata Kuliah : Temu Kembali Informasi (TKI) Information Retrieval (IR) Kode Mata Kuliah : KOM431 Koordinator : Julio
Lebih terperinciSISTEM PENGKOREKSIAN KATA KUNCI DENGAN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Studi Kasus Pada Website Universitas Halmahera.
SISTEM PENGKOREKSIAN KATA KUNCI DENGAN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Studi Kasus Pada Website Universitas Halmahera Oleh : Benisius Sejumlah penelitian terhadap mesin pencari (search engine)
Lebih terperinciCROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU
CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciINDEXING. Tujuan 4/2/13. Budi Susanto (v1.01)
Text dan Web Mining - Budi Susanto TI UKDW 1 INDEXING Budi Susanto (v1.01) Text dan Web Mining - Budi Susanto TI UKDW 2 Tujuan Memaham pengertian dari information retrieval Memahami pembentukan struktur
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #9 Text Clustering (Ch.16 & 17) Clustering Pengelompokan, penggerombolan Proses pengelompokan sekumpulan obyek ke dalam kelas-kelas obyek yang memiliki sifat sama.
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1. Information Retrieval System 2.1.1. Pengertian Information Retrieval System Information retrieval system merupakan bagian dari bidang ilmu komputer yang bertujuan untuk pengambilan
Lebih terperinciBAB I PENDAHULUAN Latar belakang
BAB I PENDAHULUAN Bab ini membahas mengenai garis besar Tugas Akhir yang meliputi latar belakang, tujuan, rumusan dan batasan masalah, metodologi pembuatan tugas akhir, dan sistematika penulisan laporan.
Lebih terperinciPENGEMBANGAN ALGORITMA SOUNDEX PADA SPELL CHECKER BAHASA INDONESIA
PENGEMBANGAN ALGORITMA SOUNDEX PADA SPELL CHECKER BAHASA INDONESIA Ika Purwanti Ningrum 1, Muh. Yamin 2, Samsul 3 (1) Jurusan Teknik Informatika, Fakultas Teknik, UHO, (Contact : 081328806820, ika.purwanti.n@gmail.com)
Lebih terperinciBAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciROCCHIO CLASSIFICATION
DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi
Lebih terperinciSISTEM TEMU KEMBALI INFORMASI
SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik
Lebih terperinciAPLIKASI PERBAIKAN EJAAN PADA KARYA TULIS ILMIAH DI PROGRAM STUDI TEKNIK INFORMATIKA DENGAN MENERAPKAN ALGORITMA LEVENSHTEIN DISTANCE
APLIKASI PERBAIKAN EJAAN PADA KARYA TULIS ILMIAH DI PROGRAM STUDI TEKNIK INFORMATIKA DENGAN MENERAPKAN ALGORITMA LEVENSHTEIN DISTANCE SKRIPSI Diajukan Untuk Penulisan Skripsi Guna Memenuhi Salah Satu Syarat
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem
Lebih terperinciDesign and Analysis Algorithm
Design and Analysis Algorithm Pertemuan 05 Drs. Achmad Ridok M.Kom Imam Cholissodin, S.Si., M.Kom M. Ali Fauzi, S.Kom., M.Kom. Ratih Kartika Dewi, ST, M.Kom 1 Contents 31 1.1 Algoritma Brute Force Exhaustive
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Berawal dari sebuah disiplin ilmu informatika yang mempelajari transformasi bantalan fakta bahwa data dan informasi tentang komputasi berbasis mesin. Disiplin ini mencakup
Lebih terperinciSISTEM KOREKSI KESALAHAN PENGETIKAN MENGGUNAKAN LEVENSHTEIN DISTANCE PADA LAYOUT QWERTY
SISTEM KOREKSI KESALAHAN PENGETIKAN MENGGUNAKAN LEVENSHTEIN DISTANCE PADA LAYOUT QWERTY Aloysius Langgeng Adiasto 1, Wina Witanti 2, Rezki Yuniarti 3 Jurusan Informatika, Fakultas Matematika dan Ilmu Pengetahuan
Lebih terperinciSISTEM TEMU KEMBALI NAMA ILMIAH DENGAN MENGGUNAKAN ALGORITME FONETIK WAHYU DIAS HARSOWIYONO
SISTEM TEMU KEMBALI NAMA ILMIAH DENGAN MENGGUNAKAN ALGORITME FONETIK WAHYU DIAS HARSOWIYONO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN
Lebih terperinciJURNAL TEKNIK POMITS Vol. 1, No. 1, (2013) 1-5 1
JURNAL TEKNIK POMITS Vol. 1, No. 1, (2013) 1-5 1 Pembangunan Aplikasi Penghilangan Duplikasi Data Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) Menggunakan Algoritma Pencocokan String Berbasis
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #8 Text Classification (Manning, Ch.13, p.288/253) Ad Hoc Retrieval vs Standing Query User mencari informasi dengan memberikan satu atau lebih query terhadap koleksi
Lebih terperinciRANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan
RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal
Lebih terperinciKOM341 Temu Kembali Informasi
KOM341 Temu Kembali Informasi KULIAH #1 Kontrak Perkuliahan Pendahuluan Matakuliah o Nama Matakuliah : Temu Kembali Informasi o Kode Matakuliah : KOM431 o Beban Kredit : 3(3-0) o Semester : Gasal, 2014/2015
Lebih terperinciAlgoritme Pencocokan String (String Matching) Menurut Black (2016), string adalah susunan dari karakter-karakter (angka, alfabet, atau karakte
II KAJIAN PUSTAKA 2! KAJIAN PUSTAKA 2.1! Ejaan Bahasa Indonesia Ejaan menurut Kamus Besar Bahasa Indonesia (2016) adalah kaidah cara menggambarkan bunyi-bunyi (kata, kalimat, dan sebagainya) dalam tulisan
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciImplementasi Algoritma Levenshtein Pada Sistem Pencarian Judul Skripsi/Tugas Akhir
46 JURNAL SISTEM DAN INFORMATIKA Implementasi Algoritma Levenshtein Pada Sistem Pencarian Judul Skripsi/Tugas Akhir Ida Bagus Ketut Surya Arnawa STIKOM Bali Jl.Raya Puputan No. 86 Renon, Denpasar-Bali
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan
Lebih terperinciInera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
IMPLEMENTASI MODEL RUANG VEKTOR SEBAGAI PENERJEMAH QUERY PADA CROSS-LANGUAGE INFORMATION RETRIEVAL SISTEM IMPLEMENTATION OF VECTOR SPACE MODEL AS QUERY TRANSLATION FOR CROSS-LANGUAGE INFORMATION RETRIEVAL
Lebih terperinciPROGRAM APLIKASI EDITOR KATA BAHASA INDONESIA MENGGUNAKAN METODE APPROXIMATE STRING MATCHING DENGAN ALGORITMA LEVENSHTEIN DISTANCE BERBASIS JAVA
PROGRAM APLIKASI EDITOR KATA BAHASA INDONESIA MENGGUNAKAN METODE APPROXIMATE STRING MATCHING DENGAN ALGORITMA LEVENSHTEIN DISTANCE BERBASIS JAVA Dewi Rokhmah Pyriana, Suprapto,ST.,MT.,Aswin Suharsono,ST.,MT.
Lebih terperinciAPLIKASI PERBAIKAN EJAAN PADA KARYA TULIS ILMIAH DIPROGRAM STUDI TEKNIK INFORMATIKA DENGAN MENERAPKAN ALGORITMA LEVENSHTEIN DISTANCE
APLIKASI PERBAIKAN EJAAN PADA KARYA TULIS ILMIAH DIPROGRAM STUDI TEKNIK INFORMATIKA DENGAN MENERAPKAN ALGORITMA LEVENSHTEIN DISTANCE Roby Nur Hamzah Artikel Skripsi Universitas Nusantara PGRI Kediri Di
Lebih terperinciSistem Temu-Kembali Informasi Perhitungan Kemiripan
Sistem Temu-Kembali Informasi Perhitungan Kemiripan (Pembobotan Term dan Penskoran dalam Model Ruang Vektor, Penskoran dalam Sistem Pencarian Lengkap) Husni Program Studi Teknik Informatika Universitas
Lebih terperinciStudi Perbandingan Algoritma Pencarian String dalam Metode Approximate String Matching untuk Identifikasi Kesalahan Pengetikan Teks
Rochmawati, Studi Perbandingan Algoritma Pencarian String dalam Metode Approximate String Matching untuk Identifikasi Kesalahan... 125 Studi Perbandingan Algoritma Pencarian String dalam Metode Approximate
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Kemajuan teknologi informasi dan komunikasi tidak hanya membawa dampak positif, tetapi juga membawa dampak negatif, salah satunya adalah tindakan plagiarisme (Kharisman,
Lebih terperinciPENDEKATAN KUANTITATIF UNTUK PENELlJSURAN INFORMASI
Forum M k a dan Kompubrsi, Agudus 1996, p:24-29 ISSN 0853-8115 Vd. 2, No. 1 PENDEKATAN KUANTITATIF UNTUK PENELlJSURAN INFORMASI Julio Adisantoso ') RINGKASAN A.iakalah ini menelaah tiga model kuantitatif
Lebih terperinciPenerapan Algoritma Boyer Moore-Dynamic Programming untuk Layanan Auto-Complete dan Auto-Correct
Penerapan Algoritma Boyer Moore-Dynamic Programming untuk Layanan Auto-Complete dan Auto-Correct Christabella Chiquita B. - 13509050 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika
Lebih terperinciDETEKSI SIMILARITAS DOKUMEN ABSTRAK TUGAS AKHIR MENGGUNAKAN METODE LEVENSHTEIN DISTANCE
DETEKSI SIMILARITAS DOKUMEN ABSTRAK TUGAS AKHIR MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Abdul Najib 1), Karyo Budi Utomo 2) 1), 2) Jurusan Teknologi Informasi, Politeknik Negeri Samarinda Email: abdulnajib@polnes.ac.id
Lebih terperinciUKDW BAB 1 PENDAHULUAN Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Saat ini banyak metode pembelajaran yang bisa diterapkan untuk menambah ilmu pengetahuan seseorang. Salah satu metode pembelajaran yang bisa dilakukan yaitu
Lebih terperinciPERBAIKAN METODE JARO WINKLER DISTANCE UNTUK APPROXIMATE STRING SEARCH MENGGUNAKAN DATA TERINDEKS APLIKASI MULTI USER
PERBAIKAN METODE JARO WINKLER DISTANCE UNTUK APPROXIMATE STRING SEARCH MENGGUNAKAN DATA TERINDEKS APLIKASI MULTI USER Friendly 1* 1 Politeknik Negeri Medan *Email: friendly@polmed.ac.id METODE PENCARIAN
Lebih terperinciHASIL DAN PEMBAHASAN. Praproses
5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk
Lebih terperinciJurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 6, Juni 2017, hlm. 498-506 http://j-ptiik.ub.ac.id Deteksi Kesalahan Ejaan dan Penentuan Rekomendasi Koreksi Kata
Lebih terperinciTEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH
TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING
Lebih terperinciPENERAPAN FUZZY STRING MATCHING
PENERAPAN FUZZY STRING MATCHING PADA APLIKASI PENCARIAN TUGAS AKHIR MAHASISWA JURUSAN SISTEM INFORMASI BERBASIS WEB (Studi Kasus: Fakultas Sains dan Teknologi UIN Suska Riau) 1 Ardi Isbad Amar Gurning,
Lebih terperinciIdentifikasi Kesalahan Penulisan Kata (Typographical Error) pada Dokumen Berbahasa Indonesia Menggunakan Metode N-gram dan Levenshtein Distance
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No., Januari 208, hlm. 53-62 http://j-ptiik.ub.ac.id Identifikasi Kesalahan Penulisan Kata (Typographical Error) pada
Lebih terperinciKOM341 Temu Kembali Informasi
KOM341 Temu Kembali Informasi KULIAH #4 Pemodelan IR Boolean model Vector space model Proses Temu-Kembali 1 Konsep IR Pemodelan IR o Model IR didefinisikan sebagai empat komponen [D, F, Q, R(q, d j )]
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami
Lebih terperinciPENGUJIAN ALGORITMA LEVENSHTEIN DISTANCE DAN ALGORITMA TERM FREQUENCY INVERSE DOCUMENT FREQUNECY (TF-IDF) UNTUK PENILAIAN JAWABAN ESAI
PENGUJIAN ALGORITMA LEVENSHTEIN DISTANCE DAN ALGORITMA TERM FREQUENCY INVERSE DOCUMENT FREQUNECY (TF-IDF) UNTUK PENILAIAN JAWABAN ESAI Supandi Nangili 1, Abd.Aziz Bouty 2 Tajuddin Abdillah 3 1 Mahasiswa
Lebih terperinciVECTOR SPACE MODEL. Tujuan 4/2/13. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model index berdasar pada bobot untuk binary retrieval model Memahami
Lebih terperinciTEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 2 PEMROSESAN TEKS dan INVERTED INDEX Pokok Bahasan Diskusi Tugas 1 Apa yang dimaksud dengan Analisis Teks secara Otomatis? 2 Apa ide dari Luhn, dan
Lebih terperinciBAB 2 MODEL PERSOALAN LOKASI FASILITAS BERKAPASITAS
BAB 2 MODEL PERSOALAN LOKASI FASILITAS BERKAPASITAS 2.1 Pengertian Lokasi Fasilitas Pemilihan suatu lokasi merupakan hal yang sangat penting, karena faktor biaya dipengaruhi oleh fasilitas yang akan di
Lebih terperinciSistem Temu Kembali Informasi/ Information Retrieval
Sistem Temu Kembali Informasi/ Information Retrieval Pemodelan IR Imam Cholissodin S.Si., M.Kom. Table Of Content 1. Boolean Retrieval Model Boolean Index Inverted Index 2. Boolean Query Retrieval 3. Vector
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Perkembangan teknologi sudah dirasakan penting oleh manusia dalam era globalisasi saat ini. Hal itu terjadi karena kemajuan teknologi yang ada tidak dapat dipisahkan
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Infrmasi Prses Temu-Kembali KULIAH #6 Relevance feedback Query epansin 2 Cnth regan Relevance feedback: user memberi feedback pada dkumen hasil yang dianggap relevan User memberikan
Lebih terperinciPERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR
PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 1 PERBANDINGAN
Lebih terperinciBAB II LANDASAN TEORI. karya rekam secara profesional dengan sistem yang baku guna memenuhi
BAB II LANDASAN TEORI 2.1 Perpustakaan Perpustakaan adalah institusi pengelola karya tulis, karya cetak, atau karya rekam secara profesional dengan sistem yang baku guna memenuhi kebutuhan pendidikan,
Lebih terperinciBab III Analisis Sistem
IV. Bab III Analisis Sistem IV.1 Deskripsi Umum Sistem Dalam penelitian ini penulis mengemukakan sistem CBIR yang diberi nama SPECKTRAL (Sistem Pencari Citra dengan Kode Fraktal). Sistem ini dikembangkan
Lebih terperinciPenerapan Berbagai Teknik Sistem Temu-Kembali Informasi Berbasis Hiperteks
Penerapan Berbagai Teknik Sistem Temu-Kembali Informasi Berbasis Hiperteks Zainal A. Hasibuan zhasibua@caplin.cs.ui.ac.id Yofi Andri yofi298@puspa.cs.ui.ac.id Fakultas Ilmu Komputer Universitas Indonesia
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #1 Kontrak Perkuliahan Pendahuluan Matakuliah Nama Matakuliah : Temu Kembali Informasi Kode Matakuliah : KOM431 Beban Kredit : 3(3-0) Semester : Gasal, 2009/2010 Koordinator
Lebih terperinciPEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN
PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi
Lebih terperinciPenerapan Algoritma Program Dinamis Dalam Fitur Koreksi Kata Otomatis Pada Aplikasi Pesan
Penerapan Algoritma Program Dinamis Dalam Fitur Koreksi Kata Otomatis Pada Aplikasi Pesan Alif Raditya Rochman (13511013) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1 Tes Secara harfiah kata tes berasal dari kata bahasa prancis kuno: testum yang berarti piring untuk menyisihkan logam-logam mulia, dalam bahasa Indonesia diterjemahkan dengan
Lebih terperinciBAB I PENDAHULUAN. karya tulis. Berbagai aplikasi seperti Ms. Word, Notepad, maupun Open Office
BAB I PENDAHULUAN 1.1 Latar Belakang Seiring dengan perkembangan teknologi, maka kegunaan komputer dirasa makin besar. Komputer berperan penting dalam mempermudah pekerjaan sehari hari. Salah satu manfaat
Lebih terperinciFM-UDINUS-BM-08-04/R0 SILABUS MATAKULIAH. Silabus: Information Retrieval Hal: 1 dari 5. Revisi : - Tanggal Berlaku : Januari 2015
SILABUS MATAKULIAH Revisi : - Tanggal Berlaku : Januari 2015 A. Identitas 1. Nama Matakuliah : A11. 54823 / 2. Program Studi : Teknik Informatika-S1 3. Fakultas : Ilmu Komputer 4. Bobot sks : 3 SKS 5.
Lebih terperinciKSI B ~ M.S. WULANDARI
1 MODUL II : QUERY Pengertian Query Query artinya pertanyaan atau penyelidikan. Dalam database, query adalah permintaan akan kumpulan data tertentu. Jenis-jenis query 1. Select query Select query digunakan
Lebih terperinciMAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA
MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA Aida Indriani ) ) Teknik Informatika STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso 8, Tarakan 77 Email
Lebih terperinciPenerapan String Suggestion dengan Algoritma Levenshtein Distance dan Alternatif Algoritma Lain dalam Aplikasi
Penerapan String Suggestion dengan Algoritma Levenshtein Distance dan Alternatif Algoritma Lain dalam Aplikasi Fatardhi Rizky Andhika 13508092 Program Studi Teknik Informatika Sekolah Teknik Elektro dan
Lebih terperinciDesign and Analysis Algorithm. Ahmad Afif Supianto, S.Si., M.Kom. Pertemuan 05
Design and Analysis Algorithm Ahmad Afif Supianto, S.Si., M.Kom Pertemuan 05 Contents 31 2 3 Brute Force Algorithm 2 Exhaustive Search Teknik Heuristik 2 Algoritma Brute Force 2 3 Pencocokan String (String
Lebih terperinciSISTEM PENCARIAN PASAL-PASAL TINDAK PIDANA PELANGGARAN BERDASARKAN KUHP DENGAN METODE STRING MATCHING BOYER-MOORE SKRIPSI
SISTEM PENCARIAN PASAL-PASAL TINDAK PIDANA PELANGGARAN BERDASARKAN KUHP DENGAN METODE STRING MATCHING BOYER-MOORE SKRIPSI Diajukan Untuk Memenuhi Sebagai Persyaratan Dalam Memperoleh Gelar Sarjana Komputer
Lebih terperinciII. TEORI DASAR. Kata Kunci levenshtein; program dinamis; edit distance; twitter
Aplikasi Program Dinamis dalam Menoleransi Kata Kunci dengan Algoritma untuk Disposisi Tweets ke Dinas-Dinas dan Instansi di Bawah Pemerintah Kota Bandung Ade Yusuf Rahardian - 151079 Program Studi Teknik
Lebih terperinciAlgoritma Evolusi Real-Coded GA (RCGA)
Algoritma Evolusi Real-Coded GA (RCGA) Imam Cholissodin imam.cholissodin@gmail.com Pokok Bahasan 1. Siklus RCGA 2. Alternatif Operator Reproduksi pada Pengkodean Real 3. Alternatif Operator Seleksi 4.
Lebih terperinciBAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan
Lebih terperinciText & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Parametric dan zone Index Sebuah dokumen, selain tersusun dari deretan term, juga
Lebih terperinciSistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient
Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,
Lebih terperinciGambar 15 Contoh pembagian citra di dalam sistem segmentasi.
dalam contoh ini variance bernilai 2000 I p I t 2 = (200-150) 2 + (150-180) 2 + (250-120) I p I t 2 = 28400. D p (t) = exp(-28400/2*2000) D p (t) = 8.251 x 10-4. Untuk bobot t-link {p, t} dengan p merupakan
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciAPLIKASI WEB PENGUJIAN KESERUPAAN XML DENGAN METODA EDIT DISTANCE
APLIKASI WEB PENGUJIAN KESERUPAAN XML DENGAN METODA EDIT DISTANCE 1 Heni Novianti 2 Lintang Yuniar Banowosari. 1,2 Universitas Gunadarma Jl. Margonda Raya No. 100 Pondok Cina Depok Indonesia cowzy_heni@yahoo.com,
Lebih terperinciDeteksi Kemiripan Kode Program dengan Metode Preprocessing dan Penghitungan Levenshtein Distance
Deteksi Kemiripan Kode Program dengan Metode Preprocessing dan Penghitungan Levenshtein Distance Abstrak Dani 1, Timotius Grady Limandra 2, Lie Roberto Eliantono Adiseputra 3 Program Studi Informatika
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1. Pengertian Aplikasi Berbasis Web Aplikasi merupakan program yang berisikan perintah-perintah untuk melakukan pengolahan data. Secara umum, aplikasi adalah suatu proses dari cara
Lebih terperinciPENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL
Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,
Lebih terperinciPenerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi
Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:
Lebih terperinciSistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)
Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Wahyudi,MT Laboratorium Sistem Informasi Fakultas Sains dan Teknologi UINSUSKA RIAU Jl.HR.Subrantas KM.15
Lebih terperinciPenerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia
Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas
Lebih terperinciBAB II TINJAUAN PUSTAKA
digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter
Lebih terperinciTEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA
TEMU-KEMBALI MODEL EXTENDED BOOLEAN MENGGUNAKAN P-NORM MODEL DAN BELIEF REVISION DEVI DIAN PRAMANA PUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang teori-teori dan konsep dasar yang mendukung pembahasan dari sistem yang akan dibuat. 2.1. Katalog Perpustakaan Katalog perpustakaan merupakan suatu
Lebih terperinci