EVALUASI SISTEM TEMU KEMBALI INFORMASI MODEL RUANG VEKTOR DENGAN PENDEKATAN USER JUDGEMENT

Ukuran: px
Mulai penontonan dengan halaman:

Download "EVALUASI SISTEM TEMU KEMBALI INFORMASI MODEL RUANG VEKTOR DENGAN PENDEKATAN USER JUDGEMENT"

Transkripsi

1 J. Sains MIPA, Desember 2010, Vol. 16, No. 3, Hal.: ISSN EVALUASI SISTEM TEMU KEMBALI INFORMASI MODEL RUANG VEKTOR DENGAN PENDEKATAN USER JUDGEMENT Didik Kurniawan Jurusan Matematika Program Studi Ilmu Komputer FMIPA Universitas Lampung ABSTACT The performance measure of a back-finding system usually determined by precision values, recall, fallout, F-measure, precision averages, precision mean and some other assesments. This research take a difference perspective to those mentioned method, i.e. by evaluating the system based on the user perspective. By analyzing the interaction between the users against system on a back-finding system, the information is build with vector space model indicated that the model satisfy the users toward the information needed by the back-finding system which is marked by the system is able to recover the document deemed relevant by the users in the sequence above the average score of the recalled document. Keywords: information back-finding system, uses interaction ABSTAK Ukuran performansi suatu sistem temu kembali informasi biasanya ditentukan oleh nilai-nilai presisi, recall, fall-out, F-messure, rata-rata presisi, nilai tengah rata-rata presisi dan beberapa penilaian lainnya. Penelitian ini mengambil sudut pandang berbeda dengan metode pengukuran tersebut, yaitu dengan melakukan evaluasi sistem dari sudut pandang pengguna. Dengan melakukan analisis interaksi pengguna terhadap sistem pada suatu sistem temu kembali informasi yang dibangun dengan model ruang vektor didapatkan bahwa model ini dapat memenuhi kebutuhan penguna akan informasi yang diinginkan dari sistem temu kembali informasi ditandai dengan sistem dapat mengembalikan dokumen yang dianggap relevan oleh pengguna pada urutan di atas rata-rata score dokumen yang direcall. Kata kunci: sistem temu kembali informasi, interaksi pengguna 1. PENDAHULUAN Secara teoritis sistem temu kembali informasi atau information retrieval merupakan cabang ilmu yang menfokuskan pada pencarian atau menemukan dokumen relevan sesuai dengan permintaan user terhadap kumpulan dokumen yang kompleks 1-4). Salah satu aplikasi umum dari sistem temu kembali informasi adalah mesin pencari (search engine) yang terdapat di internet. Pengguna dapat mencari halaman-halaman web yang dibutuhkan melalui mesin tersebut. Ukuran performansi suatu sistem temu kembali informasi ditentukan oleh nilai-nilai presisi, recall, fallout, F-messure, rata-rata presisi, nilai tengah rata-rata presisi dan beberapa penilaian lainnya. Akan tetapi dalam penelirian ini tidak akan membahas tentang performansi kinerja sistem terhadap nilai-nilai pengukuran tersebut, akan tetapi lebih memfokuskan pada evaluasi sistem berdasarkan persepsi dari pengguna, dengan melakukan user judgement terhadap informasi yang dikembalikan oleh sistem berdasarkan kueri yang dimasukan. Model-model sistem temu kembali informasi secara garis besar dibagi menjadi empat kategori, yaitu set theoritic models, algebraic models, probabilistic models dan machine learned ranking models. Pada penelitian dilakukan evaluasi terhadap model ruang vektor yang merupakan salah satu dari algebraic models. Model ini dipilih dengan beberapa pertimbangan, diantaranya 5) : - Model sederhana yang berdasarkan aljabar linear - Pengembalian informasi berdasarkan pembobotan term bukan binari - Memungkinkan penghitungan tingkat kemiripan kueri dan dokumen secara kontinu - Memungkinkan perangkingan dokumen sesuai dengan tingkat relevansinya - Memungkinkan untuk melakukan pencocokan sebagian FMIPA Universitas Lampung 155

2 Didik Kurniawan... Evaluasi Sistem Temu Kembali Informasi Model Ruang Vektor Tujuan melakukan penelitian ini adalah untuk mengetahui apakah informasi yang dikembalikan oleh sistem temu kembali informasi dengan menggunakan model ruang vektor dapat merangkingkan dokumen sesuai tingkat relevansinya berdasarkan persepsi pengguna. Selain itu juga dalam penelitian ini dilakukan analsisis interaksi pengguna terhadap sistem temu kembali informasi, tujuan dari analisis ini adalah menilai pengaruh model yang digunakan oleh sistem terhadap persepsi pengguna terhadap sistem. Dengan melakukan penilaian yang dilakukan oleh pengguna, nantinya akan diketahui performansi sebuah sistem temu kembali informasi, yang dilihat dari informasi yang dikembalikan oleh sistem. Sehingga dapat menjadi pertimbangan untuk pengembangan suatu sistem temu kembal informasi yang baik 6) Sistem Temu Kembali Informasi Information retrieval (IR) atau temu kembali informasi adalah menemukan materi (biasanya dokumen) dari sebuah kumpulan data yang tidak terstruktur (biasanya teks) untuk memenuhi kebutuhan informasi dari koleksi yang besar 3). Aplikasi yang melibatkan proses temu kembali informasi pada awalnya digunakan untuk membantu pustakawan untuk megorganisir koleksi referensi pustaka dan digunakan oleh paralegal. Sejak berkembangnya internet dan menyebabkan informasi yang terdapat di internet semakin lama semakin besar, maka aplikasi temu kembali informasi secara tidak disadari sering digunakan oleh hamper setiap user internet. Sebagai contoh aplikasi yang sering digunakan adalah mesin pencari (Search Engine) dan mesin pencari arsip . Kualitas relevansi hasil pencarian tanpa perangkingan dokumen ditentukan oleh dua nilai yaitu recall dan precision. Recall adalah perbandingan jumlah dokumen relevan yang terambil sesuai dengan query yang diberikan dengan total kumpulan dokumen yang relevan dengan query (Persamaan 1). Precision adalah perbandingan jumlah dokumen yang relevan terhadap query dengan jumlah dokumen yang terambil hasil pencarian (Persamaan 2). #( rir) r = = P( ret rel) #( ri) (1) #( rir) p = = P( rel ret) #( ri) (2) Dimana, r: recall p: precision rir: relevan items retrieved ri: relevan items ret: retrieved rel: relevan Keterhubungan relevansi dokumen dengan eksekusi query dapat dilihat dari data yang terambil dan tidak, hubungan ini dibagi menjadi empat kondisi yaitu false negative, false positive, true negative dan true positve yang digambarkan dalam Tabel 1. Tabel 1. Hubungan relevansi keterambilan dokumen Relevan Tidakrelevan Terambil True positve (tp) False negative (fn) Tidak Terambil False negative (fp) True negatif (tn) Dengan demkian maka nilai recall dan precision dapat dihitung dengan: tp recall = tp + fp (3) FMIPA Universitas Lampung

3 J. Sains MIPA, Desember 2010, Vol. 16, No. 3 tp precision = tp + fn (4) Akurasi berdasarkan tabel di atas didapat dengan: tp + fp accuracy = tp + fn + tn + fn (5) Alasan untuk tidak menggunakan nilai akurasi sebagai parameter yang tepat untuk mengatasi masalah temu kembali informasi. Kenyataannya pada umumnuya terdapat 99.99% dokumen tidak relevan. Jika sistem dirancang untuk mendapatkan akurasi yang tinggi, maka sistem akan menganggap semua dokumen tidak relevan untuk setiap query. Kedua nilai recall dan precision juga tidak menjamin dapat mengatasi masalah pada sistem temu kembali informasi. Sebagian user khususnya web surfer menginginkan menemukan dokumen relevan pada halaman pertama pencarian. Untuk itu diperlukan proses perangkingan dokumen sesuai dengan bobot relevansi terhadap query, pada sub judul berikutnya dibahas mengenai teori perangkingan dengan pembobotan dokumen Model Ruang Vektor Model ruang vektor mempresentasikan sejumlah n term yang ada pada kamus term atau indeks term sebagai ruang vektor berdimensi n 5). Sehingga query maupun dokumen merupakan vektor berdimensi n. Jika t mewakili setiap term dalam indeks term, maka query Q adalah vektor Q(t1,t2,...,tn) dengan t1 dimana i=1,2,3,n merupakan term yang ada pada indeks term, dokumen D adalah vektor D(t1,t2,...,tn) untuk setiap Di dengan j=1,2,,m. Dimana m merupakan banyak dokumen yang ada pada koleksi dokumen. Sebagai contoh terdapat tiga buah term (t1,t2,dan t3 serta dua buah dokumen D1 dan D2 serta sebuah query Q. Masing-masing dokumen dan query direpresentasikan dalam persamaan berikut : D1=2t1 + 3t2 + 5t3 D2=3t1 + 7t2 + 0t3 Q=0t1 + 0t2 + 2t3 Maka secara grafis dapat direpresentasikan pada Gambar 1 Gambar 1. Representasi dokumen dan query pada ruang vektor Secara geometris, sudut yang merentang antara vektor Q dan vektor D dapat diukur. Semakin kecil sudut diantara keduanya, semakin tinggi derajat kesamaan. Cosinus dari sudut tersebut merupakan koefisien yang dapat mewakilinya, seperti tergambar dalam Gambar 2 berikut : 2010 FMIPA Universitas Lampung 157

4 Didik Kurniawan... Evaluasi Sistem Temu Kembali Informasi Model Ruang Vektor Gambar 2. Representasi grafis sudut vektor dokumen dan query Jika Q adalah vektor query dan D adalah vektor dokumen, dimana vektor-vektor tersebut merupakan vektor dalam ruang dimensi-n, dan θ adalah sudut yang dibentuk oleh kedua vektor, maka : Q D = Q D cos θ (6) dimana Q D adalah hasil inner product kedua vektor. Cos θ adalah Similarity Coefficient antara Q dan D. Q D cosθ = Q D (7) Panjang dokumen cenderung mempunyai pengaruh terhadap nilai derajat kesamaan. Dokumen yang lebih panjang mengakibatkan mempunyai nilai yang lebih besar. Maka jarak Euclidean (panjang) kedua vektor dijadikan sebagai faktor pembagi atau faktor normal. Menurut Euclid panjang vektor merupakan akar dari jumlah kuadran elemen-elemennya sehingga, n n 2 2 Q = Q i D = D i i= 1 dan i= 1 (8) Perhitungan kesamaan kedua vektor adalah sebagai berikut : n Q D 1 SC ( Q, D) = cos( Q, D) = = Q D Q D Q D i i=1 (9) Dimana, SC = Similarity Coefficient (Derajat Kesamaan) i 2. METODE PENELITIAN Metode yang digunakan untuk menganalisa sistem temu kembali informasi ini dengan merancang sebuah aplikasi sistem temu kembali dengan menggunakan model ruang vektor lalu menganalisis statistik log sistem. Log yang disimpan oleh sistem adalah, sebagai berikut: 1. Data-data statistik hasil pencarian yang meliputi kueri, jumlah data yang ditemukan, statistik deskriptif score dokumen terhadap kueri dan waktu yang dibutuhkan sistem untuk menemukan dokumen yang dianggap releval terhadap sistem. 2. Data penilaian user terhadap hasil pencarian yang dianggap relevan, dan 3. Data aktivitas perilaku pengguna sistem temu kembali informasi. Gambar 3.1 merupakan diagram sequence yang menggambarkan kinerja sistem yang dibangun. Dari diagram ini, dapat dilihat aktivitas pengguna, meliputi: 1. Memasukan term atau kata kunci pencarian, lalu sistem merespon dengan class analyzer untuk membangun sebuah kueri standar yang dikenali sistem. 2. Lalu sistem mengembalikan daftar dokumen yang dianggap relevan oleh sistem kepada pengguna sekaligus menyimpan hasil pencarian ini di dalam basis data. 3. Pengguna melakukan penandaan dokumen yang dianggap relevan terhadap hasil yang dikembalikan oleh sistem dan sistem menyimpan informasi ini di dalam basis data. 4. Sistem melakukan penyimpanan aktivitas pengguna ketika berinteraksi dengan sistem FMIPA Universitas Lampung

5 J. Sains MIPA, Desember 2010, Vol. 16, No. 3 Gambar 3. Diagram sequence sistem temu kembali informasi Dari data yang direkam oleh sistem ini, lalu akan dievaluasi kinerja sistem temu kembali model ruang vektor dengan menganalisis bagaimana sistem mengembalikan informasi kepada pengguna dengan melakukan perangkingan, apakah perangkingan yang dilakukan sistem ini sesuai dengan keinginan pengguna (relevan dari sudut pandang pengguna). 3. HASIL DAN PEMBAHASAN Penelitian ini dilakukan di laboratium komputasi FMIPA Universitas Lampung, data yang diindek oleh sistem adalah konten dari website yang di download dengan menggunakan webcrawler pada bulan April Field-field yang diindekan oleh sistem adalah content, path, dan title dari dokumen. Dari proses pengindekan didapatkan data-data sebagai berikut, jumlah dokumen ada dan jumlah term yang berbeda untuk semua dokumen ada term. Dari ujicoba yang dilakukan pada bulan Mei 2010 selama 3 hari, pengguna disarankan untuk mengakses intranet pada ip pada lingkungan jaringan FMIPA Universitas Lampung. dari analisis log penggunaan sistem setidaknya terdapat 35 sesi pengguna. Setelah user melakukan submit term pada halaman search.jsp, terdapat 27 sesi pengguna melakukan aktivitas dengan hasil pencarian dan sisanya apatis terhadap sistem. Dari 27 sesi pengguna yang mendapatkan hasil pencarian terdapat 17 sesi pengguna yang melakukan penandaan dokumen yang relevan dan pengguna melakukan submit kueri pada sistem sebanyak 4.46 kali dalam satu sesi 7). Berikut adalah hasil analisis dari kinerja sistem yang dibagi menjadi 3 bagian, statistik hasil pencarian, interaksi pengguna pada penandaan dokumen relevan dan interaksi pengguna saat menggunakan sistem FMIPA Universitas Lampung 159

6 Didik Kurniawan... Evaluasi Sistem Temu Kembali Informasi Model Ruang Vektor Tabel 2. Statistik deskriptif hasil pencarian kueri pada sistem IR Jumlah Pencar ian numhits Mean Median Max Min Stdev Waktu (detik) MAX MIN Rerata Sim. Baku Dilihat dari Tabel 2 didapatkan bahwa rata-rata score dokumen terhadap kueri yang didapat adalah 0.16, maksimum rata-rata score dokumen adalah 0.85 dan minimum rata-rata score dokumen adalah Statistik ini menggambarkan respon sistem terhadap kueri yang diinputkan oleh pengguna. Semakin kecil score kueri pada suatu dokumen maka relevansi dokumen terhdap kueri akan semakin kecil. Kata kunci term yang diinputkan user juga sangat beragam, hal ini diindikasikan nilai variasi atau simpangan baku nilai maksimum score sangat besar yaitu 0.66, jika dilihat dari skla score suatu dokumen antara 0 dan 1, maka simpangan baku nilai maksimum score dokumen ini relatif besar. Keragaman koleksi dokumen digambarkan oleh nilai simpangan baku score dokumen terhadap kueri. Jika dilihat pada tabel yang sama keragaman dokumen terhadap kueri relatif kecil hal ini diindikasikan dengan nilai rata-rata simpangan baku score dokumen terhadap kueri yaitu sebesar Penandaan dokumen relvan oleh user scoremax scoremean score Relevan Sesi1 Sesi2 Sesi3 Sesi4 Sesi5 Sesi6 Sesi7 Sesi8 Sesi9 Sesi10 Sesi11 Sesi12 Sesi13 Sesi14 Sesi15 Sesi16 Sesi17 Sesi Gambar 4. Grafik posisi score dokumen yang dianggap relevan Dilihat dari Gambar bahwa user menandai dokumen relevan relatif terhadap score kueri tersebut, ini diindikasikan bahwa dokumen yang dianggap relevan berada di atas score rata-rata, kecuali dua penandaan relevan oleh pengguna yang score-nya berada dibawah garis rata-rata score yaitu sesi 2 dan sesi 3. Ini mengindikasikan perangkingan yang dilakukan dengan metode ruang vektor dapat menghasilkan dokumen relevan pada urutan dokumen yang terambil pada posisi teratas FMIPA Universitas Lampung

7 J. Sains MIPA, Desember 2010, Vol. 16, No Total Hit Hit Menu Sistem Hit Hasil Hit M enu Sistem Hit Hasil Sesi Gambar 5. Perbandingan jumlah hit dalam sistem IR Dari data yang diperlihatkan Gambar 5 bahwa dari 142 hit dalam 27 sesi terdapat 57.75% hit yang mengakses hasil pencarian dan 42.25% hit yang mengakses menu sistem IR. Yang termasuk dalam menu disini adalah berupa komponen sistem IR, yaitu pencarian dasar, pencarian lanjut dan penelusuran halaman sistem IR. Dari Gambar 5 didapatkan bahwa dari total 27 sesi pengguna, terdapat 9 sesi yang tidak melakukan hit hasil pencarian, hal ini mengindikasikan tidak menemukan dokumen relevan dalam daftar yang ditampilkan oleh sistem. Rata-rata pengguna dalam setiap sesi melakukan hit sebanyak 5.26 kali. Dengan maksimum hit sebanyak 29 kali dan minimum 1 kali, jika dilihat dari jumlah hit dalam sistem temu kembali dapat diambil suatu hipotesis bahwa semakin besar jumlah hit rata-rata dalam setiap sesi menggambarkan kepuasan pengguna dalam sistem. 4. KESIMPULAN Dari analisis yang dilakukan terhadap statistik log sistem temu kembali informasi dapat diambil kesimpulan sebagai berikut: 1. Dokumen relevan yang ditandai oleh pengguna sebagian besar di atas score rata-rata kueri terhadap dokumen yaitu 15 dari 17 sesi atau sebesar 88,24% sesi pengguna yang memilih dokumen relevan berada di atas score rata-rata. Hal ini mengindikasikan perangkingan yang dilakukan dengan model ruang vektor dapat memenuhi kebutuhan informasi bagi pengguna. 2. Pada evaluasi interaksi pengguna sistem temu kembali informasi yang dibangun dengan model ruang vektor didapatkan bahwa kecenderungan pengguna akan meninggalkan sistem ketika sudah mendapatkan dokumen yang dianggap relevan, hal ini ditandai dengan 57.75% pengguna memilih dokumen hasil penelusuran dibandingkan dengan persen dimana pengguna melakukan penelusuran halaman hasil pencarian dan komponen pada sistem. DAFTAR PUSTAKA 1. Hiemstra, D Using Language Models for Information Retrieval, Center for telematics and Information Technology. AE Enschede. Netherlands. 2. Ingwersen, P Information retrieval interaction. Taylor graham publishing. London FMIPA Universitas Lampung 161

8 Didik Kurniawan... Evaluasi Sistem Temu Kembali Informasi Model Ruang Vektor 3. Manning, C. D., Raghavan, P. and Schütze, H Introduction to Information Retrieval, Cambridge University Press. 4. Grossman, D.A. and Ophir, H Information retrieval: Algorithms and Heuristics, Kluwer Academic Publisher. Massachutetts. USA. 5. Salton, G., Wong, A., Yang. C. S A vector space model for automatic indexing. Communications of the ACM, 18 (11): Shneiderman, B Designing the User Interface: Strategies for Effective Human-Computer Interaction. Addison-Wesley Publishers. 7. Luhn, H. P A statistical approach to mechanized encoding and searching of literary information. IBM Journal of Research and Development, 1(4). (p. 47, p. 76) FMIPA Universitas Lampung

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System) Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System) IF3 Aljabar Geometri Oleh: Rinaldi Munir Program Studi Informatika, STEI-ITB Rinaldi Munir - IF3 Aljabar Geometri

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah 1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari

Lebih terperinci

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak

Lebih terperinci

V HASIL DAN PEMBAHASAN

V HASIL DAN PEMBAHASAN 22 V HASIL DAN PEMBAHASAN 5.1 Karakteristik Video dan Ektraksi Frame Video yang digunakan di dalam penelitian ini merupakan gabungan dari beberapa cuplikan video yang berbeda. Tujuan penggabungan beberapa

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem

Lebih terperinci

Information Retrieval

Information Retrieval Information Retrieval Budi Susanto Information Retrieval Information items content Feature extraction Structured Structured Document Document representation representation Retrieval model: relevance Similarity?

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI

Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI Search Engine Text Retrieval dan Image Retrieval YENI HERDIYENI 14 JUNI 2008 Search engine atau mesin pencari merupakan bagian dari teknologi inte rnet yang sangat penting untuk pencarian informasi. Dewasa

Lebih terperinci

Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES. Budi Susanto

Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES. Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model probabilitistic retrieval dengan metode Simple Term Weights.

Lebih terperinci

RETRIEVAL STRATEGIES. Tujuan 4/9/13. Budi Susanto

RETRIEVAL STRATEGIES. Tujuan 4/9/13. Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model probabilitistic retrieval dengan metode Simple Term Weights.

Lebih terperinci

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Pengujian Kerelevanan Sistem Temu Kembali Informasi Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tes Secara harfiah kata tes berasal dari kata bahasa prancis kuno: testum yang berarti piring untuk menyisihkan logam-logam mulia, dalam bahasa Indonesia diterjemahkan dengan

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

IMPLEMENTASI VECTOR SPACE MODEL UNTUK PENCARIAN DOKUMEN

IMPLEMENTASI VECTOR SPACE MODEL UNTUK PENCARIAN DOKUMEN IMPLEMENTASI VECTOR SPACE MODEL UNTUK PENCARIAN DOKUMEN Abdul Azis Abdillah 1, Indra Bayu Muktyas 2 Program Studi Pendikan Matematika, STKIP Surya, Tangerang, Banten abdul.azis.a@stkipsurya.ac. 1, recobayu@gmail.com

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE Rila Mandala Kelompok Keahlian Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10 Bandung,

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,

Lebih terperinci

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

Lebih terperinci

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA Aida Indriani ) ) Teknik Informatika STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso 8, Tarakan 77 Email

Lebih terperinci

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Hendri Priyambowo 1, Yanuar Firdaus A.W. S.T, M.T 2, Siti Sa adah S.T. M.T 3 123 Program Studi S1 Teknik Informatika,

Lebih terperinci

TEMU KEMBALI INFORMASI

TEMU KEMBALI INFORMASI JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 3 IR MODEL Mengapa Model? 1 Banyak pengembangan teknologi IR seperti web search, translator system, spam filter, dsb membutuhkan teori dan percobaan.

Lebih terperinci

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi Proses Temu-Kembali KULIAH #5 Evaluasi IR query : sby query: flu burung Evaluasi IR Indikator yang dapat diukur: Seberapa cepat dia meng-indeks Banyaknya dokumen/jam Terkait

Lebih terperinci

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom IMPLEMENTASI MODEL RUANG VEKTOR SEBAGAI PENERJEMAH QUERY PADA CROSS-LANGUAGE INFORMATION RETRIEVAL SISTEM IMPLEMENTATION OF VECTOR SPACE MODEL AS QUERY TRANSLATION FOR CROSS-LANGUAGE INFORMATION RETRIEVAL

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL

SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL Sistem Informasi Pengelolaan Arsip Statis... SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL Silmi Kafatan, Djalal Er Riyanto,

Lebih terperinci

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan pengetahuan dan kehidupan manusia sungguh dipercepat dengan kemudahan akses terhadap begitu banyak informasi. Pada beberapa waktu yang lalu akses terhadap

Lebih terperinci

SISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR

SISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR SISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Pada Jurusan Teknik

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan

Lebih terperinci

BAB I PERSYARATAN PRODUK

BAB I PERSYARATAN PRODUK BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem

Lebih terperinci

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI 18 PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI Karter D. Putung, Arie Lumenta, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi Manado, Indonesia. karterputung@gmail.com,

Lebih terperinci

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Wahyudi,MT Laboratorium Sistem Informasi Fakultas Sains dan Teknologi UINSUSKA RIAU Jl.HR.Subrantas KM.15

Lebih terperinci

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL (Studi Kasus Perpustakaan Universitas Udayana) LEMBAR JUDUL KOMPETENSI RPL SKRIPSI NI MADE

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Bagi perusahaan yang bergerak dalam industri manufaktur, sistem informasi produksi yang efektif merupakan suatu keharusan dan tidak lepas dari persoalan persediaan

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :

Lebih terperinci

Implementasi Generalized Vector Space Model Menggunakan WordNet

Implementasi Generalized Vector Space Model Menggunakan WordNet Implementasi Generalized Vector Space Model Menggunakan WordNet Adi Wibowo*, Andreas Handojo**, Charistian Widjaja*** Jurusan Teknik Informatika Fakultas Teknologi Industri, Universitas Kristen Petra E-Mail:

Lebih terperinci

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL Susetyo Adi Nugroho () Abstrak: Salah satu metode yang sering digunakan dalam mengukur relevansi dokumen

Lebih terperinci

Rata-rata token unik tiap dokumen

Rata-rata token unik tiap dokumen Percobaan Tujuan percobaan ini adalah untuk mengetahui kinerja algoritme pengoreksian ejaan Damerau Levenshtein. Akan dilihat apakah algoritme tersebut dapat memberikan usulan kata yang cukup baik untuk

Lebih terperinci

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester

Lebih terperinci

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu

Lebih terperinci

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang 58 BAB 3 METODE PENELITIAN 3.1 Analisis Masalah Seiring dengan perkembangan zaman, jumlah informasi yang disimpan dalam betuk digital semakin bertambah, sehingga dibutuhkan cara pengorganisasian dan pengelolaan

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada era ini perkembangan teknologi informasi sangat pesat. Hal ini ditandai dengan semakin populernya penggunaan internet dan perangkat lunak komputer sebagai

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

SISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ

SISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ SISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ Nur Hasanah a a Fakultas Teknik dan Ilmu Komputer Universtas Sains Al Qur an a E-mail: nurh.unsiq@gmail.com INFO ARTIKEL Riwayat

Lebih terperinci

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI Wiranto 1), Edi Winarko 2) 1) Jurusan Teknik Informatika, Universitas Sebelas Maret E-mail : wir@uns.ac.id 2) Program Studi Ilmu

Lebih terperinci

JURNAL INFORMATIKA IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL

JURNAL INFORMATIKA IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL Jasman Pardede [1], Mira Musrini Barmawi [2], Wildan Denny Pramono [3] Jurusan Teknik Informatika Institut Teknologi

Lebih terperinci

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha ABSTRAK Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian atau penemuan kembali informasi yang relevan terhadap kebutuhan pengguna. Kebutuhan pengguna, diekspresikan

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.

Lebih terperinci

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko

Lebih terperinci

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad 1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan komputer di dalam lingkungan kehidupan masyarakat di seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad terakhir ini. Hal

Lebih terperinci

Penerapan Algoritma K-Means untuk Clustering

Penerapan Algoritma K-Means untuk Clustering Seminar Perkembangan dan Hasil Penelitian Ilmu Komputer (SPHP-ILKOM) 71 Penerapan Algoritma K-Means untuk ing Dokumen E-Jurnal STMIK GI MDP Ernie Kurniawan* 1, Maria Fransiska 2, Tinaliah 3, Rachmansyah

Lebih terperinci

Temu Kembali Informasi Big Data Menggunakan K-Means Clustering

Temu Kembali Informasi Big Data Menggunakan K-Means Clustering Temu Kembali Informasi Big Data Menggunakan K-Means Clustering Imam Marzuki Universitas Panca Marga Program Studi Teknik Elektro Jln. Yos Sudarso 107 Pabean Dringu Probolinggo 67271, Indonesia E-mail:

Lebih terperinci

Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information

Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information Ratnadira Widyasari 13514025 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi

Lebih terperinci

II TINJAUAN PUSTAKA. * adalah operasi konvolusi x dan y, adalah fungsi yang merepresentasikan citra output,

II TINJAUAN PUSTAKA. * adalah operasi konvolusi x dan y, adalah fungsi yang merepresentasikan citra output, 5 II INJAUAN PUSAKA.1 Fitur Scale Invariant Feature ransform (SIF) Fitur lokal ditentukan berdasarkan pada kemunculan sebuah objek pada lokasi tertentu di dalam frame. Fitur yang dimaksudkan haruslah bersifat

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan

Lebih terperinci

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut

Lebih terperinci

Text dan Web Mining - Budi Susanto 1 EVALUASI IR. Budi Susanto

Text dan Web Mining - Budi Susanto 1 EVALUASI IR. Budi Susanto Text dan Web Mining - Budi Susanto 1 EVALUASI IR Budi Susanto Text dan Web Mining - Budi Susanto 2 Tujuan mahasiswa memahami tentang bagaimana mengukur dan mengartikan precision dan recall terhadap sistem

Lebih terperinci

EVALUASI IR. Tujuan 4/16/13. Budi Susanto

EVALUASI IR. Tujuan 4/16/13. Budi Susanto Text dan Web Mining - Budi Susanto 1 EVALUASI IR Budi Susanto Text dan Web Mining - Budi Susanto 2 Tujuan mahasiswa memahami tentang bagaimana mengukur dan mengartikan precision dan recall terhadap sistem

Lebih terperinci

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya Terhadap Peningkatan Kinerja Image Search Engine Nugroho Herucahyono (13504038) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika,

Lebih terperinci

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya perkembangan teknologi dewasa ini telah menyebabkan aliran informasi begitu lancar

Lebih terperinci

Sistem Temu-Kembali Informasi Pengantar Perkuliahan

Sistem Temu-Kembali Informasi Pengantar Perkuliahan Sistem Temu-Kembali Informasi Pengantar Perkuliahan Husni Program Studi Teknik Informatika Universitas Trunojoyo Madura Semeter Gasal 2015-03 Sep. 2015 Perkenalan... Husni (UGM, ITB) Bidang Minat Sistem

Lebih terperinci

Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah

Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah Metode Latent Semantic Analysis dan Algoritma Weighted Tree Similarity untuk Pencarian berbasis b Semantik oleh : Umi Sa adah 5109201030 Pembimbing : Prof. Drs.Ec. Ir. Riyanarto Sarno, M.Sc, Ph.D Umi Laili

Lebih terperinci

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI Wiranto 1, Edi Winarko 2 1 Jurusan Teknik Informatika, Universitas Sebelas Maret 2 Program Studi Ilmu Komputer, Universitas Gajah

Lebih terperinci

Mengenal Information Retrieval

Mengenal Information Retrieval STBI-2011 Sistem Temu Balik Informasi 2011 Mengenal Information Retrieval Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress.com 2 3 Amazon.com 4 Amazon.com 5 6 7 8 9 Wordpress.com

Lebih terperinci

BAB 3 ANALISA DAN PERANCANGAN

BAB 3 ANALISA DAN PERANCANGAN BAB 3 ANALISA AN PERANCANGAN 3.1 Gambaran Umum Pada masa sekarang ini, proses pencarian dokumen dalam web seperti Google, Yahoo, dan sebagainya dilakukan dengan menginput query yang diinginkan pada kotak

Lebih terperinci

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE Sri Ulinar Romatua N B¹, Yanuar Firdaus A.w.², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Dengan semakin

Lebih terperinci

BAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi

BAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi 67 BAB 4 HASIL DAN BAHASAN 4.1 Hasil Penelitian dan Evaluasi 4.1.1 Hasil Penelitian Berikut disajikan beberapa data hasil query dari penelitian yang dilakukan dengan melampirkan tabel data precision dan

Lebih terperinci

Perangkingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing

Perangkingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing Wahib, Perangkingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing 83 Perangkingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing Aminul Wahib 1, Pasnur 2, Putu Praba Santika

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &

Lebih terperinci

PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM ABSTRAK

PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM  ABSTRAK J~ICON, Vol. 3 No. 2, Oktober 2015, pp. 106 ~ 112 106 PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM E-MAIL Tince Etlin Tallo 1, Bertha S. Djahi 2, Yulianto T. Polly 3 1,2,3 Jurusan Ilmu

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document Jurnal Ilmiah Widya Teknik Volume 15 Nomor 2 2016 ISSN 1412-7350 SISTEM PEMEROLEHAN INFORMASI UNDANG-UNDANG DAN KASUS MENGGUNAKAN STRUKTUR DATA INVERTED INDEX DENGAN PEMBOBOTAN TF-IDF Fredes Winda Oktaviani

Lebih terperinci

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir

Lebih terperinci

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter

Lebih terperinci

Pemanfaatan Permodelan Ruang Vektor untuk Pengecekan Kemiripan

Pemanfaatan Permodelan Ruang Vektor untuk Pengecekan Kemiripan Pemanfaatan Permodelan Ruang Vektor untuk Pengecekan Kemiripan Andri Hardono Hutama - 13514031 1 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha

Lebih terperinci

PEMILIHAN FITUR OPTIMAL UNTUK TUGAS AKHIR MAHASISWA DENGAN METODE SUPPORT VECTOR MACHINE

PEMILIHAN FITUR OPTIMAL UNTUK TUGAS AKHIR MAHASISWA DENGAN METODE SUPPORT VECTOR MACHINE Vol 2, No 3 Juni 2012 ISSN 2088-2130 PEMILIHAN FITUR OPTIMAL UNTUK TUGAS AKHIR MAHASISWA DENGAN METODE SUPPORT VECTOR MACHINE Devie Rosa Anamisa 1), Eka Mala Sari Rochman 2) 1,2 Teknik Informatika, Fakultas

Lebih terperinci

Perancangan Sistem Temu Kembali Informasi Menggunakan Metode Vector Space Model Pada Pencarian Dokumen Berbasis Teks Berita

Perancangan Sistem Temu Kembali Informasi Menggunakan Metode Vector Space Model Pada Pencarian Dokumen Berbasis Teks Berita [VOL.VI NO.2 AGUSTUS 2017] JURNAL SISTEM INFORMASI STMIK ANTAR BANGSA Perancangan Sistem Temu Kembali Informasi Menggunakan Metode Vector Space Model Pada Pencarian Dokumen Berbasis Teks Berita Jamal Maulana

Lebih terperinci

HASIL DAN PEMBAHASAN. sim(, )=

HASIL DAN PEMBAHASAN. sim(, )= 4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i

Lebih terperinci

Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen

Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen Elisabeth Adelia Widjojo, Antonius Rachmat C, R. Gunawan Santosa Program Studi Teknik Informatika, Fakultas Teknologi

Lebih terperinci

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita 6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j 3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

Pencarian Materi Kuliah Pada Aplikasi Blended Learning Menggunakan Metode Vector Space Model

Pencarian Materi Kuliah Pada Aplikasi Blended Learning Menggunakan Metode Vector Space Model Pencarian Materi Kuliah Pada Aplikasi Blended Learning Menggunakan Metode Vector Space Model Putra Angga, Lastri Widya Astuti, Mustafa Ramadhan Program Studi Informatika, Universitas Indo Global Mandiri,

Lebih terperinci

Implementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan

Implementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan Scientific Journal of Informatics Vol. 2, No. 2, November 2015 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Implementasi Vector Space Model dalam Pembangkitan Frequently

Lebih terperinci