TEMU KEMBALI CITRA DAN TEKS DENGAN PENCARIAN TEKSTUAL BERBASIS INFORMATION GAIN, LATENT SEMANTIC ANALYSIS DAN WEIGHTED TREE SIMILARITY
|
|
- Bambang Hartono Darmadi
- 7 tahun lalu
- Tontonan:
Transkripsi
1 TEMU KEMBALI CITRA DAN TEKS DENGAN PENCARIAN TEKSTUAL BERBASIS INFORMATION GAIN, LATENT SEMANTIC ANALYSIS DAN WEIGHTED TREE SIMILARITY Hasan Dwi Cahyono 1), Agus Zainal Arifin 2), Nanik Suciati 3) Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember Surabaya, Indonesia 1 hasan.cahyono10@mhs.if.its.ac.id, 2 agusza@cs.its.ac.id, 3 nanik@its-sby.edu ABSTRAK Akses informasi seiring perkembangan internet pada konten multimedia dan teks mengalami kemajuan yang cukup pesat. Bahkan pada beberapa tahun terakhir telah banyak mesin pencari berbasis sistem temu kembali citra berbasis konten dikembangkan. Namun karena hasil pencarian metode tersebut masih terbatas dan kurang memuaskan dibanding pencarian berbasis teks, maka diperlukan metode yang mampu mengabungkan pencarian berbasis teks dan citra dengan anotasi teks tidak hanya dalam satu bahasa. Selain itu, sekumpulan dataset dengan jumlah besar dan sangat heterogen, membutuhkan metode yang dapat mengatur penggunaan informasi tekstual. Oleh karena itu, dalam penelitian ini diusulkan metode baru pada temu kembali citra dan teks dengan pencarian tekstual berbasis Information Gain (IG), Latent Semantic Analysis (LSA), dan Weighted Tree (W-Tree) similarity dalam bahasa Inggris, Perancis, dan Jerman. Pada tahap pertama, LSA digunakan untuk menemukan relasi semantik pada informasi tekstual serta IG untuk mengatur penggunaan informasi tekstual serta memilih kombinasi bahasa yang tepat. Selanjutnya, dilakukan proses pembentukan dan pencocokan W-Tree dari database dengan W-Tree dari query user. Sistem akan menampilkan keluaran berupa daftar dokumen beserta nilai kemiripannya. Dari percobaan pada dataset sebanyak , pencarian tekstual berbasis LSA, IG, dan W-Tree similarity mampu meningkatkan Mean Average Precision 30% dibanding pencarian tekstual LSA dan W-Tree pada temu kembali citra dan teks, serta 117% dibanding pencarian visual saja. Kata kunci: pencarian teks dan citra, LSA, W-tree, information gain. ABSTRACT Access to information on the internet as the development of multimedia and text contents are progressing quite rapidly. Even in recent years image-based search engine has been developed. However, because of the result of these methods is limited and less satisfying than text-based search, it requires a method that able to combines text and image-based search. In addition, a set of datasets with large and highly heterogeneous, requiring a method that able to regulate the use of textual information. Therefore, this study proposed a new method on image and text retrieval with textual search based on Information Gain (IG), Latent Semantic Analysis (LSA), and Weighted Tree (W-Tree) similarity in English, France, and German. At the first stage, LSA is used to find semantic relations on textual information and the IG to regulate the use of textual information. Furthermore, performed a process of forming and matching between database W-Tree and user queries W-Tree. The system will show a list of documents and their output value of similarity. From experiments on the dataset as much as 28,550, textual search based on LSA, IG, and W-Tree similarity able to increase the Mean Average Precision 30% compared to LSA and W-Tree similarity, and 117% compared to visual search only. Keywords: text and image retrieval, LSA, W-tree, information gain.
2 PENDAHULUAN Berbagai macam jenis informasi dalam jumlah besar terakumulasi di internet setiap harinya, dan jumlahnya juga semakin bertambah setiap hari. Maka dari itu perlu dilakukan automatisasi sebagai cara untuk mendapatkan akses informasi yang lebih efektif dan efisien [1]. Salah satu cara pencarian informasi diinternet secara efektif adalah pencarian berdasarkan informasi teks yang dapat ditemukan pada hampir semua mesin pencari. Dan faktanya, pencarian berdasarkan informasi teks ini memiliki hasil yang cukup baik untuk citra dengan anotasi teks seperti nama entitas, manusia, objek, atau tempat, namun pencarian seperti ini tidak dapat bekerja baik pada anotasi teks yang bersifat umum. Pencarian berbasis anotasi teks jarang menggambarkan background setting atau gambaran visual, seperti warna, tekstur, bentuk, dan juga ukuran dari objek. Selain itu, pencarian berbasis teks pada konten non tekstual tidak terstruktur seperti video, audio, dan juga citra, tidak sebagus dan seefektif pencarian pada dokumen tekstual [2] [3]. Berlandaskan keterbatasan tersebut, pencarian tekstual saja tidak cukup untuk melakukan pencarian gambar atau juga konten multimedia lainnya. Sehingga perlu adanya penggabungan pencarian tekstual dengan teknik yang mempertimbangkan fitur visual. Saat ini diketahui adanya peningkatan ketertarikan yang cukup pesat terhadap sistem yang tidak hanya dapat menyimpan informasi citra tetapi juga linked text (metadata). Bahkan ide ini telah dibuktikan dalam berbagai forum dan konferensi ilmiah pada beberapa tahun belakangan [4]. Salah satu cara untuk memperdalam makna teks pada citra adalah penggunaan model kemiripan tekstual yang seringkali mengalami kendala pada sisi leksikal. Solusi tersebut adalah dibangun sebuah model kemiripan berdasarkan metode Latent Semantic Analysis (LSA) dan Weighted tree (W-Tree ) yang terbukti mampu menangani kelemahan leksikal. LSA dan W-Tree terbukti efektif namun pada jumlah data dalam jumlah besar yang terdiri lebih dari satu bahasa dan dengan tingkat heterogensi yang tinggi metode tersebut tidak mampu mengatasi noise yang terjadi. Oleh karena itu dalam penelitian ini, diusulkan metode baru pada temu kembali citra dan teks dengan pencarian tekstual berbasis Information Gain (IG), LSA, dan W-Tree similary. Metode ini digunakan pada dataset sebanyak yang terdiri dalam bahasa Inggris, bahasa Perancis, dan bahasa Jerman. METODE Latent Semantic Analysis (LSA) LSA adalah suatu metode dimana dekomposisi nilai singular digunakan untuk membentuk generalisasi semantik dari bagian tekstual. LSA menggunakan fakta bahwa katakata tertentu muncul dalam konteks yang sama untuk membangun hubungan antara makna dari kata [5]. Proses tersebut dilakukan dengan membangun sebuah matriks term-document. Dalam hal ini masing-masing baris mewakili kata/term yang unik dan kolomnya mewakili masing-masing dokumen. Kemudian sel pada matrik diisi frekuensi kemunculan kata/term tersebut. Selanjutnya matriks tersebut akan diproses menggunakan teknik Single Value Decomposition (SVD). SVD didasarkan pada sebuah teorema dalam aljabar linier yang menyatakan bahwa sebuah matriks persegi dapat dipecah menjadi perkalian dari tiga matriks : sebuah matriks orthogonal U, sebuah matriks diagonal S, dan sebuah matriks transpose dari matriks orthogonal V. Teorema tersebut dinyatakan pada persamaan: T A m n = U m r. S r r. V r n, (1) dimana U T U = I; V T V = I; kolom dari U adalah eigenvector orthonormal dari AA T, kolom dari V adalah eigenvector orthonormall dari A T A, dan S adalah sebuah matriks diagonal yang berisi akar dari nilai eigenvalue dari U atau V dalam urutan dari besar ke kecil. Pada penelitian ini, implementasi perhitungan SVD memanfaatkan package LingPipe dari Java [6]. Information Gain Information gain adalah sebuah pengukuran berdasarkan entropi dari sistem,
3 yaitu disorder degree dari sistem [7]. Pengukuran ini mengindikasikan pada apa entropi sistem secara keseluruhan berkurang jika diketahui nilai dari atribut tertentu (cabang pada kasus yang diangkat). Sehingga, dapat ditunjukkan bagaimana seluruh sistem terhubung pada sebuah atribut. Dengan kata lain, seberapa banyak informasi pada atribut berkontribusi kepada sistem. Persamaan untuk menghitung IG adalah: IG C E H C H C E, (2) dimana IG(C E) adalah information gain dari cabang atau atribut E, H(C) adalah sistem entropi dan H(C E) adalah entropi relatif terhadap sistem ketika nilai cabang dari E diketahui. Entropi terhadap sistem mengindikasikan disorder degree dengan persamaan: C H C p(c i )log 2 p(c i ), (3) i 1 dimana p(c i) adalah nilai probabilitas terhadap i. Berikut adalah persamaan entropi relatif: E C H C E p( e ) j p( c e ) log 2 p( c e ) i j i j i 1 i 1 (4) dimana p(e i) adalah nilai probabilitas i terhadap atribut e, dan p(c i e j) adalah probabilitas c i terhadap e j., Weighted Tree Similarity Weighted Tree Similarity pada dasarnya merupakan metode untuk mengetahui kemiripan kebutuhan antara buyer dan seller dengan menggunakan Weighted Tree sebagai representasi informasinya. Struktur Weighted Tree memperkenalkan konsep node berlabel, arc berlabel, dan arc berbobot yang merepresentasikan relasi parent child dari suatu atribut produk / jasa. Informasi semantik dikandung tidak hanya pada label node tetapi juga pada label arc. Sedangkan bobot arc merepresentasikan tingkat kepentingan (importance) dari suatu arc (atribut produk/jasa). Berikut dijabarkan definisi Weighted Tree secara bertahap mulai dari tree yang paling sederhana hingga tree yang telah sempurna berbentuk struktur Weighted Tree. Contoh Weighted Tree dengan cabang berlabel dan berbobot ditampilkan pada Gambar 1. Gambaran Dataset Pengujian Dalam penelitian ini, dataset yang digunakan adalah metadata yang memiliki citra dan teks yang saling berkesuaian oleh CLEF (Cross-Language Evaluation Forum) pada tema khusus yaitu Wikipedia Retrieval. Tema ini dikenal sebagai ImageCLEF 2010 Wikipedia Collection. Dataset percobaan terdiri dari ImageCLEF Wiki 2010 terdiri dari citra beserta annotasi teks dalam bentuk xml seperti pada Gambar 2. Adapun sebaran dataset tersaji dalam. Sebaran tersebut menunjukkan anotasi teks dalam ImageCLEF 2010 Wikipedia sangat heterogen, dengan hampir 3% dari dataset yang memiliki anotasi pada ketiga bahasa, 16% pada dua bahasa, 45% pada satu bahasa, dan 1.5% tidak terdapat keterangan. Adapun bagian yang digunakan untuk pengujian adalah description, caption, dan juga comment yang berada pada anotasi bahasa Inggris (en), bahasa Jerman (de), dan bahasa Perancis (fr) saja. Untuk bagian yang lain tidak dimasukkan dalam pengujian. Arsitektur Sistem Pada sistem yang digagas, ada 3 tahapan yaitu preprocessing, pencarian, dan penggabungan. Proses tersebut seperti pada Gambar 3.
4 Gambar 1. Tree dengan label dan bobot. Tabel 1. Sebaran anotasi teks dataset Bahasa Jumlah Inggris 5666 Jerman 4080 Perancis 3144 Inggris + Jerman 1760 Inggris + Perancis 1648 Jerman + Perancis 1128 Inggris + Jerman + Perancis 778 Tanpa Anotasi 385 Gambar 2. Salah satu dataset yang terdiri dari citra dan teks.
5 Image Query List of Relevant Document (L final ) Merging both list Tekstual Query Chancellery in Berlin, since 2001 (en) Bundeskanzleramtsgebäude in Berlin (de) La chancellerie (fr) CBIR System (GIFT) List of Relevant Document (L v ) List of Relevant Document (L T ) W-Tree Information Gain LSA 1. Local Colour 2. Global Colour, 3. Local Texture 4. Global Texture Image Dataset Text Dataset 1. Document Vector 2. Scales 3. Term Vector Gambar 3. Arsitektur sistem. Preprocessing Untuk dapat menganalisa strategi pengabungan yang akan dilakukan, dua percobaan dilakukan. Pertama berdasarkan citra dan yang kedua berdasarkan tekstual [8]. Pada pemrosesan citra, setiap citra diproses dengan menggunakan sistem CBIR bernama GIFT 1. Sistem ini menggunakan empat fitur pada proses retrieval-nya. Fitur yang dipakai GIFT adalah local color, global color, local texture, dan global texture. Pada pemrosesan tekstual, dilakukan stemming dengan menggunakan snowball stemmer untuk bahasa Inggris, bahasa Perancis, dan bahasa Jerman pada setiap dokumen. Setelah itu diproses dengan metode LSA untuk mendapatkan Term Document Metric. Selanjutnya, dengan SVD didapatkan document vector, term vector, dan scales. Pencarian Dokumen Tekstual Dan Visual Pada pencarian visual, setelah dilakukan ekstraksi fitur, dilakukan pencocokan dengan dataset citra. Hasil yang didapat pada pencarian visual berkisar pada 0 s/d 1. Semakin mendekati 1 berarti citra yang ditampilkan semakin mirip dengan citra user. Dokumen hasil dari pencarian visual diberikan notasi L V. Untuk efektifitas, hanya 1000 dokumen dengan nilai relevansi teratas saja yang diambil. Pada pencarian tekstual, setelah dilakukan perhitungan dengan LSA dan didapatkan document score (nilai kemiripan), pada setiap cabang dan pada setiap kombinasi bahasa (en, de, fr, en+de, en+fr, de+fr, en+de+fr). Permasalahan yang muncul ketika dilakukan penggabungan bahasa adalah memilih nilai document score (kemiripan) yang tepat jika ada lebih dari 1 nilai. Untuk memilih document score digunakan nilai maksimal seperti pada persamaan berikut: s max( doc _ score ij ), i j (5) dimana i adalah cabang (description, comment, caption) dan j adalah kombinasi bahasa(en, de, fr, en+de, en+fr, en+de+fr). Setelah document score didapatkan, maka dilakukan pemisahan cabang berdasarkan IG. Cabang dengan IG tertinggi menjadi C1, 2 cabang tertinggi menjadi C2, dan seluruh cabang tanpa memperhitungkan nilai IG yaitu C3 (W-Tree).
6 Penggabungan Hasil Pencarian Untuk menggabungkan hasil pencarian tekstual dan visual, dilakukan beberapa percobaan dengan berat pada hasil pencarian visual dan tekstual. Rumus yang digunakan untuk menggabungkan kedua hasil pencarian sebagai berikut: RSV TOTAL RSV text RSV visual 1, (6) dimana α ϵ [0, 1] adalah nilai yang diberikan pada RSV tekstual terhadap RSV visual. Total percobaan yang dilakukan adalah 9 dimana nilai α = {0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9} ditambah tekstual saja α = 1 dan visual saja α = 0. Pengukuran Efektifitas Sistem Untuk mengukur seberapa efektif sistem yang digagas, digunakan mean average precision (MAP). Secara geometri, MAP berada dibawah area grafik recall precision. MAP memberikan informasi lebih banyak dari pengukuran lain seperti precision ataupun R-precision, dan oleh karena itu, lebih efektif dan dapat memberikan hasil dengan stabilitas lebih baik [9]. Untuk mendapatkan nilai MAP, digunakan TREC_EVAL 2 yang sudah terbukti dapat melakukan evaluasi dengan batasan precision dan recall untuk menilai performa temu kembali informasi [10]. HASIL DAN PEMBAHASAN Tujuan utama dilakukan percobaan ini adalah menunjukkan bahwa dengan penggunaan cabang dengan nilai IG tertinggi lebih baik daripada menggunakan seluruh cabang yang ada. Untuk itu digunakan dataset seperti pada Tabel 2. Adapun proses pencarian yang dilakukan terbagi menjadi pencarian visual, pencarian tekstual, dan penggabungan pencarian visual dan tekstual. Pencarian Visual Pada Tabel 2, query dengan indeks Q2, Q3, Q4, dan Q5 pada sistem pencarian visual mampu mendapatkan hasil yang sesuai. Beberapa studi yang telah dilakukan menunjukkan bahwa MAP yang didapatkan tidak jauh berbeda dengan yang telah dilakukan seperti yang pada penelitian [11] yaitu dengan MAP Pada pencarian visual ini masih terdapat kegagalan dalam proses pencarian citra roller coaster. Dimana hasil pencarian tidak menemukan citra yang sesuai dengan query. Hal ini dikarenakan pencarian visual yang menggunakan fitur color dan texture tidak dapat menemukan dokumen yang sesuai dengan citra query. Fitur color dan texture tidak menjadi fitur yang dapat menemukan kemiripan yang baik sehingga tidak didapat hasil pencarian yang sesuai. Salah satu cara yang dapat meningkat presisi hasil pencarian visual adalah menambahkan salah satu fitur yaitu tepi (edge) yang terbukti pada penelitian yang telah dilakukan [12]. Pencarian Tekstual Pada pencarian tekstual digunakan metode LSA+IG+W-Tree similarity. Adapun metode pembanding untuk menguji kehandalan metode pencarian yang diusulkan adalah metode LSA+W-Tree similarity. Dimana metode LSA+W-Tree similarity tersebut pada penelitian sebelumnya terbukti efektif dengan mampu meningkatkan performa pencarian sebesar 50% dari metode W-Tree similarity [13]. Tabel 2 menunjukkan hasil pencarian bahwa dengan menggunakan metode LSA dan W-Tree similarity pada cabang dengan nilai IG tertinggi (C1 atau C2) mampu memberikan hasil yang lebih relevan dari metode LSA+W- Tree saja (C3). Hal ini dibuktikan dari pencarian tekstual dengan metode LSA+IG+W- Tree similarity mampu memberikan kenaikan rata-rata MAP sebesar 30% dibanding metode LSA+W-Tree similarity. Selain itu, pencarian tekstual dengan menggunakan metode LSA+IG+W-Tree saja juga terbukti lebih unggul dari pencarian visual saja dimana terjadi peningkatan MAP sebesar 71%. Selain itu, dari 5 query yang diujikan, metode LSA+IG+W-Tree terbukti mampu memberikan hasil yang lebih memuaskan
7 karena memberikan 3 hasil pencarian dengan MAP > 0 dibanding LSA+W-Tree yang hanya memberikan 2 hasil pencarian dengan MAP > 0. Beberapa penelitian sebelumnya telah membuktikan bahwa penggunaan cabang yang hanya memberikan kontribusi lebih kepada sistem terbukti mampu memberikan hasil yang lebih relevan dari pada menggunakan seluruh cabang tanpa memperhatikan kontribusi terhadap sistem [14]. Pada proses pencarian tekstual ini juga terdapat kegagalan pencarian yaitu proses pencarian pada query dengan indeks Q2 dan Q5 yang mendapatkan hasil MAP 0. Hal ini dikarenakan kata-kata dalam query user tersebut hanya ditemukan dalam 1 dokumen dokumen. Dalam konsep semantik, kata tersebut diabaikan karena tidak memberikan informasi tentang relasi antar dokumen [5]. Tabel 1. Query yang digunakan Query Koleksi Indeks Citra Teks relevan Q1 Q2 Q3 Q4 Q5 en de fr en de fr en de fr en de fr en roller coaster wide shot Weitwinkelaufnahme von Achterbahnen plan large d'une montagne russe skeleton of dinosaur Dinosaurierskelette squelette de dinosaure chinese characters chinesische Schriftzeichen caractères chinois male color portrait männliches Farbporträt portrait masculin en couleur yellow flames de gelbe Flammen fr flamme jaune Tabel 2. MAP hasil pencarian tekstual dan visual Indeks Jumlah Dokumen Relevan Visual MAP (x 10-2 ) Tekstual C1 C2 Max(C1,C2) C3 Q Q Q Q Q Rata-rata
8 Gambar 4. Hasil penggabungan informasi visual dan tekstual Tabel 3. Hasil penggabungan informasi visual dan tekstual Similarity (%) Q3 (x 10-2 ) Q4 (x 10-2 ) LSA LSA LSA LSA Tekstual Visual IG W- W- IG Tree Tree W- Tree W- Tree Rata-rata: Tabel 4. Perbandingan MAP visual, tekstual, dan penggabungan Tekstual + Visual Indeks Visual (x 10-2 ) LSA IG W-Tree (x 10-2 ) LSA W-Tree Q Q Rata-rata: Penggabungan Pencarian Visual dan Tekstual Setelah didapatkan daftar dokumen yang relevan berdasarkan fitur visual dan fitur tekstual dengan nilai MAP tertinggi, selanjutnya dilakukan penggabungan dengan persamaan (6). Pada Tabel 2, query dengan indeks Q1, Q2, dan Q5 tidak digunakan untuk penggabungan informasi visual dan tekstual. Hal ini dikarenakan untuk dapat dilakukan penggabungan diperlukan informasi visual dan tekstual dengan nilai MAP > 0. Sementara query indeks Q3 dan Q4 dapat digunakan untuk penggabungan karena nilai kemiripan visual dan tekstual mendapatkan hasil MAP > 0. Pada proses penggabungan query indeks Q3 memiliki nilai MAP yang lebih stabil dengan query indeks Q4 karena perbedaan kemiripan tekstual dan visual query indeks Q3 lebih kecil dari query indeks Q4. Semakin kecil perbedaan kemiripan visual dan tekstual, akan menghasilkan hasil pengabungan yang semakin stabil dimana indikasi tersebut juga telah disampaikan pada penelitian sebelumnya [14]. Hasil penggabungan dengan nilai MAP maksimum pada query dengan indeks Q4 didapat pada 60% kemiripan tekstual dan 40% kemiripan visual seperti pada Tabel 4. Nilai penggabungan visual dan tekstual tersebut pun sama seperti yang telah didapatkan pada penelitian sebelumnya [14]. Adapun hasil penggabungan informasi tekstual dengan visual menunjukkan nilai relevansi lebih dari 117% dibanding pencarian visual saja seperti pada Tabel 5. Kenaikan MAP yang diperoleh ini lebih besar dari kenaikan penelitian sebelumnya yaitu sebesar 90% [14]. Hasil percobaan pada Tabel 4 menunjukkan temu kembali citra dan teks dengan metode pencarian tekstual LSA+IG+W- Tree similarity mendapatkan MAP 30% lebih tinggi dari metode LSA+W-Tree similarity. Beberapa studi empiris menunjukkan bahwa dengan mempertimbangkan kontribusi elemen terhadap sistem secara keseluruhan menggunakan IG dapat memberikan hasil yang lebih memuaskan seperti pada penelitian yang telah dilakukan [15].
9 SIMPULAN Pada sistem ini diusulkan pendekatan baru dengan metode pencarian menggunakan LSA, IG, dan W-Tree similarity yang dapat membantu meningkatkan relevansi hasil temu kembali citra dan teks. Pada penelitian ini terbukti bahwa dengan penggabungan informasi visual dan tekstual menghasilkan pencarian yang lebih baik dari pencarian visual saja. Peran IG dalam pencarian tekstual berbasis LSA dan W-Tree similarity juga memberikan efek positif yaitu dengan meningkatkan relevansi hasil pencarian. Dengan menggunakan cabang yang memberikan kontribusi lebih besar pada sistem serta terbukti mampu memberikan MAP lebih tinggi dari pada menggunakan seluruh cabang tanpa memperhatikan kontribusi cabang tersebut terhadap sistem. DAFTAR PUSTAKA [1] Hsin C. F., Yeong. Y. X., & Hsiao T. P., 2005, "Multimodal Search for Effective Image Retrieval". [2] Kherfi M.L. Bernardi D.Z.A, 2004, "Image retrieval from the world wide web: issues, techniques, and systems," ACM Computing Surveys 36 (1), pp [3] He R., Xiong N.,Yang L. T, 2011, "Using Multi-Modal Semantic Association Rules to fuse keywords and visual features automatically for Web image retrieval," Information Fusion 12, pp [4] Quack T., Monich U., Thiele L, Manjunath B.S., 2004, "Cortina: A System for Largescale, Content-based Web Image Retrieval," Electrical and Computer Engineering Department, University of California. [5] Landauer T., Foltz P., Laham D., 1998, "Introduction to Latent Semantic Analysis. Discourse Processes". [6] SVD Tutorial. [Online] al/svd/read-me.html [7] Shannon C. E, 1998."A Mathematical Theory of Communication," The Bell System Technical Journal, pp , [8] GNU Software. GNU. [Online]. [9] Buckley C., Voorhees E. M., 2008 "Evaluating evaluation measure stability," In Proceeding of the 23rd annual international ACM SIGIR conference on research and development in information retrieval, pp [10] Eckard E., Chappelier J.C., 2007, "Free Software for research in Information Retrieval and Textual Clustering". [11] Tsikrika T., Muller H., Forner P., 2011 "Report on outcomes of first year evaluation activities," Participative Research Laboratory for Multimedia and Multilingual Information System Evaluation, D6.1. [12] Anil J., Aditya V., 1998, "Shape- Based Retrieval: A Case Study with Trademark Image Databases," in Pattern Recognition, pp [13] Sa'adah U., Sarno R., Yuhana U.L, 2012, "Metode Latent Semantic Analysis dan Algoritma Weighted Tree Similarity untuk Pencarian Berbasis Semantic," Program Studi Magister Jurusan Teknik Informatika ITS. [14] Martın-Valdivia M.T., Dıaz-Galiano M.C., Montejo-Raez A., Urena-Lopez L.A., 2008, "Using information gain to improve multi-modal information retrieval systems," ELSEVIER Information Processing and Management, pp [15] Lee W., Xiang, 2001,"Information- Theoritic Measure for Anomaly Detection," in IEEE Symposium on Security and Privacy.
10
PEMBOBOTAN DINAMIS BERBASIS INFORMATION GAIN PADA TEMU KEMBALI INFORMASI
Vol. 5, No. 2 Juni 2016 ISSN 2088-2130;e-ISSN 2502-4884 PEMBOBOTAN DINAMIS BERBASIS INFORMATION GAIN PADA TEMU KEMBALI INFORMASI Hasan Dwi Cahyono 1) Prodi Informatika, Fakultas Matematika dan Ilmu Pengetahuan
Lebih terperinciLatent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah
Metode Latent Semantic Analysis dan Algoritma Weighted Tree Similarity untuk Pencarian berbasis b Semantik oleh : Umi Sa adah 5109201030 Pembimbing : Prof. Drs.Ec. Ir. Riyanarto Sarno, M.Sc, Ph.D Umi Laili
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1 Tes Secara harfiah kata tes berasal dari kata bahasa prancis kuno: testum yang berarti piring untuk menyisihkan logam-logam mulia, dalam bahasa Indonesia diterjemahkan dengan
Lebih terperinciIntegrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction
Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko
Lebih terperinciAPLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL
APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan
Lebih terperinciPENGEMBANGAN SISTEM TEMU KEMBALI CITRA DENGAN MULTIMODAL DATA MENGGUNAKAN MICROSTRUCTURE DESCRIPTOR DAN PLSA
PENGEMBANGAN SISTEM TEMU KEMBALI CITRA DENGAN MULTIMODAL DATA MENGGUNAKAN MICROSTRUCTURE DESCRIPTOR DAN PLSA Choiru Za in, Nanik Suciati, Chastine Fatichah Institut Teknologi Sepuluh Nopember choiruzain@gmail.com,
Lebih terperinciKULIAH 12. Multimedia IR. Image Retrieval. BAB 11: Baeza-Yates & Ribeiro-Neto. Fakultas Ilmu Komputer Universitas Indonesia
KULIAH 12 Multimedia IR Image Retrieval BAB 11: Baeza-Yates & Ribeiro-Neto Multimedia IR Mempunyai kemampuan untuk menyimpan, memperoleh, memindahkan, memperlihatkan data yang karakteristiknya sangat beragam
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Bagi perusahaan yang bergerak dalam industri manufaktur, sistem informasi produksi yang efektif merupakan suatu keharusan dan tidak lepas dari persoalan persediaan
Lebih terperinciAPLIKASI CONTENT BASED IMAGE RETRIEVAL DENGAN FITUR WARNA DAN BENTUK
APLIKASI CONTENT BASED IMAGE RETRIEVAL DENGAN FITUR WARNA DAN BENTUK Arwin Halim 1, Hardy 2, Alvin Yufandi 3, Fiana 4 Program Studi Teknik Informatika, STMIK Mikroskil Jl. Thamrin No. 122, 124, 140 Medan
Lebih terperinciEFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA
EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA Desmin Tuwohingide 1, Mika Parwita 2, Agus Zainal Arifin 3, Diana Purwitasari 4 1,2,3,4 Teknik
Lebih terperinciSistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Lebih terperinciPENGENALAN OBJEK PADA CITRA BERDASARKAN SIMILARITAS KARAKTERISTIK KURVA SEDERHANA
PENGENALAN OBJEK PADA CITRA BERDASARKAN SIMILARITAS KARAKTERISTIK KURVA SEDERHANA Dina Indarti Pusat Studi Komputasi Matematika, Universitas Gunadarma Jl. Margonda Raya no. 100, Depok 16424, Jawa Barat
Lebih terperinciINTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN
INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com
Lebih terperinciABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha
ABSTRAK Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian atau penemuan kembali informasi yang relevan terhadap kebutuhan pengguna. Kebutuhan pengguna, diekspresikan
Lebih terperinciBAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi
67 BAB 4 HASIL DAN BAHASAN 4.1 Hasil Penelitian dan Evaluasi 4.1.1 Hasil Penelitian Berikut disajikan beberapa data hasil query dari penelitian yang dilakukan dengan melampirkan tabel data precision dan
Lebih terperinciSistem Deteksi Kemiripan Identitas...
Sistem Deteksi Kemiripan Identitas... (Azwar dkk.) SISTEM DETEKSI KEMIRIPAN IDENTITAS UNTUK REKOMENDASI PERHITUNGAN PAJAK PROGRESIF PADA KENDARAAN BERMOTOR MENGGUNAKAN LATENT SEMANTIC ANALYSIS (LSA) Noor
Lebih terperinciEVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE
EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE Rila Mandala Kelompok Keahlian Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10 Bandung,
Lebih terperinciPembuatan Kakas Komunikasi Antar Pengembang Perangkat Lunak
JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print) 1 Pembuatan Kakas Komunikasi Antar Perangkat Lunak Anugerah Firdaus, Daniel Oranova Siahaan dan Rizky Januar Akbar Jurusan Teknik
Lebih terperinciGambar 1.1 Tahapan Penelitian
BAB 1 PENDAHULUAN Latar Belakang Masalah Content Based Image Retrieval (CBIR) atau dikenal sebagai query dengan konten image dan pengambilan informasi visual berbasis konten merupakan penerapan teknik
Lebih terperinciPENCARIAN ISI CITRA MENGGUNAKAN METODE MINKOWSKI DISTANCE
PENCARIAN ISI CITRA MENGGUNAKAN METODE MINKOWSKI DISTANCE Budi Hartono 1, Veronica Lusiana 2 Program Studi Teknik Informatika, Fakultas Teknologi Informasi, Universitas Stikubank Semarang Jl Tri Lomba
Lebih terperinciPENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS
PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS Halimatus Sa dyah, Nurissaidah Ulinnuha Jurusan Teknik Informatika, Fakultas Teknologi
Lebih terperinci1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah
1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN Pada bab pendahuluan ini akan diuraikan penjelasan mengenai latar belakang penelitian, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metodologi penelitian dan
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciPENGEMBANGAN SISTEM PEROLEHAN CITRA BERBASIS ISI PADA CITRA BATIK MENGGUNAKAN METODE INTEGRATED COLOR AND INTENSITY CO-OCCURRENCE MATRIX (ICICM)
PENGEMBANGAN SISTEM PEROLEHAN CITRA BERBASIS ISI PADA CITRA BATIK MENGGUNAKAN METODE INTEGRATED COLOR AND INTENSITY CO-OCCURRENCE MATRIX (ICICM) Rima Tri Wahyuningrum *) Program Studi Teknik Informatika,
Lebih terperinci... BAB 2 LANDASAN TEORI. 2.1 Citra
6 BAB 2 LANDASAN TEORI 2.1 Citra Citra atau image adalah suatu matriks dimana indeks baris dan kolomnya menyatakan suatu titik pada citra tersebut dan elemen matriksnya (yang disebut sebagai elemen gambar
Lebih terperinciBAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai
BAB II TINJAUAN PUSTAKA Penelitian awal dalam bidang automatic text summarization dimulai dengan pembuatan metode term frequency oleh Luhn pada tahun 1958. Metode ini berasumsi bahwa frekuensi kata di
Lebih terperinciImplementasi Content Based Image Retrieval Untuk Menganalisa Kemiripan Bakteri Yoghurt Menggunakan Metode Latent Semantic Indexing
Implementasi Content Based Image Retrieval Untuk Menganalisa Kemiripan Bakteri Yoghurt Menggunakan Metode Latent Semantic Indexing Meivi Kartikasari, Chaulina Alfianti Oktavia Sekolah Tinggi Informatika
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
xi BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan ilmu pengetahuan dan teknologi informasi dewasa ini membuat perubahan perilaku dalam pencarian informasi yang berdampak bagi lembagalembaga yang bergerak
Lebih terperinciDETEKSI KEMIRIPAN TOPIK PROPOSAL JUDUL TUGAS AKHIR DAN SKRIPSI MENGGUNAKAN LATENT SEMANTIC ANALYSIS DI STMIK BUMIGORA MATARAM
DETEKSI KEMIRIPAN TOPIK PROPOSAL JUDUL TUGAS AKHIR DAN SKRIPSI MENGGUNAKAN LATENT SEMANTIC ANALYSIS DI STMIK BUMIGORA MATARAM I Putu Hariyadi 1, Hartarto Junaedi 2 (1) STMIK Bumigora Mataram, putu.hariyadi@stmikbumigora.ac.id
Lebih terperinciAPLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL
APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,
Lebih terperinciAplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)
Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System) IF3 Aljabar Geometri Oleh: Rinaldi Munir Program Studi Informatika, STEI-ITB Rinaldi Munir - IF3 Aljabar Geometri
Lebih terperinciBAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat
BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan
Lebih terperinciImplementasi Metode Document Oriented Index Pruning pada Information Retrieval System
Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Hendri Priyambowo 1, Yanuar Firdaus A.W. S.T, M.T 2, Siti Sa adah S.T. M.T 3 123 Program Studi S1 Teknik Informatika,
Lebih terperinciInera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
IMPLEMENTASI MODEL RUANG VEKTOR SEBAGAI PENERJEMAH QUERY PADA CROSS-LANGUAGE INFORMATION RETRIEVAL SISTEM IMPLEMENTATION OF VECTOR SPACE MODEL AS QUERY TRANSLATION FOR CROSS-LANGUAGE INFORMATION RETRIEVAL
Lebih terperinciBAB I PENDAHULUAN. digunakan untuk identitas citra adalah nama file, tanggal pengambilan,
BAB I PENDAHULUAN 1.1 LATAR BELAKANG Seiring berkembangnya teknologi, makin banyak pulalah hasil-hasil citra digital di berbagai aspek. Citra tersebut bisa merupakan hasil digitalisasi foto-foto analog,
Lebih terperinciPEMBANGUNAN SISTEM CONTENT-BASED IMAGE RETRIEVAL MENGGUNAKAN KODE FRAKTAL DARI DOKUMEN CITRA TESIS ARIF RAHMAN NIM :
PEMBANGUNAN SISTEM CONTENT-BASED IMAGE RETRIEVAL MENGGUNAKAN KODE FRAKTAL DARI DOKUMEN CITRA TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung
Lebih terperinciAnalisis dan Implementasi Short Text Similarity dengan Metode Latent Semantic Analysis Untuk Mengetahui Kesamaan Ayat al-quran
Analisis dan Implementasi Short Text Similarity dengan Metode Latent Semantic Analysis Untuk Mengetahui Kesamaan Ayat al-quran Short Text Similarity Analysis and Implementation with Latent Semantic Analysis
Lebih terperinciSISTEM TEMU KEMBALI CITRA UNTUK E- COMMERCE MENGGUNAKAN PROSEDUR PENCARIAN DUA FASE DENGAN FITUR HISTOGRAM MULTI TEKSTON
SISTEM TEMU KEMBALI CITRA UNTUK E- COMMERCE MENGGUNAKAN PROSEDUR PENCARIAN DUA FASE DENGAN FITUR HISTOGRAM MULTI TEKSTON Nurissaidah Ulinnuha 1), Halimatus Sa dyah 2) Fakultas Sains dan Teknologi, Universitas
Lebih terperinciQUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL
QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL Susetyo Adi Nugroho () Abstrak: Salah satu metode yang sering digunakan dalam mengukur relevansi dokumen
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciINFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER
INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,
Lebih terperinciPENCARIAN CITRA BERDASARKAN BENTUK DASAR TEPI OBJEK DAN KONTEN HISTOGRAM WARNA LOKAL
Makalah Nomor: KNSI-472 PENCARIAN CITRA BERDASARKAN BENTUK DASAR TEPI OBJEK DAN KONTEN HISTOGRAM WARNA LOKAL Barep Wicaksono 1, Suryarini Widodo 2 1,2 Teknik Informatika, Universitas Gunadarma 1,2 Jl.
Lebih terperinciSISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL
SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu
Lebih terperinciSistem Deteksi Kemiripan antar Dokumen Teks Menggunakan Model Bayesian pada Term Latent Semantic Analysis (LSA)
Tugas Akhir Sistem Deteksi Kemiripan antar Dokumen Teks Menggunakan Model Bayesian pada Term Latent Semantic Analysis (LSA) Oleh: Danang Wahyu Wicaksono (1210100027) Pembimbing: 1. Prof. DR. Mohammad Isa
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI Pada bab ini akan dibahas mengenai beberapa landasan teori yang digunakan untuk perancangan dan pembuatan aplikasi rekomendasi informasi yang bisa dijadikan sebagai acuan. 3.1 Media
Lebih terperinciKONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI
KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI Wiranto 1), Edi Winarko 2) 1) Jurusan Teknik Informatika, Universitas Sebelas Maret E-mail : wir@uns.ac.id 2) Program Studi Ilmu
Lebih terperinciKONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI
KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI Wiranto 1, Edi Winarko 2 1 Jurusan Teknik Informatika, Universitas Sebelas Maret 2 Program Studi Ilmu Komputer, Universitas Gajah
Lebih terperinciBAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad
1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan komputer di dalam lingkungan kehidupan masyarakat di seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad terakhir ini. Hal
Lebih terperinciDAFTAR ISI. SKRIPSI... ii
DAFTAR ISI SKRIPSI... i SKRIPSI... ii HALAMAN PENGESAHAN... ii PERNYATAAN... iii HALAMAN MOTO DAN PERSEMBAHAN... iv PRAKATA... v DAFTAR ISI... vii DAFTAR GAMBAR... x DAFTAR TABEL... xiii INTISARI... xiv
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi Proses Temu-Kembali KULIAH #5 Evaluasi IR query : sby query: flu burung Evaluasi IR Indikator yang dapat diukur: Seberapa cepat dia meng-indeks Banyaknya dokumen/jam Terkait
Lebih terperinciPEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN
PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi
Lebih terperinciANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM
ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM Lusianto Marga Nugraha¹, Arie Ardiyanti Suryani², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Stemming
Lebih terperinciBAB I. Pendahuluan. 1. Latar Belakang Masalah
BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan
Lebih terperinciFitur Matriks Populasi Piksel Untuk Membedakan Frame-frame Dalam Deteksi Gerakan
Fitur Matriks Populasi Piksel Untuk Membedakan Frame-frame Dalam Deteksi Gerakan Teady Matius Surya Mulyana tmulyana@bundamulia.ac.id, teadymatius@yahoo.com Teknik Informatika Universitas Bunda Mulia Abstrak
Lebih terperinciAnalisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak
Lebih terperinciInformation Retrieval
Information Retrieval Budi Susanto Information Retrieval Information items content Feature extraction Structured Structured Document Document representation representation Retrieval model: relevance Similarity?
Lebih terperinciPengujian Kerelevanan Sistem Temu Kembali Informasi
Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem
Lebih terperinciAnalisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem
Lebih terperinciPENDAHULUAN. 1.1 Latar Belakang
DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan
Lebih terperinciImplementasi Generalized Vector Space Model Menggunakan WordNet
Implementasi Generalized Vector Space Model Menggunakan WordNet Adi Wibowo*, Andreas Handojo**, Charistian Widjaja*** Jurusan Teknik Informatika Fakultas Teknologi Industri, Universitas Kristen Petra E-Mail:
Lebih terperinciBAB I PENDAHULUAN. Perkembangan teknologi komputer dan internet semakin maju
BAB I PENDAHULUAN I.1 Latar Belakang Masalah Perkembangan teknologi komputer dan internet semakin maju menyebabkan data digital yang dihasilkan, disimpan, ditransmisikan, dianalisis, dan diakses menjadi
Lebih terperinciJurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 1, No. 2, Tahun
Vol. 1, No. 2, Tahun 2012 15 Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Website : http://jurnal.pcr.ac.id/index.php/jakt/about/index Email : pustaka@pcr.ac.id Aplikasi Pendeteksi Plagiat dengan
Lebih terperinciSISTEM PEMBANGKIT ANOTASI PADA ARTIKEL BERGAMBAR DENGAN PENDEKATAN KONTEKSTUAL
SISTEM PEMBANGKIT ANOTASI PADA ARTIKEL BERGAMBAR DENGAN PENDEKATAN KONTEKSTUAL Diana Purwitasari, Dian Sahputra, Esti Yuniar, Umi Laili Yuhana, Daniel Siahaan Lab Semantik, Fakultas Teknologi Informasi,
Lebih terperinciPENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM
Pengukuran Kemiripan Dokumen dengan Menggunakan Tools Gensim (Sekarwati dkk.) PENGUKURAN KEMIRIPAN DOKUMEN DENGAN MENGGUNAKAN TOOLS GENSIM Kemal Ade Sekarwati 1*, Lintang Yuniar Banowosari 2, I Made Wiryana
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciSearch Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI
Search Engine Text Retrieval dan Image Retrieval YENI HERDIYENI 14 JUNI 2008 Search engine atau mesin pencari merupakan bagian dari teknologi inte rnet yang sangat penting untuk pencarian informasi. Dewasa
Lebih terperinciSearch Engines. Information Retrieval in Practice
Search Engines Information Retrieval in Practice All slides Addison Wesley, 2008 Search Engine Architecture Arsitektur dari mesin pencari ditentukan oleh 2 persyaratan efektivitas (kualitas hasil) efisiensi
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Lebih terperinciTemu Kembali Citra Makanan Menggunakan Representasi Multi Texton Histogram
JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: 2337-3539 (2301-9271 Print) A-368 Temu Kembali Citra Makanan Menggunakan Representasi Multi Texton Histogram Imagine Clara Arabella, Nanik Suciati, dan Dini
Lebih terperinciJurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 Edisi... Volume..., Bulan 20.. ISSN :
Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 PENGEMBANGAN KOREKSI ESAI OTOMATIS PADA ELEARNING DI SMK PLUS ANNABA SUKABUMI DENGAN MENGGUNAKAN METODE LATENT SEMANTYC ANALYSIS (LSA) Mashun Sofyan
Lebih terperinciPERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY
Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet
Lebih terperinciBAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
Lebih terperinciISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5097
ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5097 Perancangan Sistem Pemeringkatan Jawaban Pada Forum Tanya Jawab Menggunakan Textual Feature dan Semantic Similarity Answer
Lebih terperinciBAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang
58 BAB 3 METODE PENELITIAN 3.1 Analisis Masalah Seiring dengan perkembangan zaman, jumlah informasi yang disimpan dalam betuk digital semakin bertambah, sehingga dibutuhkan cara pengorganisasian dan pengelolaan
Lebih terperinciINDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id
Lebih terperinciKlasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra
Jurnal Ilmiah Ilmu Komputer, Vol 15 No. 2, Desember 2010 : 38-41 Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra Vera Yunita, Yeni Herdiyeni Departemen Ilmu
Lebih terperinciBAB I PENDAHULUAN. Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan
BAB I PENDAHULUAN 1.1 Latar Belakang Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan sebuah sistem penilaian atau evaluasi. Penilaian adalah suatu proses untuk mengambil keputusan dengan
Lebih terperinciBAB I PERSYARATAN PRODUK
BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama
Lebih terperinciBAB 3 ANALISA DAN PERANCANGAN
BAB 3 ANALISA AN PERANCANGAN 3.1 Gambaran Umum Pada masa sekarang ini, proses pencarian dokumen dalam web seperti Google, Yahoo, dan sebagainya dilakukan dengan menginput query yang diinginkan pada kotak
Lebih terperinciLEMBAR PENGESAHAN TUGAS AKHIR...
DAFTAR ISI HALAMAN SAMPUL... i HALAMAN JUDUL... ii PERNYATAAN... iii LEMBAR PENGESAHAN TUGAS AKHIR... iv BERITA ACARA TUGAS AKHIR... v KATA PENGANTAR... vi ABSTRAK... vii ABSTRACT... viii DAFTAR ISI...
Lebih terperinciBAB 3 PERANCANGAN DAN PEMBUATAN SISTEM
BAB 3 PERANCANGAN DAN PEMBUATAN SISTEM Dalam bab ini akan dibahas mengenai perancangan dan pembuatan sistem aplikasi yang digunakan sebagai user interface untuk menangkap citra ikan, mengolahnya dan menampilkan
Lebih terperinciPERBANDINGAN TEKNIK WATERMARKING CITRA DIGITAL MENGGUNAKAN DWT-SVD DAN RDWT-SVD. Abstract
PERBANDINGAN TEKNIK WATERMARKING CITRA DIGITAL MENGGUNAKAN DWT- DAN Qurrota Ayun Majid, T. Sutojo, S.Si, M.Kom Teknik Informatika - S1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang 111201207118@mhs.dinus.ac.id
Lebih terperinciPemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity
Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Komang Rinartha
Lebih terperinciPemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi
Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami
Lebih terperinciLEMBAR PENGESAHAN TUGAS AKHIR...
DAFTAR ISI HALAMAN SAMPUL... i HALAMAN JUDUL... ii PERNYATAAN... iii LEMBAR PENGESAHAN TUGAS AKHIR... iv BERITA ACARA TUGAS AKHIR... v KATA PENGANTAR... vi ABSTRAK... viii ABSTRACT... ix DAFTAR ISI...
Lebih terperinci1. Introduction. tertentu memegang peran penting dalam. Abstract
Perbandingan Metode Latent Semantic Analysis, Syntactically Enhanced Latent Semantic Analysis, dan Generalized Latent Semantic Analysis dalam Klasifikasi Dokumen Berbahasa Inggris Gilbert Wonowidjojo Bina
Lebih terperinciIMPLEMENTASI TEMU KEMBALI CITRA TEKSTUR MENGGUNAKAN ROTATED WAVELET FILTER
IMPLEMENTASI TEMU KEMBALI CITRA TEKSTUR MENGGUNAKAN ROTATED WAVELET FILTER M. Jamaluddin 1, Nanik Suciati 2, Arya Yudhi Wiajaya 3 1,2,3 Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi
Lebih terperinciBAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan
Lebih terperinciBernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract
IMPLEMENTASI SISTEM TEMU KEMBALI INFORMASI Studi Kasus: Dokumen Teks Berbahasa Indonesia (IMPLEMENTATION OF INFORMATION RETRIEVAL SYSTEM Case Study: Text Document in Indonesian Language) Bernadus Very
Lebih terperinciSISTEM TEMU-KEMBALI INFORMASI DALAM DOKUMEN (PENCARIAN 10 KATA KUNCI DI EJOURNAL BSI)
SISTEM TEMU-KEMBALI INFORMASI DALAM DOKUMEN (PENCARIAN 10 KATA KUNCI DI EJOURNAL BSI) Melisa Winda Pertiwi 1* Taufiqurrochman 2 *12 Program Pascasarjana Magister Ilmu Komputer, Nusa Mandiri Jl. Kramat
Lebih terperinci1. Pendahuluan 1.1 Latar Belakang
1. Pendahuluan 1.1 Latar Belakang Saat ini, kebutuhan manusia akan teknologi semakin meningkat karena tidak bisa dipungkiri bahwa teknologi tersebut dapat meringankan pekerjaan manusia. Hal ini juga diimbangi
Lebih terperinciEkspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal
Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis
Lebih terperinciStudi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine
Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya Terhadap Peningkatan Kinerja Image Search Engine Nugroho Herucahyono (13504038) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika,
Lebih terperinciAPLIKASI CONTENT BASED IMAGE RETRIEVAL DENGAN ALGORITMA SOBEL S EDGE DETECTION Arwin Halim 1, Hernawati Gohzali 2, In Sin 3, Kelvin Wijaya 4
APLIKASI CONTENT BASED IMAGE RETRIEVAL DENGAN ALGORITMA SOBEL S EDGE DETECTION Arwin Halim 1, Hernawati Gohzali 2, In Sin 3, Kelvin Wijaya 4 1,2,3,4 Jurusan Teknik Informatika, STMIK Mikroskil, Medan 1,2,3,4
Lebih terperinciEkstraksi Fitur Warna, Tekstur dan Bentuk untuk Clustered- Based Retrieval of Images (CLUE)
Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Ekstraksi Fitur Warna, Tekstur dan Bentuk untuk Clustered- Based Retrieval of Images (CLUE) I Gusti Rai Agung Sugiartha
Lebih terperinci1. BAB I PENDAHULUAN 1.1 Latar Belakang
1. BAB I PENDAHULUAN 1.1 Latar Belakang Perpustakaan digital merupakan aplikasi praktis yang mengelola koleksi berbagai macam dokumen dalam bentuk digital dan dapat diakses melalui komputer. Melalui aplikasi
Lebih terperinciKlasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN
Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Achmad Ridok 1), Retnani Latifah 2) Filkom
Lebih terperinci