PEMANFAATAN ANALISIS GUGUS (CLUSTER ANALYSIS) PADA SISTEM TEMU KEMBALI INFORMASI BERBASIS INTERNET

Ukuran: px
Mulai penontonan dengan halaman:

Download "PEMANFAATAN ANALISIS GUGUS (CLUSTER ANALYSIS) PADA SISTEM TEMU KEMBALI INFORMASI BERBASIS INTERNET"

Transkripsi

1 PEMANFAATAN ANALISIS GUGUS (CLUSTER ANALYSIS) PADA SISTEM TEMU KEMBALI INFORMASI BERBASIS INTERNET Miswan * ; Mustangimah ** ABSTRAK PEMANFAATAN ANALISIS GUGUS (CLUSTER ANALYSIS) PADA SISTEM TEMU KEMBALI INFORMASI BERBASIS INTERNET. Semakin banyak informasi yang tersedia di internet, semakin sulit untuk menemukan informasi yang relevan. Bagi sebagian besar pemakai internet, mesin penelusur (search engine) tidak dapat mengatasi masalah ini. Sebagai alternatif, mesin penggugus (clustering engine) yang dikembangkan dengan menerapkan analisis gugus memberikan alternatif bagi pemakai untuk menemukan informasi yang relevan diantara informasi yang berserakan di internet. Vivisimo merupakan mesin penggugus yang berfungsi mengelompokkan dokumen-dokumen yang telah diindeks oleh beberapa mesin penelusur. Berdasarkan query dari pemakai, mesin penggugus Vivisimo melakukan meta-search terhadap hasil pengindeksan beberapa mesin penelusur. Hasil meta-search ini kemudian dikelompokkan menjadi gugus-gugus yang diberi label sesuai dengan karakteristik yang dominan dalam gugus yang bersangkutan, dan kemudian ditampilkan kepada pemakai. Gugus-gugus yang terbentuk dapat membantu pencari informasi dalam melakukan penjelajahan dan pemberian interpretasi atau penilaian relevansi terhadap hasil penelusuran. Dengan demikian dapat dikatakan bahwa mesin penggugus sangat bermanfaat bagi pemakai dalam mencari informasi yang relevan di internet. Namun dari sisi lain, mesin penelusur dapat memberikan hasil penelusuran dalam jumlah yang lebih komprehensif. Oleh karena itu mesin penggugus dan mesin penelusur dapat digunakan secara komplemen dalam suatu penelusuran secara suksesif agar proses temu kembali informasi dapat berjalan secara lebih mudah dan diperoleh hasil yang komprehensif. ABSTRACT APPLICATION OF CLUSTER ANALYSIS ON INTERNET-BASED INFORMATION RETRIEVAL SYSTEM. Since much information is available in the Internet, there is more difficult to find out a relevant information. For many Internet users, search engine cannot solve this problem. Clustering engines that apply of cluster analysis provide an alternative way to find out the relevant information among the much information that scattered around the Internet. Vivisimo is a clustering engine that clusters documents have been indexed by many search engines. Based on the user s query, Vivisimo does a meta-search to the indexing results of many search engines. The results of meta-search are clustered to many clusters, which labeled using dominant characteristic of the cluster, and then displayed for the users. The clusters that were formed can help users with guidance to browsing and make * Mahasiswa Program Studi Ilmu Informasi, Perpustakaan, dan Kearsipan; Program Pascasarjana, Universitas Indonesia ** Pusat Pengembangan Teknologi Informasi dan Komputasi - BATAN

2 an interpretation or relevant judgement the searching results. Therefore, it can be said that clustering engine give a benefit for user to find out the relevant information in the Internet. On the other hand, search engines can give more comprehensives searching results. So, the clustering engine and search engines can be used complementary in the successive searching to get easier searching with comprehensive results. PENDAHULUAN Kemajuan yang pesat di bidang teknologi informasi terutama internet, telah menimbulkan ledakan informasi yang hebat. Hal ini terjadi karena internet memungkinkan banyak orang untuk memproduksi, memanipulasi, mengakses dan menyebarluaskan informasi dengan mudah. Setiap hari jutaan orang di dunia menggunakan internet, baik untuk mencari dan memanipulasi informasi yang sudah ada, maupun untuk menciptakan dan menyebarkan informasi baru. Akibatnya, informasi tentang apapun, mulai dari yang sangat berguna bagi manusia atau yang sekedar sampah, tersedia melimpah di internet. Untuk mempermudah dalam mencari dan menelusur informasi di internet telah banyak diciptakan mesin penelusur. Sampai saat ini terdapat beberapa mesin penelusur dengan karakteristik yang berbeda-beda, seperti Google, Yahoo!, Lycos, Ayna, Infoseek, AltaVista, HotBot, Excite, dan sebagainya. Masing-masing mesin penelusur tersebut memiliki beberapa kelebihan dan kekurangan, sehingga antara satu dengan yang lain saling melengkapi. Berkenaan dengan pencarian informasi di internet, mesin penelusur telah menjadi fenomena yang umum. Hampir semua orang yang pernah terlibat dalam pencarian informasi di internet pernah menggunakannya. Dalam proses penelusuran informasi melalui internet sering diperoleh informasi yang sangat banyak, tetapi sebagian besar diantaranya adalah informasi yang tidak dibutuhkan. Oleh karena itu, dari sudut pandang temu kembali informasi (information retrieval), semakin banyaknya informasi yang tersedia di internet justru semakin mempersulit untuk menemukan kembali informasi yang relevan, yaitu informasi yang sesuai dengan kebutuhan. Dalam suatu sistem temu kembali informasi, kemampuan untuk menemukan informasi yang tersedia diukur dengan recall dan kemampuan untuk menemukan informasi yang relevan diukur dengan ketelitian, maka proses penelusuran dalam situasi seperti tersebut di atas akan menghasilkan recall yang tinggi tetapi ketelitian rendah. Hal ini sesuai dengan yang dikemukakan oleh (Zervas dan Ruger, 1999) bahwa salah satu keterbatasan mesin penelusur adalah rendahnya ketepatan dari hasil penelusuran yang diperoleh. Situasi semacam ini dapat diilustrasikan seperti pada Gambar 1 a dan b.

3 A B Gambar 1. a. Hubungan antara informasi yang tersedia dengan kesulitan menemukan informasi yang relevan b. Hubungan antara recall dan ketelitian dalam temu kembali informasi Keterbatasan tersebut dikarenakan beberapa mesin penelusur menerapkan pengindeksan dan penelusuran berbasis full text; yaitu menjadikan semua kata yang muncul dalam teks sebagai indeks atau titik temu dalam penelusuran. Hal ini menjadikan proses penelusuran sangat bergantung pada elastisitas bahasa. Sehingga tidak sedikit pencari informasi yang masih awam (novice) menjadi bingung dan tidak bisa menemukan informasi yang relevan dengan kebutuhannya meskipun telah memanfaatkan mesin penelusur. Dalam situasi seperti itu, para peneliti dalam bidang teknologi informasi, khususnya dalam sistem temu kembali informasi berbasis internet telah berusaha mengembangkan berbagai metoda alternatif untuk menyediakan sarana temu kembali informasi secara efektif dan efisien. Salah satu diantaranya adalah dengan menerapkan analisis gugus. Dalam makalah ini akan dibahas pemanfaatan analisis gugus dalam sistem temu kembali informasi berbasis internet dan cara kerja mesin penggugus sebagai alternatif untuk mencari informasi di internet. DASAR TEORI Document Clustering dalam Sistem Temu Kembali Informasi Secara umum document clustering adalah proses mengelompokkan dokumen berdasarkan kemiripan antara satu dengan yang lain dalam satu gugus (Gordon, 1991; Ellis, 1996: 28). Tujuannya adalah untuk memisahkan dokumen yang relevan dari dokumen yang tidak relevan (Jian Zhang, et al., 2001). Pengelompokan ini didasarkan pada hipotesa yang dikemukakan oleh Van Rijsbergen bahwa dokumen-dokumen yang berkaitan erat cenderung sesuai dengan permintaan informasi yang sama (Ellis, 1996: 28, Can, 1994). Atau dengan kata lain, dokumen-dokumen yang relevan dengan

4 suatu query cenderung memiliki kemiripan satu sama lain dari pada dokumen yang tidak relevan, sehingga dapat dikelompokkan ke dalam suatu gugus (Charikar, et al., 1997). Oleh karena itu, suatu gugus berisi kelompok dokumen homogen yang saling berkaitan antara satu dengan yang lain. Document Clustering dapat dilakukan sebelum atau sesudah proses temu kembali (Jian Zhang, et al., 2001). Pada document clustering yang dilakukan sebelum proses temu kembali informasi, koleksi dokumen dikelompokkan ke dalam gugus berdasarkan kemiripan (similarity) antar dokumen. Selanjutnya dalam proses temu kembali informasi, apabila suatu dokumen ditemukan maka seluruh dokumen yang berada dalam gugus yang sama dengan dokumen tersebut juga dapat ditemukan. Sedangkan document clustering yang dilakukan setelah proses temu kembali informasi, dokumen-dokumen yang dihasilkan disajikan dalam gugus yang terbentuk berdasar kemiripan antar dokumen tersebut, sehingga mempermudah pencari informasi untuk memberikan interpretasi terhadap hasil penelusuran sesuai dengan kebutuhannya (Hearst dan Pederson, 1996). Dalam sistem temu kembali informasi, document clustering memberikan beberapa manfaat, antara lain: - mempercepat pemrosesan query dengan menelusur hanya pada sejumlah kecil anggota atau wakil gugus, sehingga dapat mempercepat proses temu kembali informasi (Harper, Mechkour dan Muresan, 1999) - membantu melokalisir dokumen yang relevan (Hearst dan Pederson, 1996; Leuski, 2001) - membentuk kelas-kelas dokumen sehingga mempermudah penjelajahan dan pemberian interpretasi terhadap hasil penelusuran (Charikar, et al., 1997). - meningkatkan efektivitas dan efisiensi temu kembali informasi dan memberikan alternatif metode penelusuran (Rasmussen, 1992: 438-9) Selain itu, penggabungan antara penelusuran secara menyeluruh (full search) dengan penelusuran berbasis gugus (cluster-based retrieval) dapat meningkatkan ketelitian sampai dengan 25% (Can, 1994). Hal senada dikemukakan oleh Jian Zhang, et al. (2001) bahwa penggabungan antara metode penggugusan dengan fusion (pemberian peringkat terdadap dokumen secara keseluruhan) akan meningkatkan efektivitas temu kembali informasi. Adapun dalam hal penyajian hasil penelusuran, penggabungan antara gugus dan daftar peringkat dapat membantu pemakai dalam menemukan informasi yang relevan (Leuski dan Allan, 2000). Pembentukan Gugus Dokumen dalam Sistem Temu Kembali Informasi Pembentukan gugus dokumen dalam sistem temu kembali informasi merupakan proses yang kompleks, karena melibatkan pemilihan unsur yang dapat mewakili sekelompok dokumen, penetapan fungsi untuk menghubungkan satu dokumen dengan

5 dokumen yang lain, penetapan fungsi untuk menghubungkan dokumen dengan query dan membangun metode atau algoritma penggugusan (Quaresma dan Rodrigues, 2000). Prinsip dasar dalam document Clustering adalah menentukan ukuran kemiripan antar dokumen yang akan dikelompokkan dan menjadikannya sebagai dasar untuk menghasilkan gugus. Kemiripan antar dokumen dapat didasarkan pada beberapa variabel seperti journal intercitation, co-citation (journal co-citation, document co-citation, author cocitation), bibliographic coupling, co-descriptor, dan co-classification. Adapun kemiripan antara dua dokumen X dan Y dapat diukur dengan beberapa cara, yaitu: 1. Simple matching: X Y 2. Dice s coefficient: 2 X Y / X + Y 3. Jaccard s coefficient: X Y / X Y 4. Cosine coefficient: X Y / X 1/2. Y 1/2 5. Overlap coefficient: X Y /min(x,y) Metode pembentukan gugus biasanya dikategorikan menurut tipe dari struktur gugus yang dihasilkan. Secara umum metode penggugusan terbagi menjadi dua, yaitu metode non-hirarkhis dan metode hirarkhis. Metode Non-Hirarkhis Metode non-hirarkhis disebut juga metode partisi, yaitu membagi serangkaian data yang terdiri dari N obyek ke dalam M gugus yang tidak saling tumpang-tindih (overlap) (Rasmussen, 1992: 425). Secara lebih rinci, Salton (1971: 225) mengemukakan bahwa pembentukan gugus dokumen dalam sistem temu kembali informasi dengan metode non-hirarkhis adalah sebagi berikut: a. Membandingkan ciri-ciri identifikasi (identifier) suatu dokumen dengan dokumen lain yang ada dalam koleksi dan mengelompokkan dokumen-dokumen yang memiliki serangkaian ciri-ciri identifikasi yang serupa ke dalam satu gugus. b. Pada setiap gugus dokumen yang dihasilkan, dipilih sebuah unsur yang dapat mewakili seluruh dokumen yang ada dalam gugus yang bersangkutan yang disebut centroid. Menurut Rasmussen (1992: 439) centroid atau perwakilan gugus adalah sebuah record yang dapat mewakili ciri-ciri atau karakteristik dokumen dalam sebuah gugus. c. Proses penelusuran dilakukan dalam dua tahap, yaitu: 1) membandingkan query dengan centroid pada masing-masing gugus dokumen; 2) mencocokkan query dengan masing-masing dokumen dalam gugus yang mengandung centroid yang paling sesuai.

6 Proses pembentukan gugus dokumen dan penelusuran tersebut dapat diilustrasikan seperti pada Gambar 2 Gambar 2. Pembentukan gugus dokumen dengan metode non-hirarkhis dan proses penelusurannya (Salton, 1971: 225) Seiring dengan perkembangan teknologi komputer, metode penggugusan nonhirarkhis ini juga menggunakan algoritma yang semakin kompleks. Sebagai contoh adalah penerapan algoritma genetik (Jones, et al.,1995) dan metode iterative clustering (Zervas dan Ruger, 1999). Metode Hirarkhis Pembentukan gugus dokumen dalam sistem temu kembali informasi dengan metode hirarkhis adalah sebagi berikut: a. Mengidentifikasi dua dokumen yang paling mirip dan menggabungkannya menjadi sebuah gugus. b. Mengidentifikasi dan menggabungkan dua dokumen yang paling mirip berikutnya menjadi sebuah gugus sampai semua dokumen tergabung dalam gugus-gugus yang terbentuk. Struktur gugus yang dihasilkan oleh metode hirarkhis ini biasanya diperlihatkan struktur diagram pohon atau dendrogram seperti terlihat pada Gambar 3 a dan b.

7 Gambar 3a. Dendrogram dari Hierarchical Clustering (Rasmussen, 1992: 426) Gambar 3b. Pohon dari Hierarchical Clustering (Salton, 1989: 324) Kemiripan antar dokumen ditentukan dengan mengukur jarak antar dokumen. Dua dokumen yang mempunyai jarak paling kecil dikatakan mempunyai kemiripan paling tinggi, dan dikelompokkan ke dalam satu gugus yang sama. Sebaliknya dua

8 dokumen yang mempunyai jarak paling besar dikatakan mempunyai kemiripan paling rendah, dan dimasukkan ke dalam gugus yang berbeda. Beberapa metode yang dapat digunakan untuk menentukan jarak antar dua dokumen antara lain: single link, complete link, group average link, Ward s method, centroid method dan median method (Rasmussen, 1992: 426-7). CARA KERJA CLUSTERING ENGINE : VIVISIMO ( Vivisimo adalah bahasa Romawi yang artinya lively, bright and clever (cemerlang, cerdas dan pintar). Vivisimo dikembangkan pada Juni 2000 di Computer Science Departement, Carnegie Mellon University yang berlokasi di Pittsburgh Pennsylvania USA. Vivisimo mengklaim dirinya sebagai mesin pengggugus, bukan mesin penelusur. Ia tidak mengindeks web sebagaimana yang dilakukan oleh mesin penelusur, tetapi mengorganisasi hasil pengindeksan mesin penelusur lain. Inti teknologi Vivisimo adalah document clustering, yang secara otomatis mengorganisir dokumen ke dalam kelompok yang bermakna ( Proses yang dikerjakan oleh Vivisimo adalah menerima query dari pemakai kemudian melakukan meta-search atas dasar query tersebut terhadap hasil pengindeksan yang dilakukan oleh beberapa mesin penelusur. Hasil meta-search ini kemudian dikelompokkan secara otomatis untuk membentuk kelompok dokumen dan kemudian memberinya label. Terakhir, hasil yang berupa kelompok dokumen yang telah diberi label ini kemudian ditampilkan kepada pemakai dengan tampilan seperti windows explorer. Proses ini dapat dilihat pada Gambar 4.

9 Gambar 4. Cara kerja Vivisimo ( Adapun sintaks query pada Vivisimo hampir sama dengan sintaks query pada mesin penelusur secara umum. Query dapat dimasukkan dengan menggunakan operator Boolean (AND, OR dan NOT), dengan operator proximity (NEAR), berupa frase yaitu dengan memasukkan kalimat dalam tanda kutip ( frase ) dan sebagainya. Sintaks query yang dapat dimasukkan untuk melakukan temu kembali informasi di internet melalui Vivisimo secara lengkap dapat dilihat pada Lampiran 1.

10 ANALISIS HASIL PENELUSURAN Untuk membandingkan unjuk kerja mesin penggugus dan mesin penelusur dalam proses temu kembali informasi di internet, telah dilakukan penelusuran informasi dengan menggunakan Vivisimo sebagai mesin penggugus dan salah satu mesin penelusur yang cukup populer yaitu Google. Penelusuran informasi dengan mesin penggugus Vivisimo dilakukan melalui situs dan penelusuran informasi dengan mesin penelusur Google dilakukan melalui situs Penelusuran dilakukan dengan memasukkan frase: DOCUMENT CLUSTERING sebagai query pada masing-masing engine. Hasil yang diperoleh adalah seperti tercantum pada Gambar 5 untuk penelusuran menggunakan mesin penggugus Vivisimo dan Gambar 6 untuk penelusuran menggunakan mesin penelusur Google. Kedua hasil penelusuran tersebut mempunyai karakteristik yang berbeda seperti terlihat pada Tabel 1. Gambar 5. Hasil Penelusuran menggunakan Vivisimo

11 Gambar 6. Hasil penelusuran menggunakan Google Tabel 1. Perbandingan hasil penelusuran menggunakan Vivisimo dan Google Vivisimo Google 1. Jumlah dokumen yang ditemukan 2. Tampilan Dikelompokkan dalam 10 Ditampilkan dalam gugus dokumen bentuk daftar per halaman 3. Browsing Membuka masing-masing Membuka halaman 4. Alat bantu interpretasi atau penilaian relevansi gugus dokumen Label pada masing-masing gugus dokumen demi halaman Tidak ada Vivisimo hanya berhasil menjaring133 dokumen yang dikelompokkan ke dalam 10 (sepuluh) gugus yang masing-masing diberi label yang sesuai dengan

12 karakteristik yang menonjol dalam kelompok tersebut. Label gugus adalah hierarchical, researches, visualization, classification, search engine, slide, document clustering, effectively, mining, dan publication. Adapun Google berhasil menjaring sebanyak dokumen yang ditampilkan dalam bentuk daftar (list) per halaman. Tiap-tiap halaman berisi 10 dokumen, sehingga hasil penelusuran tersebut secara keseluruhan ditampilkan dalam 533 halaman. Penyajian hasil penelusuran pada Vivisimo dalam bentuk gugus sangat membantu pemakai dalam menemukan informasi yang relevan dengan kebutuhannya. Misalnya untuk kasus di atas, apabila pemakai mencari informasi tentang document clustering yang berkaitan atau berupa hasil penelitian, maka ia tidak perlu menjelajah seluruh dokumen hasil pencarian. Ia cukup memeriksa gugus yang berlabel researches yang berisi dokumen dengan topik document clustering yang berkaitan atau berupa hasil penelitian. Atau jika kurang puas maka ia dapat memeriksa gugus yang lain yang menurutnya berisi dokumen dengan topik yang dekat atau mirip dengan topik yang sedang ia cari. Atau ia dapat melakukan perbaikan query untuk melakukan penelusuran selanjutnya berdasar hasil yang ia peroleh dari query pertama. Hal ini sesuai dengan beberapa penelitian yang telah dikemukakan oleh Hearst dan Pederson (1996); Leuski, Anton dan James Allan (2000); dan Leuski (2001). Di sisi lain, hasil yang disajikan oleh Google dalam bentuk daftar, kurang membantu pemakai untuk menemukan informasi yang ia butuhkan. Ia harus menjelajah seluruh hasil pencarian halaman demi halaman untuk menemukannya. Hal ini tentu tidak efisien, sebab untuk kasus di atas ia harus menjelajah 533 halaman yang memuat dokumen yang seringkali terdapat duplikasi. Dengan demikian mesin penggugus ini cocok bagi sebagian besar pencari informasi di internet yang tidak dapat merumuskan kebutuhan informasinya dalam bentuk query yang spesifik (novice user). Apalagi hasil penelitian Amanda Spink, et al. (2001) menunjukkan bahwa sebagian besar pemakai internet sangat jarang menggunakan fitur-fitur penelusuran yang kompleks (advanced). Namun dari sisi perolehan, Google dapat menjaring lebih banyak dokumen dari pada vivisimo. Seringkali dokumen yang berhasil dijaring oleh Google tidak terjaring melalui Vivisimo. Hal ini menunjukkan bahwa hasil pencarian Google sangat komprehensif. Hasil penelusuran yang komprehensif ini sangat bermanfaat bagi para pencari informasi yang dapat merumuskan kebutuhan informasinya secara jelas sehingga dapat memastikan mana informasi yang relevan dengan kebutuhannya dan mana informasi yang tidak relevan. Berdasarkan karakteristik hasil penelusuran tersebut maka mesin penggugus dapat digunakan sebagai titik tolak dalam melakukan temu kembali informasi di internet. Maksudnya, pada saat temu kembali informasi di internet, pemakai pertama kali dapat melakukan penelusuran sederhana melalui mesin penggugus. Setelah memperoleh hasil yang relevan dengan kebutuhannya namun masih kurang puas, ia dapat memperbaiki query untuk melakukan penelusuran lebih lanjut berdasarkan hasil yang diberikan oleh mesin penggugus tersebut. Penelusuran dengan query yang kompleks ini dapat dilakukan dengan memanfaatkan mesin penelusur yang terbukti dapat menjaring informasi yang lebih komprehensif daripada mesin penggugus.

13 Dengan demikian maka mesin penggugus dan mesin penelusur dapat digunakan secara komplemen dalam suatu penelusuran secara suksesif sehingga proses temu kembali informasi dapat berjalan secara lebih mudah dan diperoleh hasil yang konprehensif. KESIMPULAN Penerapan analisis gugus dalam sistem temu kembali informasi berbasis internet bertujuan untuk mengelompokkan dokumen ke dalam gugus-gugus berdasarkan kesamaan antar dokumen. Vivisimo merupakan mesin penggugus yang berfungsi untuk mengelompokkan dokumen-dokumen yang ditemukan oleh beberapa mesin penelusur dalam suatu proses penelusuran. Berdasarkan query dari pemakai mesin penggugus Vivisimo melakukan metasearch terhadap hasil pengideksan yang dilakukan oleh beberapa mesin penelusur. Hasil meta-search ini kemudian dikelompokkan menjadi gugus-gugus yang secara otomatis diberi label, dan kemudian ditampilkan kepada pemakai dengan tampilan seperti windows explorer. Gugus-gugus yang terbentuk dapat membantu pencari informasi dalam melakukan penjelajahan dan pemberian interpretasi atau penilaian relevansi terhadap hasil penelusuran. Dengan demikian dapat dikatakan bahwa mesin penggugus sangat bermanfaat bagi pemakai terutama pemakai pemula (novice user) dalam mencari informasi di internet. Namun dari sisi lain, mesin penelusur dapat memberikan hasil penelusuran dalam jumlah yang lebih komprehensif. Dengan demikian maka mesin penggugus dan mesin penelusur dapat digunakan secara komplemen dalam suatu penelusuran secara suksesif sehingga proses temu kembali informasi dapat berjalan secara lebih mudah dan diperoleh hasil yang konprehensif. DAFTAR PUSTAKA 1. CAN, FAZLI, On the Efficiency of Best-Match Cluster Searches,. Information Processing & Management, 30 (3) (1994)

14 2. CHARIKAR, MOSES, ET AL, Incremental Clustering and Dynamic Information Retrieval, Proceedings of the 29 th Annual Symposium on the Theory of Computing, (Diakses 27 April 2002), (1997) 3. ELLIS, DAVID, Progress and Problems in Information Retrieval, 2 nd ed. London: Library Association (1996) 4. GORDON, MICHAEL D, User-Based Document Clustering by Redescribing Subject Descriptions with a Genetic Algorithm,. Journal of American Society for Information Science, 42 (5) (1991) HARPER, DAVID J., MOURAD MECHKOUR, DAN GHEORGHE MURESAN, Document Clustering for Mediated Information Acces, Proceeding of 21st BCS-IRSG Colloquium on Information Retrieval, Glasgow (Diakses 27 April 2002),(1999) 6. HEARST, MARTI A. DAN JAN O. PEDERSE,.Reexamining the Cluster Hypothesis: Scatter/Gather on Retrieval Results, Proceedings of the Nineteenth Annual International ACM SIGIR Conference, Zurich, (Diakses pada 26 April 2002), June(1999) 7. (Diakses 16 Maret 2002) 8. JIAN ZHANG, et al., (2001). Improving the Effectiveness of Information Retrieval with Clustering and Fusion. Akan diterbitkan di Computational Linguistics and Chinese Language Processing, 2001, paper/clclp01-2.pdf (Diakses 27 April 2002) 9. JONES, GARETH, et al, Non-Hierarchic Document Clustering Using a Genetic Algorithm, Information Research, 1 (1), (Diakses 16 Maret 2002), (1995) 10. LEUSKI, ANTON, Evaluating Document Clustering for Interactive Information Retrieval,. (Diakses 25 April 2002), (2001) 11. LEUSKI, ANTON DAN JAMES ALLAN, Improving Interactive Retrieval by Combining Ranked List and Clustering, Proceedings of RIAO 2000 Conference,

15 Paris CombineRankedListClustering.pdf. (Diakses 25 April 2002), (2001) 12. QUARESMA, PAOLO DAN IRENE P. RODRIGUES, Automatic Classification and Intelligent Clustering for WWWeb Information Retrieval Systems, The Journal of Information, Law and Technology (JILT), 2, (Diakses 5 April 2002), (2000) 13. RASMUSSEN, EDIE,.Clustering Algorithms, dalam William B. Frakes dan Ricardo Baeza-Yates, eds, Information Retrieval: Data Structures & Algorithms. Englewood Cliff: Prentice-Hall, (1992) SALTON, G, Cluster Search Strategies and the Optimization of Retrieval Efectiveness, dalam G. Salton, ed. The SMART Retrieval System: Experiments in Automatic Document Processing. Englewood Cliffs: Prentice-Hall, (1971) SALTON, G, Automatic Text Processing: the Transformation, Analysis, and Retrieval of Information by Computer. Reading, Massachusetts: Addison-Wesley (1989) 16. SPINK, AMANDA, et al., Searching the Web: The public and Their Queries, Journal of the American Society for Information Science and Technology (JASIST), 52 (3) (2001) ZAMIR, OREN DAN OREN ETZIONI, Web Document Clustering: A Feasibility Demonstration, Proceedings of the 21 st Annual International ACM SIGIR Conference, Melbourne. WebWare1/etzioni/www/papers/sigir98.pdf (Diakses 30 April 2002), (1998) 18. ZERVAS, GIORGOS DAN STEFAN M. RUGER, The Curse of Dimensionality and Document Clustering,, (Diakses 16 Maret 2002), (1999)

16 Lampiran 1. Sintaks Penelusuran Melalui Vivisimo ( AND or + or a nd or nothing " " OR or or AND NOT,NOT or - NEAR or ~ ( ) domain:domai nname host: or site:ho stname image:filenam e link:urltext linktext:text related:urlte xt text:text title:text url:text Finds documents containing all of the specified words or phrases. Video AND disc finds documents with both the word video and the word disc. Note that this is the default option. Finds documents containing the exact phrase. "Video disc" would find documents about video discs and not only about discs and/or videos in general. Finds documents containing at least one of the specified words or phrases. Video OR disc finds documents containing either video or disc. The documents returned can contain both words, but not necessarily. Excludes documents containing the specified word or phrase. Video AND NOT disc finds documents with video but not containing disc. Finds documents containing both specified words or phrases close to each other. Video NEAR disc would find documents with video disc, but probably not any other kind of disc. Use parentheses to group complex Boolean phrases. For example, (video AND disc) AND (recorder OR player) finds documents with the words 'video disc and recorder' or 'video disc and player' or both. Finds pages within the specified domain. Use domain:fr to find pages from France, or use domain:edu to find pages from educational sites. Do not put a space before or after the colon. You must repeat the keyword to search for more than one word or phrase; for example, applet:myapp OR applet:myotherapp to find pages containing an applet called either myapp or myotherapp. Finds pages on a specific host. The search host:yahoo.com would find pages on whose host name (the first part of the URL) contains yahoo.com (like infos.yahoo.com.uk, etc...). Finds pages with images having a specific filename. Use image:france to find pages with images having names containing the word france. Finds pages with a link to a page with the specified URL text. Use link:vivisimo.com to find all pages linking to vivisimo.com. Finds pages that contain the specified word or phrase in the text of a hyperlink. linktext:review +films would find pages with review in a link and with the word films in the content of the page. Finds pages similar to or related to the specified URL. For example, related: finds Web sites related to Carnegie Mellon University. related: finds travel sites in United Kingdom. Note that we use the capabilities of the underlying mesin penelusurs and are not responsible for the quality of the match... Finds pages that contain the specified text in any part of the page other than an image tag, link, or URL. Finds pages that contain the specified word or phrase in the page title (which appears in the title bar of most browsers). Finds pages with a specific word or phrase anywhere in the URL. Use url:video to find all pages on all servers that have the word video anywhere in the host name, path, or filename.

BAB IV HASIL PERBANDINGAN DAN PEMBAHASAN

BAB IV HASIL PERBANDINGAN DAN PEMBAHASAN BAB IV HASIL PERBANDINGAN DAN PEMBAHASAN 4.1 Perbandingan Fasilitas Advance Search untuk Pencarian Dokumen pada Search Engine Google, Yahoo, Ask Jeeves, Altavista dan Scirus Perbandingan fasilitas Advance

Lebih terperinci

1. PENDAHULUAN. Perkembangan teknologi informasi, khususnya teknologi Internet. mudah dan gratis, mengakibatkan informasi berlimpah.

1. PENDAHULUAN. Perkembangan teknologi informasi, khususnya teknologi Internet. mudah dan gratis, mengakibatkan informasi berlimpah. 1. PENDAHULUAN A. Latar Belakang Perkembangan teknologi informasi, khususnya teknologi Internet sebagai wadah untuk dapat dengan mudah menyebarkan informasi secara mudah dan gratis, mengakibatkan informasi

Lebih terperinci

STUDI PERBANDINGAN FASILITAS DAN KINERJA SEARCH ENGINES DALAM PENCARIAN DOKUMEN BERBASIS WEB HERY WIDHIARTO

STUDI PERBANDINGAN FASILITAS DAN KINERJA SEARCH ENGINES DALAM PENCARIAN DOKUMEN BERBASIS WEB HERY WIDHIARTO STUDI PERBANDINGAN FASILITAS DAN KINERJA SEARCH ENGINES DALAM PENCARIAN DOKUMEN BERBASIS WEB HERY WIDHIARTO SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2010 PERNYATAAN MENGENAI TESIS Dengan ini

Lebih terperinci

HIERARCHICAL AGGLOMERATIVE CLUSTERING UNTUK PENGELOMPOKAN SKRIPSI MAHASISWA

HIERARCHICAL AGGLOMERATIVE CLUSTERING UNTUK PENGELOMPOKAN SKRIPSI MAHASISWA HIERARCHICAL AGGLOMERATIVE CLUSTERING UNTUK PENGELOMPOKAN SKRIPSI MAHASISWA Herny Februariyanti 1, Dwi Budi Santoso 2 1,2 Program Studi Sistem Informasi, Fakultas Teknologi Informasi, Universitas Stikubank,

Lebih terperinci

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM Lusianto Marga Nugraha¹, Arie Ardiyanti Suryani², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Stemming

Lebih terperinci

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,

Lebih terperinci

Gambar 2. Halaman web dari Google. Search Bar

Gambar 2. Halaman web dari Google. Search Bar TEKNIK SEARCHING EFEKTIF DI INTERNET Restu Widiatmono, M.Si. Disampaikan dalam Workshop Peningkatan Strategi Belajar melalui IT, Program Hibah Kompetisi A2 Tahun 2007, Jurusan Pendidikan Bahasa Inggris

Lebih terperinci

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya Terhadap Peningkatan Kinerja Image Search Engine Nugroho Herucahyono (13504038) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika,

Lebih terperinci

EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA

EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA EFISIENSI PHRASE SUFFIX TREE DENGAN SINGLE PASS CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN WEB BERBAHASA INDONESIA Desmin Tuwohingide 1, Mika Parwita 2, Agus Zainal Arifin 3, Diana Purwitasari 4 1,2,3,4 Teknik

Lebih terperinci

KLASTERING DOKUMEN MENGGUNAKAN HIERARCHICAL AGGLOMERATIVE CLUSTERING

KLASTERING DOKUMEN MENGGUNAKAN HIERARCHICAL AGGLOMERATIVE CLUSTERING KLASTERING DOKUMEN MENGGUNAKAN HIERARCHICAL AGGLOMERATIVE CLUSTERING Herny Februariyanti 1 Edi Winarko 2 1) Sistem Informasi, Universitas Stikubank Semarang, email: herny@unisbank.ac.id 2) Ilmu Komputer,

Lebih terperinci

DR.LULUK FAUZIAH, M.SI FISIP UNIVERSITAS MUHAMMADIYAH SIDOARJO 27 AGUSTUS 2016

DR.LULUK FAUZIAH, M.SI FISIP UNIVERSITAS MUHAMMADIYAH SIDOARJO 27 AGUSTUS 2016 DR.LULUK FAUZIAH, M.SI FISIP UNIVERSITAS MUHAMMADIYAH SIDOARJO 27 AGUSTUS 2016 Teks/full-text Indeks/abstrak Suara/lagu Gambar/foto/imej Perangkat lunak Video, film Game Animasi Data statistik Formula/paten

Lebih terperinci

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang

Lebih terperinci

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha ABSTRAK Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian atau penemuan kembali informasi yang relevan terhadap kebutuhan pengguna. Kebutuhan pengguna, diekspresikan

Lebih terperinci

Penerapan Algoritma K-Means untuk Clustering

Penerapan Algoritma K-Means untuk Clustering Seminar Perkembangan dan Hasil Penelitian Ilmu Komputer (SPHP-ILKOM) 71 Penerapan Algoritma K-Means untuk ing Dokumen E-Jurnal STMIK GI MDP Ernie Kurniawan* 1, Maria Fransiska 2, Tinaliah 3, Rachmansyah

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

Information Retrieval

Information Retrieval Information Retrieval Budi Susanto Information Retrieval Information items content Feature extraction Structured Structured Document Document representation representation Retrieval model: relevance Similarity?

Lebih terperinci

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract IMPLEMENTASI SISTEM TEMU KEMBALI INFORMASI Studi Kasus: Dokumen Teks Berbahasa Indonesia (IMPLEMENTATION OF INFORMATION RETRIEVAL SYSTEM Case Study: Text Document in Indonesian Language) Bernadus Very

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma

Lebih terperinci

Bab 1. KONSEP DASAR SISTEM TEMU KEMBALI INFORMASI

Bab 1. KONSEP DASAR SISTEM TEMU KEMBALI INFORMASI Bab 1. KONSEP DASAR SISTEM TEMU KEMBALI INFORMASI Tipe Sistem Informasi Sistem Temu Kembali Informasi (Information Retrieval System - IRS) merupakan salah satu tipe sistem informasi. Selain Sistem Temu

Lebih terperinci

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,

Lebih terperinci

PENDAHULUAN. I.1 Latar Belakang

PENDAHULUAN. I.1 Latar Belakang I PENDAHULUAN I.1 Latar Belakang Internet sebagai jaringan komputer skala global telah mendorong pertambahan jumlah informasi digital. Pada sistem yang bersifat terbuka seperti internet, pertambahan informasi

Lebih terperinci

Search Engines. Information Retrieval in Practice

Search Engines. Information Retrieval in Practice Search Engines Information Retrieval in Practice All slides Addison Wesley, 2008 Search Engine Architecture Arsitektur dari mesin pencari ditentukan oleh 2 persyaratan efektivitas (kualitas hasil) efisiensi

Lebih terperinci

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE Rila Mandala Kelompok Keahlian Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10 Bandung,

Lebih terperinci

Text dan Web Mining. Budi Susanto Teknik Informatika UKDW Yogyakarta

Text dan Web Mining. Budi Susanto Teknik Informatika UKDW Yogyakarta Text dan Web Mining Budi Susanto Teknik Informatika UKDW Yogyakarta Deskripsi Matakuliah ini secara prinsip menekankan tentang teknik-teknik yang perlu diketahui mahasiswa dalam mengelola kumpulan dokumen

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #9 Text Clustering (Ch.16 & 17) Clustering Pengelompokan, penggerombolan Proses pengelompokan sekumpulan obyek ke dalam kelas-kelas obyek yang memiliki sifat sama.

Lebih terperinci

Penelusuran online dan Pelaporan

Penelusuran online dan Pelaporan Jurnalistik Online Penelusuran online dan Pelaporan Pertemuan ke 5 (25 Oktober 2013) Penelusuran daring Penelusuran dalam dunia online: simpel 1. Masukkan kata kunci ke kotak pencarian pada suatu mesin

Lebih terperinci

Pencarian dengan Yahoo! Search

Pencarian dengan Yahoo! Search Pencarian dengan Yahoo! Search Sudah pernah menggunakan Yahoo! search? Tentunya sudah pernah bukan! Yahoo search adalah mesin pencari yang dimiliki oleh Yahoo!. Berdasarkan fakta, Yahoo search merupakan

Lebih terperinci

INTEGRASI PEMBOBOTAN TF IDF PADA METODE K-MEANS UNTUK CLUSTERING DOKUMEN TEKS

INTEGRASI PEMBOBOTAN TF IDF PADA METODE K-MEANS UNTUK CLUSTERING DOKUMEN TEKS i TESIS INTEGRASI PEMBOBOTAN TF IDF PADA METODE K-MEANS UNTUK CLUSTERING DOKUMEN TEKS DEDDY WIJAYA SULIANTORO No. Mhs. : 105301466/PS/MTF PROGRAM STUDI MAGISTER TEKNIK INFORMATIKA PROGRAM PASCA SARJANA

Lebih terperinci

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Pengujian Kerelevanan Sistem Temu Kembali Informasi Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem

Lebih terperinci

Temu Kembali Informasi Big Data Menggunakan K-Means Clustering

Temu Kembali Informasi Big Data Menggunakan K-Means Clustering Temu Kembali Informasi Big Data Menggunakan K-Means Clustering Imam Marzuki Universitas Panca Marga Program Studi Teknik Elektro Jln. Yos Sudarso 107 Pabean Dringu Probolinggo 67271, Indonesia E-mail:

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

KOM341 Temu Kembali Informasi

KOM341 Temu Kembali Informasi KOM341 Temu Kembali Informasi KULIAH #1 Kontrak Perkuliahan Pendahuluan Matakuliah o Nama Matakuliah : Temu Kembali Informasi o Kode Matakuliah : KOM431 o Beban Kredit : 3(3-0) o Semester : Gasal, 2014/2015

Lebih terperinci

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester

Lebih terperinci

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning CLUSTERING DEFINISI Clustering : Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis Bentuk yang paling umum digunakan adalah unsupervised learning # Unsupervised learning

Lebih terperinci

APLIKASI SEARCH ENGINE PAPER/KARYA ILMIAH BERBASIS WEB DENGAN METODE FUZZY RELATION ABSTRAK: Banyaknya jumlah paper yang dikoleksi sebuah lembaga

APLIKASI SEARCH ENGINE PAPER/KARYA ILMIAH BERBASIS WEB DENGAN METODE FUZZY RELATION ABSTRAK: Banyaknya jumlah paper yang dikoleksi sebuah lembaga APLIKASI SEARCH ENGINE PAPER/KARYA ILMIAH BERBASIS WEB DENGAN METODE FUZZY RELATION ABSTRAK: Banyaknya jumlah paper yang dikoleksi sebuah lembaga pendidikan setiap tahun akan bertambah. Seiring dengan

Lebih terperinci

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE Sri Ulinar Romatua N B¹, Yanuar Firdaus A.w.², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Dengan semakin

Lebih terperinci

Saat ini Web merupakan sumber informasi dengan volume yang besar.

Saat ini Web merupakan sumber informasi dengan volume yang besar. TUGAS AKHIR Sistem Ekstraksi Informasi Web Menggunakan Metode Pencarian Pola Otomatis Berbasis Pencocokan Pohon Sigit Dewanto 05/186213/PA/10559 http://nuevasystem.com PENDAHULUAN Latar Belakang Masalah

Lebih terperinci

Mengenal Information Retrieval

Mengenal Information Retrieval STBI-2011 Sistem Temu Balik Informasi 2011 Mengenal Information Retrieval Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress.com 2 3 Amazon.com 4 Amazon.com 5 6 7 8 9 Wordpress.com

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #1 Kontrak Perkuliahan Pendahuluan Matakuliah Nama Matakuliah : Temu Kembali Informasi Kode Matakuliah : KOM431 Beban Kredit : 3(3-0) Semester : Gasal, 2009/2010 Koordinator

Lebih terperinci

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad 1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan komputer di dalam lingkungan kehidupan masyarakat di seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad terakhir ini. Hal

Lebih terperinci

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL Susetyo Adi Nugroho () Abstrak: Salah satu metode yang sering digunakan dalam mengukur relevansi dokumen

Lebih terperinci

KESASTRAAN MELAYU TIONGHOA DAN KEBANGSAAN INDONESIA: JILID 2 FROM KPG (KEPUSTAKAAN POPULER GRAMEDIA)

KESASTRAAN MELAYU TIONGHOA DAN KEBANGSAAN INDONESIA: JILID 2 FROM KPG (KEPUSTAKAAN POPULER GRAMEDIA) Read Online and Download Ebook KESASTRAAN MELAYU TIONGHOA DAN KEBANGSAAN INDONESIA: JILID 2 FROM KPG (KEPUSTAKAAN POPULER GRAMEDIA) DOWNLOAD EBOOK : KESASTRAAN MELAYU TIONGHOA DAN KEBANGSAAN Click link

Lebih terperinci

KLASTERING BERITA ONLINE TENTANG BENCANA DENGAN ALGORITMA SINGLE PASS CLUSTERING Herny Februariyanti, Eri Zuliarso, Mardi Siswo Utomo

KLASTERING BERITA ONLINE TENTANG BENCANA DENGAN ALGORITMA SINGLE PASS CLUSTERING Herny Februariyanti, Eri Zuliarso, Mardi Siswo Utomo KLASTERING BERITA ONLINE TENTANG BENCANA DENGAN ALGORITMA SINGLE PASS CLUSTERING Herny Februariyanti, Eri Zuliarso, Mardi Siswo Utomo Abstract Too many type of natural disaster that came and went over

Lebih terperinci

2. Searching, Bookmark dan Download

2. Searching, Bookmark dan Download 2. Searching, Bookmark dan Download 2.1. Mencari Informasi Kegiatan yang paling banyak dilakukan pengguna Internet adalah mencari informasi tertentu yang sesuai dengan yang dibutuhkan, kegiatan ini disebut

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi Proses Temu-Kembali KULIAH #5 Evaluasi IR query : sby query: flu burung Evaluasi IR Indikator yang dapat diukur: Seberapa cepat dia meng-indeks Banyaknya dokumen/jam Terkait

Lebih terperinci

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Dokumen Penyimpanan yang Terorganisasi Database Mahasiswa Database Buku ID Nama Buku Pengarang 001 Information Retrieval Ricardo baeza

Lebih terperinci

TIK Agribisnis UMY 2016 Heri Akhmadi, S.P., M.A.

TIK Agribisnis UMY 2016 Heri Akhmadi, S.P., M.A. Search Engines TIK Agribisnis UMY 2016 Heri Akhmadi, S.P., M.A. Today s Lecture Mengenal dan menggunakan search engine (SE) untuk mendapatkan informasi Membandingkan kelebihan dan kelemahan beberapa SE,

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem

Lebih terperinci

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

BAB I PENDAHULUAN 1.1 LATAR BELAKANG BAB I PENDAHULUAN Pada bab ini akan dibahas latar belakang penelitian, perumusan masalah, tujuan penelitian, manfaat penelitian dan batasan masalah. 1.1 LATAR BELAKANG Perkembangan penggunaan informasi

Lebih terperinci

BAB IV PREPROCESSING DATA MINING

BAB IV PREPROCESSING DATA MINING BAB IV PREPROCESSING DATA MINING A. Konsep Sebelum diproses data mining sering kali diperlukan preprocessing. Data preprocessing menerangkan tipe-tipe proses yang melaksanakan data mentah untuk mempersiapkan

Lebih terperinci

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :

Lebih terperinci

ABSTRAK Kata kunci : Universitas Kristen Maranatha

ABSTRAK Kata kunci : Universitas Kristen Maranatha APLIKASI ALGORITMA GENETIK PADA SIMULASI PENCARIAN JALUR OPTIMAL MENGGUNAKAN BAHASA JAVA R. Bg. Merdianto / 0222079 Jurusan Teknik Elektro, Fakultas Teknik, Jl. Prof. Drg. Suria Sumantri 65, Bandung 40164,

Lebih terperinci

Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI

Search Engine. Text Retrieval dan Image Retrieval YENI HERDIYENI Search Engine Text Retrieval dan Image Retrieval YENI HERDIYENI 14 JUNI 2008 Search engine atau mesin pencari merupakan bagian dari teknologi inte rnet yang sangat penting untuk pencarian informasi. Dewasa

Lebih terperinci

Klastering Dokumen Berita dari Web menggunakan Algoritma Single Pass Clustering

Klastering Dokumen Berita dari Web menggunakan Algoritma Single Pass Clustering Klastering Dokumen Berita dari Web menggunakan Algoritma Single Pass Clustering Herny Februariyanti dan Eri Zuliarso Fakultas Teknologi Informasi, Universitas Stikubank Email: herny@unisbank.ac.id, eri299@gmail.com

Lebih terperinci

BAB 3 ANALISA DAN PERANCANGAN

BAB 3 ANALISA DAN PERANCANGAN BAB 3 ANALISA AN PERANCANGAN 3.1 Gambaran Umum Pada masa sekarang ini, proses pencarian dokumen dalam web seperti Google, Yahoo, dan sebagainya dilakukan dengan menginput query yang diinginkan pada kotak

Lebih terperinci

DAFTAR PUSTAKA. [2] Berlianty, I. dan Arifin, M Teknik-Teknik Optimasi Heuristik. Yogyakarta : Graha Ilmu.

DAFTAR PUSTAKA. [2] Berlianty, I. dan Arifin, M Teknik-Teknik Optimasi Heuristik. Yogyakarta : Graha Ilmu. DAFTAR PUSTAKA [1] Basuki, A. 2003. Algoritma Genetika, Suatu Alternatif Penyelesaian Permasalahan Searching, Optimasi dan Machine Learning. Surabaya: PENS-ITS. [2] Berlianty, I. dan Arifin, M. 2010. Teknik-Teknik

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak

Lebih terperinci

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan

Lebih terperinci

PERANCANGAN CLIENT DENGAN PENGKLASIFIKASIAN MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI MOSES CHRISTIAN

PERANCANGAN  CLIENT DENGAN PENGKLASIFIKASIAN  MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI MOSES CHRISTIAN PERANCANGAN EMAIL CLIENT DENGAN PENGKLASIFIKASIAN EMAIL MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI MOSES CHRISTIAN 081402050 PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI

Lebih terperinci

Penerapan Model Information Retrieval Untuk Pencarian Konten Pada Perpustakaan Digital

Penerapan Model Information Retrieval Untuk Pencarian Konten Pada Perpustakaan Digital Penerapan Model Information Retrieval Untuk Pencarian Konten Pada Perpustakaan Digital Eka Fitriani 1, Richardus Eko Indrajit 2, Riska Aryanti 3 1 STMIK Nusa Mandiri Jakarta, Indonesia Fitranieka817@gmail.com

Lebih terperinci

MESIN PENCARI INFORMASI

MESIN PENCARI INFORMASI BAB 7 MESIN PENCARI INFORMASI Peta Konsep Mesin Pencari Informasi Mengubah Bahasa yang Digunakan di Google Mencari Informasi Menggunakan Search Engine Mengelola Informasi Hasil Akses Internet Mencari Informasi

Lebih terperinci

Pemrograman Lanjut. Interface

Pemrograman Lanjut. Interface Pemrograman Lanjut Interface PTIIK - 2014 2 Objectives Interfaces Defining an Interface How a class implements an interface Public interfaces Implementing multiple interfaces Extending an interface 3 Introduction

Lebih terperinci

INTERNET 1. EARCH ENGINE

INTERNET 1. EARCH ENGINE INTERNET 1. EARCH ENGINE Search engine adalah program database yang dapat mencari file-file yang terdapat di internet dan sekaligus memberikan informasi mengenai lokasinya. Search engine memiliki kemampuan

Lebih terperinci

APLIKASI CONTENT BASED IMAGE RETRIEVAL DENGAN FITUR WARNA DAN BENTUK

APLIKASI CONTENT BASED IMAGE RETRIEVAL DENGAN FITUR WARNA DAN BENTUK APLIKASI CONTENT BASED IMAGE RETRIEVAL DENGAN FITUR WARNA DAN BENTUK Arwin Halim 1, Hardy 2, Alvin Yufandi 3, Fiana 4 Program Studi Teknik Informatika, STMIK Mikroskil Jl. Thamrin No. 122, 124, 140 Medan

Lebih terperinci

Pendahuluan. Bab Latar Belakang

Pendahuluan. Bab Latar Belakang Bab 1 Pendahuluan 1.1 Latar Belakang Sejak dulu peradaban manusia tidak lepas dari suatu entitas yang bernama informasi. Segala sesuatu yang diperbuat dan dilakukan oleh manusia selalu dicatat dan disimpan,

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Akhir-akhir ini perkembangan informasi yang semakin cepat, menjadikan informasi sebagai bagian yang tidak terpisahkan dari kebutuhan masyarakat indonesia. Informasi

Lebih terperinci

PENERAPAN SEMANTIC SEARCHING BERBASIS ONTOLOGI PADA PERPUSTAKAAN DIGITAL

PENERAPAN SEMANTIC SEARCHING BERBASIS ONTOLOGI PADA PERPUSTAKAAN DIGITAL PENERAPAN SEMANTIC SEARCHING BERBASIS ONTOLOGI PADA PERPUSTAKAAN DIGITAL i SKRIPSI S U L H A N 041401025 PROGRAM STUDI S-1 ILMU KOMPUTER DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

Mengoptimalkan Google.com

Mengoptimalkan Google.com Mengoptimalkan Google.com Mesin pencari internet (internet searching engine) telah menjadi senjata andalan pengguna internet untuk mencari suatu halaman web, artikel atau informasi lain dengan keterbatasan

Lebih terperinci

Penelusuran Informasi (Information Retrieval)

Penelusuran Informasi (Information Retrieval) Introduction to Information Retrieval Penelusuran Informasi (Information Retrieval) Sumber: CS276: Information Retrieval and Web Search Pandu Nayak and Prabhakar Raghavan Taufik Fuadi Abidin Link Analysis

Lebih terperinci

KULIAH 11 WEB IR. BAB 13 Baeza-Yates & Ribeiro-Neto. Fakultas Ilmu Komputer Universitas Indonesia

KULIAH 11 WEB IR. BAB 13 Baeza-Yates & Ribeiro-Neto. Fakultas Ilmu Komputer Universitas Indonesia KULIAH 11 WEB IR BAB 13 Baeza-Yates & Ribeiro-Neto World Wide Web Dikembangkan oleh Tim Berners-Lee pada tahun 1990 di CERN untuk mengorganisasikan dokumen penelitian yang ada di Internet. Mengembangkan

Lebih terperinci

BAB I PENDAHULUAN. Information retrieval (IR) adalah ilmu yang mempelajari pencarian

BAB I PENDAHULUAN. Information retrieval (IR) adalah ilmu yang mempelajari pencarian BAB I PENDAHULUAN 1.1 Latar Belakang Information retrieval (IR) adalah ilmu yang mempelajari pencarian dokumen untuk memenuhi kebutuhan informasi dari dalam koleksi besar media penyimpanan komputer (Manning,

Lebih terperinci

PENGELOMPOKAN CITRA WAJAH DENGAN TEKNIK SUBSPACE CLUSTERING MENGGUNAKAN ALGORITMA LSA SC (LOCAL SUBSPACE AFFINITY SPECTRAL CLUSTERING)

PENGELOMPOKAN CITRA WAJAH DENGAN TEKNIK SUBSPACE CLUSTERING MENGGUNAKAN ALGORITMA LSA SC (LOCAL SUBSPACE AFFINITY SPECTRAL CLUSTERING) PENGELOMPOKAN CITRA WAJAH DENGAN TEKNIK SUBSPACE CLUSTERING MENGGUNAKAN ALGORITMA LSA SC (LOCAL SUBSPACE AFFINITY SPECTRAL CLUSTERING) Disusun oleh : Febryan Setiawan (0922081) Jurusan Teknik Elektro,

Lebih terperinci

Spesifikasi: Ukuran: 14x21 cm Tebal: 162 hlm Harga: Rp Terbit pertama: Maret 2005 Sinopsis singkat:

Spesifikasi: Ukuran: 14x21 cm Tebal: 162 hlm Harga: Rp Terbit pertama: Maret 2005 Sinopsis singkat: Spesifikasi: Ukuran: 14x21 cm Tebal: 162 hlm Harga: Rp 21.800 Terbit pertama: Maret 2005 Sinopsis singkat: Sudah banyak sekali buku mengenai internet yang terbit di pasaran, namun di antara buku-buku tersebut

Lebih terperinci

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL Nadia Damayanti 1, Nur Rosyid Mubtada i, S.Kom, M.Kom 2, Afrida Helen S.T, M.Kom

Lebih terperinci

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan pengetahuan dan kehidupan manusia sungguh dipercepat dengan kemudahan akses terhadap begitu banyak informasi. Pada beberapa waktu yang lalu akses terhadap

Lebih terperinci

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis

Lebih terperinci

TEMU KEMBALI INFORMASI

TEMU KEMBALI INFORMASI JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 1 Identitas Mata Kuliah Nama Mata Kuliah : Temu Kembali Informasi (TKI) Information Retrieval (IR) Kode Mata Kuliah : KOM431 Koordinator : Julio

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer CORPUS DOKUMEN TEKS BAHASA INDONESIA UNTUK PENGUJIAN EFEKTIVITAS TEMU KEMBALI INFORMASI Oleh: Ir. Julio Adisantoso, M.Kom.

Lebih terperinci

MANAJEMEN RISIKO 1 (INDONESIAN EDITION) BY IKATAN BANKIR INDONESIA

MANAJEMEN RISIKO 1 (INDONESIAN EDITION) BY IKATAN BANKIR INDONESIA Read Online and Download Ebook MANAJEMEN RISIKO 1 (INDONESIAN EDITION) BY IKATAN BANKIR INDONESIA DOWNLOAD EBOOK : MANAJEMEN RISIKO 1 (INDONESIAN EDITION) BY IKATAN Click link bellow and free register

Lebih terperinci

Mesin Pencari Dokumen Karya Ilmiah pada Lingkungan Akademik (Scientific Documents Search Engine in Academic Environment)

Mesin Pencari Dokumen Karya Ilmiah pada Lingkungan Akademik (Scientific Documents Search Engine in Academic Environment) Mesin Pencari Dokumen Karya Ilmiah pada Lingkungan Akademik (Scientific Documents Search Engine in Academic Environment) B.Very Christioko Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang

Lebih terperinci

BAB II TINJAUAN LITERATUR

BAB II TINJAUAN LITERATUR BAB II TINJAUAN LITERATUR 2.1 Dokumen Proses terjadinya atau terciptanya dokumen bermula dari adanya komunikasi manusia dengan manusia lainnya. Komunikasi berlangsung karena ada informasi yang disampaikan

Lebih terperinci

ANALISIS DAN IMPLEMENTASI METODE LATENT SEMANTIC INDEXING PADA SISTEM PENCARIAN DOKUMEN SKRIPSI ARIANI

ANALISIS DAN IMPLEMENTASI METODE LATENT SEMANTIC INDEXING PADA SISTEM PENCARIAN DOKUMEN SKRIPSI ARIANI ANALISIS DAN IMPLEMENTASI METODE LATENT SEMANTIC INDEXING PADA SISTEM PENCARIAN DOKUMEN SKRIPSI ARIANI 071401022 PROGRAM STUDI S1 ILMU KOMPUTER DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

SUKSES BERBISNIS DI INTERNET DALAM 29 HARI (INDONESIAN EDITION) BY SOKARTO SOKARTO

SUKSES BERBISNIS DI INTERNET DALAM 29 HARI (INDONESIAN EDITION) BY SOKARTO SOKARTO Read Online and Download Ebook SUKSES BERBISNIS DI INTERNET DALAM 29 HARI (INDONESIAN EDITION) BY SOKARTO SOKARTO DOWNLOAD EBOOK : SUKSES BERBISNIS DI INTERNET DALAM 29 HARI Click link bellow and free

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System

Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Hendri Priyambowo 1, Yanuar Firdaus A.W. S.T, M.T 2, Siti Sa adah S.T. M.T 3 123 Program Studi S1 Teknik Informatika,

Lebih terperinci

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL (Studi Kasus Perpustakaan Universitas Udayana) LEMBAR JUDUL KOMPETENSI RPL SKRIPSI NI MADE

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 PENERAPAN METODE CLUSTERING HIRARKI AGGLOMERATIVE UNTUK KATEGORISASI DOKUMEN PADA WEBSITE SMA NEGERI

Lebih terperinci

4. ABSTRAK. Kata Kunci : manga, rekomendasi, clustering sinopsis

4. ABSTRAK. Kata Kunci : manga, rekomendasi, clustering sinopsis 4. ABSTRAK Manga adalah istilah untuk buku komik dari Jepang yang memiliki banyak penggemar, bukan hanya berasal dari Jepang saja, melainkan dari berbagai negara lain. Saat ini jumlah manga yang beredar

Lebih terperinci

OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA

OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA Optimization Techniques Modi ed k Nearest Neighbor Classi cation Using Genetic Algorithm Siti Mutro n 1, Abidatul

Lebih terperinci

PENGINDEKAN DAN PENCARIAN DOKUMEN TEXT. Kusrini, S.Kom STMIK AMIKOM Yogyakarta. Abstract. Keywords : Index, Searching, Document, Text, Key

PENGINDEKAN DAN PENCARIAN DOKUMEN TEXT. Kusrini, S.Kom STMIK AMIKOM Yogyakarta. Abstract. Keywords : Index, Searching, Document, Text, Key PENGINDEKAN DAN PENCARIAN DOKUMEN TEXT Kusrini, S.Kom STMIK AMIKOM Yogyakarta Abstract We often needs to search a specific or joined word(s) within a document. An application with ability to store and

Lebih terperinci

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI Wiranto 1), Edi Winarko 2) 1) Jurusan Teknik Informatika, Universitas Sebelas Maret E-mail : wir@uns.ac.id 2) Program Studi Ilmu

Lebih terperinci

WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR

WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR Achmad Thoriq B, Nelly Indriani W Abstract News aggregator is one type of aggregator system (collector) which collects

Lebih terperinci