1. PENDAHULUAN. Perkembangan teknologi informasi, khususnya teknologi Internet. mudah dan gratis, mengakibatkan informasi berlimpah.

dokumen-dokumen yang mirip
3. METODOLOGI. Penelitian dilakukan dalam tiga tahap utama : Persiapan, Evaluasi

PERANCANGAN PROTOTIPE SISTEM TEMU KEMBALI INFORMASI MENGGUNAKAN ALGORITMA FUZZY CLUSTERING AHMAD IRFANI

PERANCANGAN PROTOTIPE SISTEM TEMU KEMBALI INFORMASI MENGGUNAKAN ALGORITMA FUZZY CLUSTERING AHMAD IRFANI

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB I PENDAHULUAN. 1.1 Latar Belakang

Gambar 2. Halaman web dari Google. Search Bar

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

2. TINJAUAN PUSTAKA. teori, model dan teknik yang terkait dengan representasi, penyimpanan,

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB IV PREPROCESSING DATA MINING

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB I PENDAHULUAN 1.1. Latar Belakang

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

DR.LULUK FAUZIAH, M.SI FISIP UNIVERSITAS MUHAMMADIYAH SIDOARJO 27 AGUSTUS 2016


ANALISIS SEARCH MATCHING PADA SEARCH ENGINE

Pengenalan Teknologi Informasi

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

MESIN PENCARI INFORMASI

BAB I PENDAHULUAN. Information retrieval (IR) adalah ilmu yang mempelajari pencarian

BAB 1 PENDAHULUAN. Sistem informasi merupakan fokus utama dari studi disiplin sistem informasi dan

BAB I PENDAHULUAN. serta dapat bertingkah sesuai norma-norma yang berlaku. Sebab ide dasar

Mengoptimalkan Google.com

BAB 1 PENDAHULUAN. merupakan salah satu cara untuk memasuki Perguruan Tinggi. Hampir semua siswa

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. Dalam suatu basis data, pendekatan model data relasional masih banyak dimanfaatkan untuk penyimpanan data dan informasi terhadap

BAB I PENDAHULUAN 1.1. Latar Belakang

Student Guide Series: Aplikasi Internet Google. 1.1 Tampilan Google

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN Latar Belakang

Penyusun Tugas Akhir : Ivan Hardiyanto (NRP : ) Dosen Pembimbing : Yudhi Purwananto, S.Kom, M.Kom Rully Soelaiman, S.Kom, M.

Selamat Pagi. Hari ini Kita Membahas BAB 2 Web Browser

Menggunakan Browser dan Mesin Pencari

BAB 3 ANALISA SISTEM

by F. Denie Wahana, S.Kom.

BAB IV HASIL PERBANDINGAN DAN PEMBAHASAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah. Perkembangan aplikasi teknologi informasi saat ini sudah berkembang begitu pesat

Penerapan Algoritma K-Means untuk Clustering

PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB IV IMPLEMENTASI DAN EVALUASI

Proses mengelompokkan suatu set objek ke dalam kelompok-kelompok objek yang sejenis. Bentuk yang paling umum digunakan adalah unsupervised learning

Search Engine. Adri Priadana ilkomadri.com

BAB I PENDAHULUAN 1.1 Latar Belakang

Cara Penelusuran Informasi melalui Internet

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

MENG-ONLINE-KAN ISIS KE WEB DENGAN PEARL DAN HTDIG

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Psikotest adalah tes yang dilakukan untuk mengukur aspek individu secara psikis. Tes

BAB IV ANALISA HASIL SISTEM. Lingkup uji coba aplikasi web ini adalah pada komputer yang terdapat web server

APLIKASI MOBILE LEARNING MENGGUNAKAN BAHASA PEMROGRAMAN PHP DAN JAVA BERBASIS ANDROID

WEB BROWSER World Wide Web WWW SEARCH ENGINE Mesin pencari

PENCARIAN DENGAN GOOGLE

Cara Mendapatkan. Beasiswa melalui. Internet

BAB I PENDAHULUAN. yang global, sehingga kita dapat terkoneksi ke seluruh jaringan di dunia,

BAB 2 LANDASAN TEORI. Kata sistem berasal dari bahasa Yunani yaitu Systema yang mengandung arti kesatuan

GOOGLE Teknik Pencarian Efektif dengan Google

Jenis jenis website berdasarkan bagaimana perubahan isinya pada awalnya bisa dibedakan menjadi dua yaitu :

BAB III METODOLOGI PENELITIAN

BAB III IDENTIFIKASI DAN KLASIFIKASI WEB LOG

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency

BAB 1 PENDAHULUAN. diinginkan. Dengan banyaknya penjual ikan secara konvensional untung yang

BAB I PENDAHULUAN. A. Latar Belakang. Manusia sebagai makhluk sosial membutuhkan komunikasi diantara sesamanya,

BAB 2 LANDASAN TEORI

BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM

ANALISIS KLASTERING LIRIK LAGU INDONESIA

PEMANFAATAN INTERNET DALAM KBM IPA Oleh: Arif Kristanta

BAB I PENDAHULUAN. digunakan untuk pemecahan masalah dalam kehidupan sehari-hari, baik dalam

SEGMENTASI CITRA MENGGUNAKAN K-MEANS DAN FUZZY C- MEANS DENGAN BERBAGAI RUANG WARNA

BAB I PENDAHULUAN 1.1. Latar Belakang

Bidang Studi :.. B. Pertanyaan

BAB I PENDAHULUAN. seluruh kegiatan yang dilakukan baik lembaga maupun masyarakat itu sendiri.

Proyek Akhir II Aplikasi Transaksi Pengisian Voucher Handphone Berbasis Web BAB I PENDAHULUAN

Lukman Adlin Harahap, STP, M.Si

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. bagi yang menerimanya (Tafri D. Muhyuzir, 2001, 8). satu aspek pekerjaan, melainkan berbagai aspek yang berbeda-beda sehingga

ANALISIS PERBANDINGAN KINERJA SEARCH ENGINE MENGGUNAKAN PENELUSURAN PRECISION DAN RECALL UNTUK INFORMASI ILMIAH BIDANG ILMU KEDOKTERAN

Ahmad Royani, S.Kom. Ahmad Royani, S.Kom SMK NEGERI 3 DEPOK JUDUL MATERI EVALUASI PENUGASAN KELUAR

Penelusuran Informasi (Information Retrieval) Taufik Fuadi Abidin. Web Search

JULIO ADISANTOSO - ILKOM IPB 1

MATERI INTERNET Kelas XII SMF

PENDAHULUAN. I.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. yang sudah maju seperti Amerika, Eropa, Jepang dan lain sebagainya.

PERTEMUAN 6 PROMOSI DAN PEMELIHARAAN WEB

PENGABDIAN MASYRAKAT PELATIHAN PEMBUATAN WEB UNTUK USTADZ DAN PENGELOLA PONDOK PESANTREN SEBAGAI MEDIA INFORMASI DI KABUPATEN/KOTA KEDIRI

MANFAAT INTERNET BAGI MASYARAKAT KAMPUS DALAM MELACAK INFORMASI 1

WEBSITE PORTAL PADA CV CHAMPION PALEMBANG MENGGUNAKAN PHP DAN MySQL

MENJELAJAH DENGAN GOOGLE

Gita Kostania, S.ST.,M.Kes. 25/06/ :10 Oshigita's

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN. Untuk memenuhi tugas mata kuliah Teknologi Informasi. Dapat mengetahui dan memahami tentang search engine

SISTEM INFORMASI BANK DATA DAN PENELUSURAN TUGAS AKHIR DAN SKRIPSI BERBASIS WEB ( STUDY KASUS STMIK PRINGSEWU)

BAB 1 PENDAHULUAN. persiapannya lebih singkat. E-Learning menjawab semua tantangan tersebut.

BAGIAN 1 BROWSER DAN SEARCH ENGINE

BAB I PENDAHULUAN jiwa (Badan Pusat Statistik, 2014). Akibat pertumbuhan penduduk

Implementasi Graf pada Metode Crawling dan Indexing di dalam Mesin Pencari Web

Transkripsi:

1. PENDAHULUAN A. Latar Belakang Perkembangan teknologi informasi, khususnya teknologi Internet sebagai wadah untuk dapat dengan mudah menyebarkan informasi secara mudah dan gratis, mengakibatkan informasi berlimpah. Melimpahnya informasi di satu sisi semakin memudahkan kita untuk mengakses informasi. Namun di sisi lain, banyaknya informasi dapat menimbulkan permasalahan pada pencarian atau penelusuran dan pengorganisasian informasi. Jumlah dan laju pertambahan informasi yang dihasilkan saat ini telah melebihi kemampuan manusia untuk melakukan organisasi, menelusuri dan memodifikasi informasi tanpa bantuan sistem yang otomatis (Taylor, 1999). Untuk memudahkan penelusuran informasi diperlukan mesin pencari. Mesin pencari menerima input query atau kata kunci dari pengguna dan menampilkan daftar informasi atau dokumen yang diperoleh (pada mesin pencari Internet, hasil pencarian terdiri dari link menunjuk alamat Internet yang menyimpan dokumen). Pada saat ini sudah banyak mesin pencari informasi pada Internet yang dapat digunakan secara cuma-cuma, antara lain : google (www.google.com), yahoo (www.yahoo.com) dan altavista (www.altavista.com). Ketika menggunakan mesin pencari, pengguna sering tidak memperoleh hasil yang optimal (sesuai dengan keinginan), karena pengguna menghadapi beberapa kendala dalam memasukkan kata kunci, antara lain (Muresan, 2002): 1. Kesalahan dalam pengetikan atau dalam ejaan kata 1

2. Terbatasnya perbendaharaan kata yang dimiliki pengguna (terutama untuk istilah pada domain pengetahuan yang memiliki terminologi-terminologi tertentu) 3. Kurang memahami cara penggunaan sintaks bahasa query, seperti Operator Boolean 4. Kebanyakan pencarian hanya menggunakan kata kunci yang sedikit sehingga mengurangi daya jelajah pada ruang informasi 5. Kata kunci yang digunakan sedikit dan terlalu luas atau memiliki makna ganda (ambigue) sehingga hasil pencarian yang didapat banyak namun kurang atau tidak relevan sama sekali Kesalahan memasukkan kata kunci dapat menyebabkan hasil tidak ada atau terlalu banyak. Mesin pencari kebanyakan menggunakan teknik representasi peringkat dengan menampilkan seluruh link menuju halaman hasil yang dibagi perhalaman. Masalah pada teknik representasi peringkat muncul bila hasil pencarian yang diperoleh terlalu banyak. Misalkan kita cari kata java untuk pulau jawa dengan menggunakan google (www.google.co.id), akan diperoleh hasil sebanyak 235 juta link ke alamat yang mengandung kata java dan baru pada halaman ke-3 (link yang ke-31) kita bisa menemukan link yang mempunyai keterangan tentang pulau java (Gambar 1.1). Untuk membantu pengguna dalam mengatasi masalah ini, perlu dipikirkan suatu teknik representasi lain. Salah satu cara adalah dengan mengelompokkan dokumen hasil query yang memiliki kemiripan, misalkan dokumen-dokumen yang memiliki kesamaan subyek dapat dimasukkan dalam satu kelompok atau cluster (Borodavkina, 2000). 2

Gambar 1.1 Contoh halaman hasil pencarian Google (www.google.com) Pengelompokan dokumen telah banyak diaplikasikan pada sistem temukembali informasi untuk meningkatkan efektifitas pencarian, antara lain (Horng et. al., 2005), (Haruechaiyasak & Chen, 2002) dan (Mendes & Sacks, 2003). Pada aplikasi komersial, dokumen clustering antara lain telah digunakan oleh mesin pencari Vivisimo (www.vivisimo.com). Ketika digunakan, Vivisimo menghasilkan judul dan abstrak dokumen yang ditemukan. Kemudian menggunakan judul dan abstrak tersebut sebagai bahan pengelompokan (bukan keseluruhan dokumen). Vivisimo menggunakan algoritma Hierarchical Fuzzy Clustering. Algoritma Hierarchical Fuzzy Clustering merupakan salah satu algoritma algoritma clustering. Algoritma clustering lainnya antara lain K- Means, Buckshot, Fuzzy C-Means, Hyperspherical Fuzzy c-means, ε- Insentive Fuzzy C-Means (ε-fcm), Competitive Clustering by Learning 3

(CCL), Fuzzy CCL (FCCL) serta algoritma Fuzzy Subtractive Clustering (FSC). Algoritma tersebut masing-masing memiliki karakter yang berbeda, sehingga perlu dilakukan pemilihan algoritma clustering yang paling tepat untuk document clustering. Perbandingan kinerja algoritma untuk document clustering sudah pernah dilakukan, antara lain oleh Mendes & Sacks (2003) yang menggunakan algoritma H-FCM untuk document clustering dan membandingkannya dengan algoritma K-Means. Hasilnya algoritma H-FCM memiliki kinerja lebih baik dibandingkan algoritma K-Means (bukan fuzzy). Penelitian ini bertujuan untuk mengembangkan penelitian Mendes & Sacks (2003) dengan membandingkan kinerja algoritma H-FCM dengan dua algoritma fuzzy clustering lainnya,. Algoritma FCM dipilih karena FCM merupakan algoritma fuzzy clustering yang paling populer, sedangkan algoritma FSC dipilih karena belum pernah diteliti penggunaanya untuk document clustering. Penelitian ini juga akan membuat prototipe sistem temukembali informasi yang menggunakan satu algoritma clustering terbaik di antara algoritma tersebut. B. Tujuan dan Manfaat Penelitian ini bertujuan untuk (1) melakukan evaluasi kecocokan penggunaan algoritma fuzzy clustering FCM, H-FCM dan FSC pada dokumen dari situs Internet (2) melakukan evaluasi kecocokan formula representasi dokumen Tf, Tf-Idf dan Salton pada dokumen dari situs Internet (3) 4

mengembangkan prototipe sistem temu-kembali informasi (dokumen) yang dibangun dengan menggunakan satu algoritma yang terbaik hasil evaluasi. Penelitian ini diharapkan dapat bermanfaat sebagai salah satu model implementasi sistem algoritma fuzzy clustering dalam temu kembali informasi berbahasa Indonesia. C. Ruang Lingkup Penelitian ini memiliki ruang lingkup sebagai berikut : 1 Algoritma clustering yang diuji adalah : Fuzzy C-Means Clustering (FCM), Hyperspherical Fuzzy C-Means Clustering (H-FCM) dan algoritma Fuzzy Subtractive Clustering (FSC). 2 Bahan atau data yang digunakan adalah artikel dokumen yang diperoleh dari situs Internet. 3 Implementasi algoritma pada proses evaluasi dilakukan dengan Matlab 7.1 4 Prototipe sistem dikembangkan dengan menggunakan algoritma clustering terpilih 5 Prototipe sistem dibangun menggunakan bahasa PHP 5.0, basisdata MySQL versi 5.0.18 dan web server Apache versi 2.2.0. 5