BAB I PENDAHULUAN. Saat ini informasi digital berkembang sangat pesat. Setiap hari jutaan

dokumen-dokumen yang mirip
BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

BAB I PENDAHULUAN. 1.1 Latar Belakang

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN UKDW

BAB I PERSYARATAN PRODUK

1. Pendahuluan. 1.1 Latar belakang

BAB 1 PENDAHULUAN Latar Belakang

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer

BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era

PENDAHULUAN. 1.1 Latar Belakang

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN. Dalam suatu basis data, pendekatan model data relasional masih banyak dimanfaatkan untuk penyimpanan data dan informasi terhadap

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I PENDAHULUAN. Pada umumnya pembaca ingin mendapatkan rangkuman suatu artikel dengan cepat

PENDAHULUAN. I.1 Latar Belakang

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB I PENDAHULUAN Latar Belakang Masalah

BAB 1 PENDAHULUAN Latar Belakang

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

BAB II TINJAUAN PUSTAKA

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. Information retrieval (IR) adalah ilmu yang mempelajari pencarian

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga

DAFTAR ISI. SKRIPSI... ii

Gambar 1.1 Tahapan Penelitian

1.5 Metode Penelitian

Pemanfaatan Aljabar Vektor Pada Mesin Pencari

BAB 1 PENDAHULUAN Latar Belakang

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. tahunnya (Radev et al, 2000). Pada bulan Juli 2011, jumlah host yang diiklankan di

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

BAB I PENDAHULUAN Latar Belakang Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

BAB III METODOLOGI PENELITIAN

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. menjual berbagai jenis pakaian. Seiring dengan perkembangan fashion pakaian ini

PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN

BAB I PENDAHULUAN. bahkan luar negeri. Hal ini dikarenakan produk souvenir merupakan produk

SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL

Fatkhul Amin Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang

BAB II TINJAUAN PUSTAKA

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

Search Engines. Information Retrieval in Practice

BAB I PENDAHULUAN 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. berlangganan berita kepada situs web yang menyediakan feed RSS, umumnya

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB 3 ANALISA DAN PERANCANGAN

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

BAB II LANDASAN TEORI. karya rekam secara profesional dengan sistem yang baku guna memenuhi

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN 1.1. Latar Belakang

PENERAPAN TEXT MINING DAN VECTOR SPACE MODEL PADA WEB-BASE KNOWLEDGE MANAGEMENT SYSTEM ( STUDI KASUS TEKNIK INFORMATIKA UPN ) TUGAS AKHIR

Sistem Temu-Kembali Informasi Pengantar Perkuliahan

BAB I PENDAHULUAN 1.1 Latar Belakang

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

PENGGUNAAN INTERNET SEBAGAI TEKNOLOGI INFORMASI DI KALANGAN MAHASISWA EKONOMI AKUNTANSI UNIVERSITAS MUHAMMADIYAH SURAKARTA SKRIPSI

BAB I PENDAHULUAN 1.1 Latar Belakang

Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL. Budi Susanto

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)

BAB I PENDAHULUAN. canggih dan pesat dari waktu ke waktu, dengan berkembangnya teknologi

SISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR

RANCANG BANGUN ADD-ONS MOZILLA FIREFOX UNTUK IDENTIFIKASI TOPIK PADA MATERI BELAJAR ONLINE

BAB III METODOLOGI PENELITIAN

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini informasi digital berkembang sangat pesat. Setiap hari jutaan informasi baru terus bertambah. Berdasarkan survey IDC (Internasional Data Corporation) tahun 2007 data digital yang telah dibuat, ditangkap, dan direplikasi oleh seluruh penduduk dunia adalah sebesar 281 miliar giga bytes (281 exa bytes). Data ini terdiri dari dokumen dalam berbagai macam format seperti gambar, email, video, web page, teks, dll. Dengan semakin banyak dan beragamnya informasi yang tersedia, kebutuhan pengguna internet telah bergeser dari arah kuantitatif ke arah kualitatif. Kebutuhan yang semula berupa informasi sebanyak-banyaknya telah bergeser menjadi informasi yang secukupnya asalkan relevan dengan keperluan. Seiring dengan bertambahnya hal tersebut, kebutuhan di dalam mencari informasi elektronis juga semakin meningkat. Dalam hal ini Robert R.K. mengindikasikan timbulnya dua masalah besar, yaitu teknologi penyimpanan informasi (Information Storage) dan temu kembali informasi (Information Retreival). Oleh karena itu, Saat ini telah banyak dari berbagai informasi tersebut dapat diakses secara elektronik melalui internet dengan menggunakan berbagai mesin pencari (search engine). Perbedaan mesin penelusur yang satu dengan yang lain 1

2 sangat bergantung pada teknik temu kembali informasi dan teknik pengindeksan yang dipakai. Dari hasil pengamatan langsung terhadap portal website berita berbahasa Indonesia terutama dalam berita IT, karena sedikit sekali website portal berita IT yang menyediakan mesin pencari bagi website itu sendiri. Kebanyakan dari websitewebsite tersebut menyediakan mesin pencari yang langsung terhubung ke mesin pencari google, sehingga proses pengindeksan kata kunci dengan dokumen tidak akan langsung dihubungkan dengan konten berita yang ada dalam website tersebut. Maka dari hasil pencarian tersebut ada yang relevan dan ada yang kurang relevan dengan kata kunci. Berbagai macam penelitian di area ini telah banyak dilakukan, salah satunya adalah melalui disiplin ilmu IR (Information Retrieval). IR merupakan bidang yang mengkaji metode-metode di dalam pencarian dokumen berdasarkan representasi kebutuhan informasi berupa kata kunci, yaitu keyword atau query. Dalam Information Retrieval System, Salton menjelaskan bahwa terdapat 3 model yang digunakan, yaitu Boolean Model, Probabilistic Model, dan Vector Space Model. Model terakhir inilah yang paling sederhana dan paling produktif. Model ruang vektor ini merepresentasikan term yang digunakan baik oleh dokumen maupun oleh query. Elemen vektor tersebut merupakan bobot term yang menerepkan

3 pembobotan kombinasi berupa perkalian bobot lokal term frequency (tf) dan global inverse document frequency (idf).[5] Berdasarkan permasalahan diatas akan dilakukan suatu analisis terhadap Information Retrieval System menggunakan Model Ruang Vektor. 1.2 Perumusan Masalah Berdasarkan uraian latar belakang masalah yang dikemukakan, maka dapat dirumuskan beberapa masalahnya sebagai berikut : 1. Bagaimana proses sistem temu balik informasi atau Information Retrieval System. 2. Bagaimana Implementasi Information Retrieval System pada mesin pencari berita IT. 3. Bagaimana pencarian dokumen yang relevan di Information Retrieval System dengan menggunakan Model Ruang Vektor. 1.3 Maksud dan Tujuan Maksud dari ditulisnya skripsi ini adalah untuk melakukan analisis dan mengimplementasikan Information Retrieval System pada web menggunakan vector space model (model ruang vektor). berikut : Adapun tujuan yang akan dicapai dari penulisan skripsi ini adalah sebagai

4 1. Menganalisis proses Information Retrieval System dalam melakukan pencarian dokumen berita. 2. Mengimplementasikan Information Retrieval System pada website mesin pencari berita IT. 3. Menerapkan Model Ruang Vektor atau Vektor Space Model (VSM) pada Information Retrieval System. 1.4 Batasan Masalah berikut : Adapun batasan masalah dalam pembuatan perangkat lunak ini adalah sebagai 1. Koleksi dokumen yang digunakan dalam proses analisis dan implementasi merupakan dokumen berita IT yang telah ditentukan sebelumnya. 2. Dokumen yang digunakan berupa dokumen berita dalam bahasa Indonesia. 3. Perangkat lunak yang dibangun berupa prototype aplikasi Information Retrieval System. 4. Mengimplementasikan langkah-langkah Information Retrieval System pada web. 5. Menghitung kemiripan antara query dengan daftar berita yang tersedia. 6. Menganalisis Information Retrieval System, meliputi Stop Word, Tokenisasi, Stemming, pemberian bobot term index, dan model ruang vektor.

5 7. Model yang digunakan dalam Information Retrieval System adalah Model Ruang Vektor. 8. Dokumen Berita berupa teks. 1.5 Metodologi Penelitian Metodologi Penelitian yang digunakan dalam penulisan skripsi ini adalah sebagai berikut : a. Studi literatur Tahap ini dilakukan dengan cara mempelajari literatur-literatur baik yang berupa buku, jurnal, artikel ilmiah, dan website yang berhubungan dengan Information Retrieval System. b. Analisis Pada tahap ini akan dijelaskan proses Information Retrieval System dalam hal Stop Word, Stemming, pemberian bobot term index, dan model ruang vektor. c. Perancangan Pada tahap ini akan dilakukan perancangan terhadap perangkat lunak Information Retrieval System yang akan dibangun, termasuk menentukan lingkungan pembuatan, bahasa pemrograman yang digunakan, arsitektur, fungsionalitas, dan antarmuka sistem. d. Implementasi dan Pengujian

6 Pada tahap ini akan dilakukan implementasi Information Retrieval System pada web serta dilakukan pengujian untuk mendapatkan kesimpulan dan saran untuk pengembangan lebih lanjut. 1.6 Sistematika Penulisan Sistematika penulisan skripsi ini disusun untuk memberikan gambaran umum tentang penelitian yang dijalankan. Sistematika penulisan skripsi ini adalah sebagai berikut : BAB I PENDAHULUAN Menguraikan tentang latar belakang permasalahan, merumuskan inti permasalahan yang dihadapi, menentukan maksud dan tujuan penelitian, yang kemudian diikuti dengan pembatasan masalah, metodologi penelitian serta sistematika penulisan. BAB II. LANDASAN TEORI

7 Membahas berbagai konsep dasar dan teori-teori yang berkaitan dengan topik penelitian yang dilakukan dan hal-hal yang berguna dalam proses analisis permasalahan serta tinjauan terhadap penelitian. BAB III. ANALISIS DAN PERANCANGAN SISTEM Membahas tentang analisis sistem, pengguna, serta perancangan sistem untuk pembangunan aplikasi. BAB IV. IMPLEMENTASI DAN PENGUJIAN SISTEM Membahas tentang implementasi dan pengujian sistem yang telah dikerjakan serta menerapkan kegiatan implementasi dan pengujian pada perangkat lunak aplikasi. BAB V. KESIMPULAN DAN SARAN Berisi kesimpulan dan saran dalam penulisan skripsi.