BAB I PENDAHULUAN. Temu kembali informasi (information retrieval) adalah sebuah proses

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era

BAB I PENDAHULUAN. Information retrieval (IR) adalah ilmu yang mempelajari pencarian

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Jurnal String Vol.1 No.2 Tahun 2016 ISSN :

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang Masalah

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN UKDW

BAB I PENDAHULUAN 1.1 Latar Belakang

1. Pendahuluan. 1.1 Latar belakang

STEMMING DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN ALGORITMA PORTER ABSTRAK

BAB II LANDASAN TEORI

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga

UKDW. Bab 1 PENDAHULUAN

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

BAB I PENDAHULUAN. berinovasi menciptakan suatu karya yang original. Dalam hal ini tindakan negatif

BAB 3 ANALISA DAN PERANCANGAN

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document

Penanganan Kasus Overstemming dan Understemming dengan Modifikasi Algoritma Stemming

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA

BAB I PENDAHULUAN 1.1 Latar Belakang

PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA

BAB II LANDASAN TEORI

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

UKDW BAB 1 PENDAHULUAN

BAB II LANDASAN TEORI. karya rekam secara profesional dengan sistem yang baku guna memenuhi

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB III METODOLOGI PENELITIAN

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity

BAB I PENDAHULUAN 1.1 Latar Belakang

STUDI PERBANDINGAN ALGORITMA - ALGORITMA STEMMING UNTUK DOKUMEN TEKS BAHASA INDONESIA. Manase Sahat H Simarangkir

BAB 1 PENDAHULUAN 1.1. Latar belakang

BAB 1 PENDAHULUAN UKDW

ALGORITMA STEMMING UNTUK KATA SERAPAN BAHASA INDONESIA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

IMPLEMENTASI METODE PROBABILISTIC LATENT SEMANTIC ANALYSIS UNTUK OPINION RETRIEVAL

Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25

PENERAPAN STEMMING DENGAN ALGORITMA PORTER PADA QUERY PENCARIAN JUDUL BUKU

APLIKASI PENDETEKSI KEMIRIPANPADA DOKUMEN MENGGUNAKAN ALGORITMA RABIN KARP

Pemanfaatan Aljabar Vektor Pada Mesin Pencari

BAB I PENDAHULUAN. 1.1 Latar Belakang. Pada era globalisasi seperti saat ini, setiap negara di dunia telah terhubung

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

TEMU BALIK INFORMASI PADA DOKUMEN TEKS BERBAHASA INDONESIA DENGAN METODE VECTOR SPACE RETRIEVAL MODEL

PENGARUH TEXT PREPROCESSING PADA CLUSTERING DOKUMEN TEKS BERBAHASA INDONESIA

STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER

SISTEM TEMU BALIK INFORMASI

APLIKASI PENENTUAN KATA DASAR DARI KATA BERIMBUHAN PADA KALIMAT BAHASA INDONESIA DENGAN ALGORITMA STEMMING

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy).

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. tersebut dibuktikan dengan semakin canggihnya perangkat keras seperti prosesor,

Text Pre-Processing. M. Ali Fauzi

IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN I - 1

IMPLEMENTASI DAN ANALISIS ALGORITMA STEMMING NAZIEF & ADRIANI DAN PORTER PADA DOKUMEN BERBAHASA INDONESIA

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW. Bab 1 PENDAHULUAN

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Gambar 1.1 Proses Text Mining [7]

SISTEM INFORMATION RETRIEVAL PENCARIAN KESAMAAN AYAT TERJEMAHAN AL QURAN BERBAHASA INDONESIA DENGAN QUERY EXPANSION DARI TAFSIRNYA

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

BAB I PENDAHULUAN I-1

BAB I PENDAHULUAN. Inggris bahasa Madura Enggi Bunten. Madura yang digunakan untuk berkomunikasi dalam kehidupan seharihari.

BAB I PENDAHULUAN. bit serta kualitas warna yang berbeda-beda. Semakin besar pesat pencuplikan data

PENERAPAN ALGORITMA STEMMING NAZIEF & ADRIANI DAN SIMILARITY PADA PENERIMAAN JUDUL THESIS

BAB I PENDAHULUAN Latar Belakang

SISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Permasalahan

Keywords: information retrieval system, cosine similarity, mean average precision. Jurnal Ilmu Komputer - Volume 5 - No 2 September 2012

SISTEM TEMU KEMBALI INFORMASI

STEMMING FIRDAUS SOLIHIN UNIVERSITAS TRUNOJOYO. Firdaus Solihin (unijoyo) 2008

Penerapan Algoritma Paice atau Husk untuk Stemming pada Kamus Bahasa Inggris ke Bahasa Indonesia

BAB I PENDAHULUAN. Dalam suatu basis data, pendekatan model data relasional masih banyak dimanfaatkan untuk penyimpanan data dan informasi terhadap

BAB III METODOLOGI PENELITIAN

Bab 1 Pendahuluan 1.1 Pengantar

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI

BAB I PERSYARATAN PRODUK

BAB I PENDAHULUAN! 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Temu kembali informasi (information retrieval) adalah sebuah proses menemukan kembali dokumen-dokumen relevan untuk memenuhi kebutuhan informasi para pengguna (Manning, et al, 2009). Kebutuhan informasi pengguna tersebut direpresentasikan dalam bentuk query. Pengambilan keputusan dalam menemukan kembali dokumen-dokumen relevan dilakukan dengan membandingkan kata-kata pada query dengan kata-kata yang berada pada dokumen yang dicari atau dengan mengestimasi tingkat relevansi dokumen tersebut dengan query dari pengguna. Stemming adalah salah satu cara untuk meningkatkan performa information retrieval dengan cara mentransformasikan kata-kata dalam sebuah dokumen teks ke kata dasarnya (Agusta, 2009). Teknik stemming terbagi dalam empat kelompok, yaitu Affix Removal, Successor Variety, Table Lookup, dan N- gram (Frakes, 1992). Dalam penelitian ini akan dibandingkan performa algoritma Affix Removal, Successor Variety, dan N-gram termodifikasi dalam stemming dokumen berbahasa Indonesia. Algoritma Affix Removal yang akan digunakan dalam penelitian ini adalah algoritma Nazief-Adriani, dan metode yang akan digunakan dalam algoritma Successor Variety adalah metode Cutoff. 1

Dalam pembuatan penelitian ini tentunya tidak lepas dari referensi jurnaljurnal pendukung dari sumber lain yang telah melakukan penelitian sejenis. Penelitian-penelitian sejenis yang berhubungan dengan penelitian ini diantaranya: 1) Ledy Agusta (2009) yang membandingkan dua algoritma affix removal, yaitu algoritma Porter dan algoritma Nazief-Adriani yang menyimpulkan bahwa algoritma Nazief-Adriani memiliki prosentase keakuratan lebih besar walaupun membutuhkan waktu lebih lama. 2) Penelitian Riyad Al-Shalabi dan kawan-kawan (2005) yang membandingkan dua metode algoritma Successor Variety, yaitu metode Cutoff dan Entropy dan mendapatkan hasil bahwa metode Cutoff lebih bagus dibanding metode Entropy. 3) Penelitian B.P. Pande dan kawan-kawan (2013) dalam membandingkan performa metode algoritma N-gram yang diajukan dengan algoritma Porter dan mendapatkan hasil bahwa metode N-gram yang diajukan tidak kalah dengan algoritma Porter. Dari ketiga penelitian yang telah disebutkan, timbul sebuah pemikiran untuk membandingkan performa ketiga algoritma tersebut dalam stemming teks berbahasa Indonesia. 1.2 Perumusan Masalah Berdasarkan latar belakang yang telah dipaparkan, berikut rumusan masalahnya. 1) Bagaimanakah cara membandingkan ketiga algoritma tersebut? 2

2) Algoritma manakah yang lebih cocok untuk digunakan dalam stemming dokumen teks berbahasa Indonesia? 1.3 Batasan Masalah Penelitian ini hanya membahas perbandingan performa algoritma Nazief- Adriani, Successor Variety metode Cutoff, dan algoritma N-gram termodifikasi. Variabel penelitian dibatasi pada dua parameter metode evaluasi Paice, yaitu understemming index dan overstemming index. Bahasa yang digunakan dalam dokumen yang di-stemming adalah bahasa Indonesia. Dokumen yang digunakan untuk stemming adalah dokumen berekstensi.txt. 1.4 Tujuan Penelitian Berdasarkan rumusan masalah, maka penelitian ini bertujuan untuk membandingkan performa algoritma Nazief-Adriani, Successor Variety metode Cutoff, dan N-gram termodifikasi menggunakan parameter perbandingan understemming index dan overstemming index yang kemudian dari hasil tersebut akan ditentukan algoritma manakah yang lebih cocok digunakan untuk stemming dokumen, khususnya teks berbahasa Indonesia. 1.5 Manfaat Penelitian Manfaat dalam penelitian ini antara lain mengetahui algoritma manakah di antara ketiga algoritma yang dibandingkan yang lebih cocok untuk digunakan 3

dalam stemming dokumen teks berbahasa Indonesia sehingga dapat meningkatkan hasil temu kembali informasi (information retrieval). Bagi peneliti sendiri penelitian ini berguna untuk mempelajari beberapa materi baru, yakni beberapa algoritma stemming yang belum pernah diketahui sebelumnya, metode evaluasi algoritma stemming, dan sebagainya. 1.6 Sistematika Penulisan Secara umum, skripsi ini disusun dan dibagi dalam 5 (lima) bab dengan sistematika penulisan sebagai berikut. Bab I: Latar Belakang Pada bab ini berisi mengenai latar belakang masalah, perumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, dan sistematika penulisan. Bab II: Landasan Teori Pada bab ini dibahas uraian teori-teori yang berhubungan dengan algoritma-algoritma dan metode evaluasi yang digunakan. Bab III: Metodologi dan Perancangan Sistem Bab ini menjelaskan tentang metode-metode yang digunakan dalam penelitian dan juga mengenai perancangan sistem aplikasi perbandingan performa algoritma stemming. Bab IV: Pengujian dan Pembahasan Bab ini memaparkan pengujian yang telah dilakukan berikut penjelasannya. 4

Bab V: Kesimpulan dan Saran Bab terakhir ini berisikan tentang kesimpulan dari seluruh bab-bab yang sudah dibahas serta saran untuk pengembangan penelitian selanjutnya 5