BAB 1 PENDAHULUAN. 1.1.Latar Belakang

dokumen-dokumen yang mirip
BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. bentuk utama penyimpanan data (Purwoko, 2006). 2006). Karena itu lah pencarian string merupakan salah satu hal yang sangat

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN Latar Belakang

IMPLEMENTASI ALGORITMA TWO SLIDING WINDOWS UNTUK MEMPERCEPAT PENCARIAN DOKUMEN

BAB I PENDAHULUAN. 1.1Latar Belakang

PENCARIAN KATA DAN SINONIM KATA DALAM DOKUMEN DENGAN MENGGUNAKAN ALGORITMA TWO SLIDING WINDOWS SKRIPSI FRANS OCTAVIANUS

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. sebagai sumber pertama dan utama yang banyak memuat ajaran-ajaran yang

BAB I PENDAHULUAN. tanpa aturan-aturan yang baku. Sedangkan dalam pemasaran konvensional, barang

BAB I PENDAHULUAN I.1. Latar Belakang [1] [2] [3] [4] [5]

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Jurnal Coding, Sistem Komputer Untan Volume 04, No.1 (2016), hal ISSN : x


BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

IMPLEMENTASI ALGORITMA BRUTE FORCE DALAM PENCARIAN DATA KATALOG BUKU PERPUSTAKAAN

BAB 1 PENDAHULUAN UKDW

BAB I PENDAHULUAN. yang mampu mengakomodasi kebutuhan pengolahan data, seperti data Kerja UKDW

Kombinasi Algoritma Pattern Matching dan BFS-DFS pada aplikasi Music Discovery

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Kemajuan teknologi internet dan e-business belakangan ini telah

BAB 1 PENDAHULUAN 1.1. Latar belakang

BAB 1 PENDAHULUAN UKDW

BAB I PENDAHULUAN Latar Belakang

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. agama dan kepercayaan. Sehingga adanya simbol atau semboyan Bhinneka

BAB I PENDAHULUAN. Menurut Peraturan Menteri Pendidikan dan Kebudayaan (Permendikbud) Nomor 103

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Dalam dunia pendidikan saat ini biasanya instansi pemerintahan menetapkan

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN Pengantar

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

BAB III METODOLOGI PENELITIAN

ANALISIS STRING MATCHING PADA JUDUL SKRIPSI DENGAN ALGORITMA KNUTH-MORRIS PRATT (KMP)

BAB I PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

BAB 1. Universitas Sumatera Utara

BAB I PENDAHULUAN. lebih baik, pemerintahan perlu semakin didekatkan kepada masyarakat.

MILIK UKDW BAB 1 PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN. terjadi diberbagai kalangan. Dalam Kamus Besar Bahasa Indonesia, definisi

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. antara komputasi dengan komunikasi untuk melakukan tugas-tugas informasi

Aplikasi String Matching Pada Fitur Auto-Correct dan Word-Suggestion

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. pula. Teknologi juga bisa diibaratkan suatu alat yang sangat penting untuk

UKDW BAB 1 PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

SISTEM PENCARIAN PASAL-PASAL TINDAK PIDANA PELANGGARAN BERDASARKAN KUHP DENGAN METODE STRING MATCHING BOYER-MOORE SKRIPSI

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

APLIKASI PENENTUAN JENIS PART OF SPEECH MENGGUNAKAN METODE N-GRAM DAN STRING MATCHING

BAB I PENDAHULUAN. Diantara banyak fungsi komputer yang digunakan oleh manusia adalah. pencarian data serta pengurutan data (Handoyo, 2004).

Analisis Algoritma Knuth Morris Pratt dan Algoritma Boyer Moore dalam Proses Pencarian String

BAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy).

BAB 2 LANDASAN TEORI

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

1. Pendahuluan. 1.1 Latar belakang

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. merupakan salah satu teknologi internet. Pemanfaatan teknologi Web sudah. manusia yang dapat dipenuhi dengan teknologi Web.

APLIKASI ANALISIS DAN UJI PERBANDINGAN ALGORITHMA KNUT MORRIS PRATT ( KMP ) DAN BOOYER MOORE ( BM ) UNTUK PENCARIAN POLA KATA DALAM FILE TEKS SKRIPSI

BAB I PENDAHULUAN. berinovasi menciptakan suatu karya yang original. Dalam hal ini tindakan negatif

Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara

TECHNICAL REPORT PENGGUNAAN ALGORITMA PENCOCOKAN STRING BOYER-MOORE DALAM MENDETEKSI PENGAKSESAN SITUS INTERNET TERLARANG

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

STEMMING DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN ALGORITMA PORTER ABSTRAK

BAB III METODOLOGI PENELITIAN

Algoritma String Matching pada Mesin Pencarian

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN Latar Belakang

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB I PENDAHULUAN. Teknologi adalah keseluruhan sarana untuk menyediakan barang-barang yang

Aplikasi Algoritma String Matching dan Regex untuk Validasi Formulir

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

BAB 2 LANDASAN TEORI

Penerapan Algoritma Knuth Morris Pratt dalam Aplikasi Penerjemah Teks

BAB I PENDAHULUAN I-1

Fatkhul Amin Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang

BAB I PENDAHULUAN. Android merupakan salah satu mobile Operating System atau sistem

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Permasalahan

BAB I PENDAHULUAN 1.1 Latar belakang

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

BAB I PENDAHULUAN. pesat terutama perkembangan internet. Dengan adanya internet dapat

Transkripsi:

7 BAB 1 PENDAHULUAN 1.1.Latar Belakang Saat ini informasi sangat mudah didapatkan terutama melalui media internet. Dengan banyaknya informasi yang terkumpul atau tersimpan dalam jumlah yang banyak, user akan kesulitan mendapatkan informasi berbentuk dokumen yang diinginkan. Semakin bertambahnya dokumen, penggunaan sistem pencarian pola teks ataupun informasi yang terdapat di dalamnya menjadi penting. Dengan adanya sistem pencarian teks banyak menghemat waktu pengerjaan untuk menemukan informasi yang terdapat dalam dokumen. Sistem tersebut menerima kata kunci (keyword) yang ditulis oleh user dan melakukan pencocokan dengan database. Selama ada penyimpanan dan pencarian kembali dokumen, sistem dapat bekerja dengan baik. Tiap dokumen teks bisa diolah untuk menemukan informasi baru. Di dalam dokumen tersebut terkadang terdapat kata penghubung yang saling berhubungan dan menimbulkan makna yang berbeda, sedangkan dalam bahasa seringkali terdapat sinonim kata yang sama maknanya dengan kata kunci pencarian. Dalam beberapa dokumen seperti artikel bahasa terkadang memiliki kata-kata yang masi jarang digunakan atau dijumpai seperti beranda, telaga, bilik, misai, dan jeram. Kata-kata tersebut mengandung persamaan kata dengan kata-kata umum yang sudah sering digunakan dalam pembicaraan sehari-hari.akan tetapi, kata kunci pencarian yang umumnya dicari oleh user, dominan berupa kata-kata umum yang sering dijumpai. Beberapa penelitian telah dilakukan berhubung dengan sistem pencarian kata antara lain Februariyanti, et al membuat prototipe mesin pencari dokumen teks, algoritma yang diuji menggunakan algoritma indeks inverted untuk proses indeks kata

2 (term) dan menghitung cosine similaritas untuk menghitung kesamaan kata dalam dokumen. (Februariyanti, et al. 2010). Hasil uji menunjukan bahwa algoritma dapat digunakan untuk menghitung tingkat similaritas (kesamaan) dokumen berdasarkan kata kunci yang diinputkan oleh pengguna tetapi tidak berdasarkan persamaan makna kata yang sering muncul di dalam dokumen. Bari, et al (2010) menerapkan pencarian kata dengan vector space model untuk melakukan perhitungan kemiripan data berdasarkan kata yang diinput. Kemiripan data dipertimbangkan berdasarkan tingkat kemunculan data tersebut. Oleh karena itu, apabila dihadapkan dengan jumlah dokumen yang banyak dan kemunculan kata baku yang masih jarang dijumpai, diperlukan adanya suatu metode untuk menyelesaikan permasalahan tersebut. Metode yang diajukan didalam penelitian ini adalah metode stemming yang merupakan salah satu teknik text mining untuk mendapatkan kata dasar dan diakhiri dengan eliminasi kata-kata umun yang muncul dalam jumlah besar dan dianggap tidak memiliki makna (stopword). Dalam implementasinya, metode ini akan menggunakan algoritma pattern matching sebagai algoritma pencarian kata dalam dokumen. Salah satu metode yang digunakan dalam pencocokan pola (pattern matching) yaitu algoritma two sliding windows (TSW) yang mempunyai keunggulan dalam fase pencarian (searching phase). Berdasarkan penelitian yang dilakukan oleh Hudaib et al, algoritma TSW mempunyai performasi yang lebih unggul khususnya jika pola tersebut berada diakhir teks. Hasil pengujian menunjukkan percobaan dan perbandingan dengan algoritma lainnya seperti algoritma Knuth-Morris-Pratt dan Boyer-Moore lebih cepat dan membutuhkan usaha yang lebih sedikit. Pada mulanya, algoritma ini memulai preprocessing phase untuk membagi string menjadi dua bagian (two windows) sebanyak n/2 ukuran string. Kemudian, dilakukan scanning pada fase pencarian dari kiri dan kanan secara paralel dan bersamaan( Hudaib et al, 2008 ). Dengan demikian, dalam skripsi ini penulis akan menggunakan algoritma two sliding windows pada pencarian sinonim kata dalam dokumen.

3 1.2. Rumusan Masalah Terdapat kesulitan dalam memahami kata dalam bahasa Indonesia yang jarang digunakan dalam pembicaraan sehari-hari misalnya kata baku yang terdapat di dalam artikel atau jurnal. Oleh karena itu, dibutuhkan suatu pendekatan untuk mengatasi permasalahan persamaan kata dalam dokumen. 1.3. Tujuan Penelitian Penelitian ini bertujuan untuk mencari makna kata dan sinonim kata dalam dokumen dengan menggunakan algoritma two sliding windows. 1.4. Batasan Masalah Agar penelitian dapat berjalan dengan baik dan terarah, maka penelitian ini akan menggunakan batasan sebagai berikut: 1. Dokumen yang diproses berupa artikel atau jurnal ilmiah. 2. Pencarian kata menggunakan bahasa Indonesia. 3. Sinonim kata yang dipakai hanya dibatasi pada kata benda dan kata kerja. 4. Referensi kata dasar dari KBBI ( Kamus Besar Bahasa Indonesia ). 5. Referensi sinonim kata dari thesaurus Indonesia. 1.5. Manfaat Penelitian Hasil dari penelitian ini diharapkan dapat memberikan manfaat, yaitu : 1. Menambah referensi penelitian mengenai berbagai sistem yang menyangkut pencarian kata atau informasi. 2. Memberikan pendekatan hasil yang lebih optimal dengan penerapan algoritma two sliding windows. 3. Menambah pengetahuan mengenai penggunaan algoritma TSW yang lebih cepat dalam menghadapi jumlah data yang kompleks. 4. Menjadi salah satu alternatif algoritma pencarian bagi sistem temu daya informasi.

4 1.6.Metodologi Penelitian Penelitian akan dilakukan dengan tahapan-tahapan metodologi penelitian sebagai berikut : 1. Studi Literatur Pada tahap ini dilakukan studi kepustakaan dengan melakukan pengumpulan referensi melalui berbagai macam buku, jurnal, artikel, dan sumber referensi lainnya yang berkaitan dengan penelitian ini. 2. Pengumpulan Data Pada tahap ini dilakukan pengumpulan data dan informasi berupa kamus data dan sejumlah jurnal ilmiah yang akan diperlukan dalam penelitian ini. 3. Analisis dan Perancangan Pada tahap ini dilakukan analisis terhadap studi literatur untuk mendapatkan pendekatan kata dalam dokumen. Setelah itu, dilakukan perancangan arsitektur sistem yang akan dibangun berdasarkan analisis yang telah dibuat sebelumnya. 4. Implementasi Pata tahap ini, perancangan sistem yang telah dibuat akan diimplementasikan ke dalam suatu aplikasi yang dibuat dengan menggunakan bahasa pemrograman PHP dan database MySQL. 5. Pengujian Pada tahap ini dilakukan pengujian aplikasi yang telah dibuat untuk mengetahui apakah aplikasi tersebut sudah berjalan dengan benar dan sesuai dengan perancangan yang telah dilakukan sebelumnya. 6. Penyusunan Laporan Pada tahap ini diakukan penyusunan dokumentasi dari hasil analisis dan implementasi dari aplikasi yang telah dibuat. 1.7.Sistematika Penulisan Sistematika penulisan skripsi ini terdiri dari lima bagian utama, yaitu :

5 Bab 1: Pendahuluan Bab ini akan menjelaskan tentang latar belakang penelitian, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metodologi penelitian, dan sistematika penulisan. Bab 2: Landasan Teori Bab ini berisi tentang teori dan penelitian terdahulu yang digunakan untuk menyelesaikan permasalahan yang akan dibahas dalam penelitian ini. Bab 3: Analisa dan Perancangan Sistem Pada bab ini penulis menjelaskan arsitektur sistem yang akan dibangun dan pemrosesan stemming dengan menggunakan algoritma Porter serta pencarian teks dibantu dengan algoritma two sliding windows. Bab 4: Implementasi dan Pengujian Sistem Pada bab ini dibahas implementasi dari metode yang digunakan serta pengujian hasil penelitian dengan kriteria yang telah ditentukan. Bab 5: Kesimpulan dan Saran Bab ini memuat kesimpulan dari penelitian yang dilakukan serta saran yang diharapkan dapat bermanfaat untuk pengembangan penelitian selanjutnya.