BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Information Retrieval (pencarian Informasi) adalah proses pemisahan dokumen-dokumen dari sekumpulan dokumen yang ada untuk memenuhi kebutuhan pengguna. Jumlah dokumen yang tersedia di internet bertambah dengan sangat cepat. Sehingga dibutuhkan tools yang dapat membantu pengguna dalam melakukan pencarian dengan tepat dan cepat. Stemming adalah salah satu cara yang digunakan untuk meningkatkan performa IR dengan cara mentransformasi kata-kata dalam sebuah dokumen teks ke kata dasarnya. Algoritma Stemming untuk bahasa yang satu berbeda dengan algoritma stemming untuk bahasa lainnya. Sebagai contoh Bahasa Inggris memiliki morfologi yang berbeda dengan Bahasa Indonesia sehingga algoritma stemming untuk kedua bahasa tersebut juga bebeda. Proses stemming pada teks berbahasa Indonesia lebih rumit/kompleks karena terdapat variasi imbuhan yang harus dibuang untuk mendapatkan root word dari sebuah kata. Untuk itu dibutuhkan algoritma stemming yang mampu mengatasi masalah imbuhan yang bervariasi tersebut. 1.2 Rumusan Masalah Algoritma-algoritma stemming memiliki kelebihan dan kekurangannya masing-masing. Efektifitas algoritma stemming dapat diukur berdasarkan beberapa parameter, seperti kecepatan proses dan presisi. 10
Dalam Tugas Akhir ini, penulis akan membandingkan efektifitas algoritma Nazief dan Adriani dengan algoritma Porter untuk proses stemming pada teks berbahasa Indonesia, sehingga akhirnya akan diketahui algoritma yang lebih cepat dan lebih akurat dalam proses stemming. 1.3 Batasan Masalah Batasan masalah Tugas Akhir ini adalah : 1. Input sistem berupa : - Dokumen teks berbahasa Indonesia - File berekstensi.txt 2. Sistem membandingkan dua buah algoritma, yaitu algoritma Nazief & Adriani dan Algoritma Porter. 3. Hal yang dibandingkan adalah waktu proses dan presisi. 4. Output sistem adalah kata-kata dasar dari dokumen teks yang diinputkan. 1.4 Tujuan Penulisan Adapun tujuan penulisan Tugas Akhir ini adalah : 1. Sebagai salah satu syarat untuk memperoleh gelar S.Kom pada Fakultas Teknik, Program Studi Teknik Informatika, Universitas Kristen Duta Wacana. 2. Membandingkan kecepatan & ketepatan Algoritma Nazief & Adriani dengan Algoritma Porter untuk proses stemming pada teks berbahasa Indonesia. 11
1.5 Spesifikasi Sistem Untuk mendukung penerapan sistem ini, maka dibutuhkan hardware dan software yang mendukung antara lain : Kebutuhan minimal hardware : Prosesor Pentium II 450 Mhz Memori 128 MB Monitor Hardisk VGA card 8 MB Mouse dan keyboard Kebutuhan minimal software : Sistem Operasi, Microsoft Windows 98 atau Microsoft Windows NT dengan service pack 4.0 Microsoft Visual Basic 6.0 Microsoft access 2000 Kebutuhan Brainware : Pengguna sistem adalah pengguna yang dapat mengoperasikan Sistem Operasi Microsoft Windows NT/2000/XP dan memahami pengoperasian sistem serta penganalisaan output yang dihasilkan. Pengembangan sistem dapat dilakukan oleh pengguna yang menguasai Microsoft Visual Basic 6.0, Microsoft Access 2000, menguasai konsep dan perancangan basis data, serta memahami konsep stemming menggunakan Algoritma Nazief & Adriani dan algoritma Porter. 12
1.6 Metodologi Penelitian Metodologi yang digunakan dalam menyelesaikan tugas akhir ini terdiri dari beberapa tahap yaitu : 1. Studi Literatur Penulis mempelajari buku referensi, jurnal, dan artikel mengenai proses stemming, Algoritma Nazief & Adriani, Algoritma Porter, Microsoft Visual Basic, dan Microsoft Access. 2. Merancang & Membangun Sistem Penulis merancang sistem dan membangun sistem menggunakan Microsoft Visual Basic dan Microsoft Access. Pada tahap ini juga dilakukan pengujian sistem dan perbaikan kesalahan. 1.7 Sistematika Penulisan Sistematika laporan Tugas Akhir ini secara garis besar adalah sebagai berikut : BAB I : PENDAHULUAN Berisi latar belakang masalah, rumusan masalah, batasan masalah, tujuan penulisan, spesifikasi sistem, metodologi penelitian, dan sistematika penulisan. BAB II : LANDASAN TEORI Berisi teori-teori yang melatarbelakangi penulisan Tugas Akhir ini, yaitu teori tentang Stemming, Information Retrieval, Text Mining, khususnya Algoritma Nazief & Adriani dan Algoritma Porter. 13
BAB III : PERANCANGAN SISTEM Berisi perancangan sistem secara keseluruhan dari pembuatan tugas akhir ini. BAB IV : IMPLEMENTASI & ANALISIS SISTEM Berisi uraian implementasi dan analisis sistem dalam bentuk program yang dibuat. BAB V : KESIMPULAN & SARAN Berisi kesimpulan dari tugas akhir ini, saran atas hasil dari program yang dibuat dan pengembangannnya pada masa yang akan datang. 14