PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA

dokumen-dokumen yang mirip
Perbandingan Teknik Pengklasteran Dalam Visualisasi Data Teks Bahasa Indonesia

STEMMING DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN ALGORITMA PORTER ABSTRAK

Implementasi Stemmer Tala pada Aplikasi Berbasis Web

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Jurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017

Text Pre-Processing. M. Ali Fauzi

IMPLEMENTASI DAN ANALISIS ALGORITMA STEMMING NAZIEF & ADRIANI DAN PORTER PADA DOKUMEN BERBAHASA INDONESIA

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

BAB II LANDASAN TEORI

Preprocessing Text Mining Pada Box Berbahasa Indonesia

PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA

BAB 3 LANDASAN TEORI

Jurnal String Vol.1 No.2 Tahun 2016 ISSN :

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

APLIKASI PENCARIAN KATA DASAR DOKUMEN BERBAHASA INDONESIA DENGAN METODE STEMMING PORTER MENGGUNAKAN PHP & MYSQL

Peningkatan Algoritma Porter Stemmer

Analisa dan Evaluasi Afiks Stemming untuk Bahasa Indonesia

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity

PENERAPAN ALGORITMA STEMMING NAZIEF & ADRIANI DAN SIMILARITY PADA PENERIMAAN JUDUL THESIS

SKRIPSI. Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata Satu Program Studi Informatika

BAB III METODOLOGI PENELITIAN

STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER

PENERAPAN STEMMING DENGAN ALGORITMA PORTER PADA QUERY PENCARIAN JUDUL BUKU

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal

HERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT.

BAB I PENDAHULUAN. Temu kembali informasi (information retrieval) adalah sebuah proses

BAB I PENDAHULUAN 1.1 Latar Belakang

SISTEM TEMU BALIK INFORMASI

BAB I PENDAHULUAN 1.1 Latar Belakang

PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA

BAB IV ANALISA DAN PERANCANGAN

Penerapan Algoritma K-Means untuk Clustering

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

BAB III METODOLOGI PENELITIAN

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR

BAB II LANDASAN TEORI

IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

IMPLEMENTASI ALGORITMA WINNOWING DAN PORTER STEMMER MENDETEKSI KEMIRIPAN DUA DOKUMEN BERBASIS WEB SKRIPSI LIDIA ARTA FERARI

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

BAB I PENDAHULUAN 1.1 Latar Belakang

APLIKASI PENENTUAN KATA DASAR DARI KATA BERIMBUHAN PADA KALIMAT BAHASA INDONESIA DENGAN ALGORITMA STEMMING

APLIKASI QUSTION ANSWERING HADITS DENGAN PENDEKATAN ONTOLOGI BERBASIS WEB RESPONSIVE TUGAS AKHIR

BAB II LANDASAN TEORI

PERINGKASAN TEKS BAHASA INDONESIA SECARA OTOMATIS MENGGUNAKAN METODE SENTENCE SCORING DAN DECISION TREE

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Information retrieval (IR) adalah ilmu yang mempelajari pencarian

BAB 3 LANDASAN TEORI

Penerapan Algoritma Jaro-Winkler Distance untuk Sistem Pendeteksi Plagiarisme pada Dokumen Teks Berbahasa Indonesia

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan

BAB III METODOLOGI PENELITIAN

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Jurnal Politeknik Caltex Riau

PENCARIAN DOKUMEN MENGGUNAKAN METODE SINGLE PASS CLUSTERING (STUDI KASUS : ABSTRAKSI TA TEKNIK INFORMATIKA UNIV. MUHAMMADIYAH MALANG) TUGAS AKHIR

BAB IV IMPLEMENTASI DAN PENGUJIAN

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 4, No. 1, Tahun

BAB 3 LANDASAN TEORI

Pemanfaatan Algoritma Porter Stemmer Untuk Bahasa Indonesia Dalam Proses Klasifikasi Jenis Buku

BAB I PENDAHULUAN I-1

APLIKASI PENDETEKSI KEMIRIPANPADA DOKUMEN MENGGUNAKAN ALGORITMA RABIN KARP

PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM.

SISTEM NOTIFIKASI KEMACETAN LALU LINTAS BERBASIS MEDIA SOSIAL DENGAN METODE NLP

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

RANCANG BANGUN APLIKASI UJI KOMPETENSI MENGETIK PADA KEYBOARD STANDAR

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

BAB III METODELOGI PENELITIAN

Bandung, Indonesia Bandung, Indonesia

BAB I PENDAHULUAN 1.1. Latar Belakang

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

BAB III METODOLOGI PENELITIAN

IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET

TEXT MINING DALAM ANALISIS SENTIMEN ASURANSI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER

IMPLEMENTASI METODE PROBABILISTIC LATENT SEMANTIC ANALYSIS UNTUK OPINION RETRIEVAL

ABSTRAK. Kata Kunci : Algoritma Genetika, Pemrosesan Bahasa Alami, Twiter, Tweet, Semantic Relatedness. Universitas Kristen Maranatha

JURNAL PENGELOMPOKAN SKRIPSI MENGGUNAKAN SELF ORGANIZING MAPS CLUSTERING (STUDI KASUS : PRODI TEKNIK INFORMATIKA UNIVERSITAS NUSANTARA PGRI KEDIRI)

BAB 3 ANALISIS DAN PERANCANGAN

SISTEM KLASIFIKASI REPORTING BERITA MENGGUNAKAN METODE NAIVE BAYES (Studi Kasus Situs Resmi Pemerintahan) KOMPETENSI RPL SKRIPSI

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR

Online News Classification Using Multinomial Naive Bayes

PENGEMBANGAN APLIKASI WEB BASED DOCUMENTS SIMILARITY MEASURE MENGGUNAKAN MODEL RUANG VEKTOR PADA DOKUMEN BERBAHASA INDONESIA. Oleh

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL

BAB V EKSPERIMEN TEXT CLASSIFICATION

Pengklasifikasian Pengaduan Masyarakat pada Laman Kantor Pertanahan Kota Surabaya I dengan Metode Pohon Keputusan

PENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA.

Kata Kunci: pengecekan ejaan, kata berimbuhan, string matching, algoritma KMP.

BAB II LANDASAN TEORI

BAB I PERSYARATAN PRODUK

Transkripsi:

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA Sigit Prasetyo Karisma Utomo 1, Ema Utami 2, Andi Sunyoto 3 1,2,3 Magister Teknik Informatika STMIK AmikomYogyakarta e-mail: 1 aku@sigitt.com, 2ema.u@amikom.ac.id, 3andi@amikom.ac.id Abstrak Inform asi sangat dibutuhkan oleh para penggunanya. Peningkatan kebutuhan informasi dengan proses pencarian dan pemisahan dokumen / data pengguna. Stemming adalah salah satu proses yang melakukan pencarian kata dasar. Metode stemming Nazief & Adriani menggunakan kamus sedangkan Metode Tala berbasiskan aturan. Penelitian ini melakukan perbandingan metode Nazief & Adriani dengan Tala untuk stemming pada teks Bahasa Indonesia. Pengujian menggunakan dua sumber data yang berbeda untuk mengukur tingkat akurasi dan kecepatan setiap metode. Sumber data dalam pengujian berupa 506 berita dari situs berita online dan 600 tweet dari twitter dari tiga akun berita nasional Indonesia. Penelitian ini dilakukan untuk mengetahui tingkat akurasi dan kecepatan pada setiap proses metode dengan dua sumber. Dari penelitian ini metode Nazief & Adriani memiliki tingkat akurasi lebih baik dari Tala dengan tingkat akurasi rata rata sebesar 78,46 % dan Tala 65,29 % untuk sumber data berita sedangkan untuk data twitter Nazief& Adriani 55,26% dan Tala 45,90%. Dari kecepatan metode Tala memilik kecepatan lebih tinggi untuk kecepatan rata rata 11,08 detik dan Nazief & Adriani 25,2 7 detik untuk sumber data berita sedangkan sumber data twitter Tala 0,46 detik dan Nazief & Adriani 0,78 detik. Kata kunci Stemming Indonesia, Tala, Nazief & Adriani Abstract The information is needed by users. Increased need for information with the search process and the separation of document / data users. Stemming is one of the processes that perform basic word search. Nazief & Adriani stemming method using a dictionary while Tala method based rules. This study did comparative method Nazief & Adriani with Tala for stemming the Indonesian text. Comparative testing using two different data sources to measure the level of accuracy and speed of each method. Sources of data in the form of 506 news from online news sites and 600 tweets from twitter of three Indonesian national news accounts. This study was conducted to determine the level of accuracy and speed in every process method with two sources. From this research method Nazief & Adriani has a better accuracy rate from Tala with average average accuracy of 78.46% and 65.29% for the Tala on from news source, while from twitter source Nazief & Adriani 55.26% and Tala 45, 90%. Tala method execution time is better than Nazief & Adriani for average speed of 11.08 seconds and 25.27 seconds Nazief & Adriani from news source while from twitter source Tala 0.46 seconds and 0.78 seconds Nazief& Adriani. Keywords Indonesian Stemmer, Nazief & Adriani, Tala 1. PENDAHULUAN nformasi sangat dibutuhkan oleh para penggunanya. Peningkatan kebutuhan informasi dengan proses pencarian dan pemisahan dokumen/data pengguna. Proses pemisahan tersebut bertujuan untuk menampilkan informasi yang sesuai atau diperlukan. Stemming adalah salah satu proses yang melakukan pencarian kata. Kata yang tidak tepat menjadi sebuah kesalahan informasi yang diperoleh. Received June1 st,2012; Revised June25 th, 2012; Accepted July 10 th, 2012

Stemming adalah salah satu tahapan text preprocessing. Proses transformasi kata kata dalam dokumen menjadi kata dasar (root word) atau proses penghilangan imbuhan kata [1]. Stemming adalah salah satu cara yang digunakan dalam meningkatkan performa IR (Information Retrieval ) dalam pemisalahn dokumen teks. Algoritma stemming untuk satu bahasa akan berbeda dengan bahasa yang lain. Proses stemming pada teks berbahasa Indonesia lebih rumit / kompleks karena terdapat variasi imbuhan yang harus dibuang untuk mendapatkan root word dari sebuah kata [2]. Penelitian sebelumnya melakukan pengujian Metode Tala [3] [4] dan untuk Nazief Adriani [1] [5] dengan data dokumen ber ekstensi pdf dan txt. Kedua metode yang memiliki perbedaan cara dalam proses stemming diperlukannya perbandingan keakuratan / akurasi dan kecepatan pada proses stemming. Tujuan penelitian ini adalah mengetahui perbandingan keakuratan / akurasi dan kecepatan proses menggunakan metode Nazief & Adriani dan Tala pada dua sumber data yaitu data berita sejumlah 506 berita dari situs berita dan 600 twitter dari tiga akun twitter berita nasional Indonesia. 2. METODE PENELITIAN Penelitian yang akan dilakukan menggunakan metode eksperimental. Penelitian eksperimental merupakan penelitian yang menjelaskan hubungan sebab akibat [7]. Pada penelitian ini, analisis yang dilakukan tahapan sebagai berikut. 1. Cleaning Proses melakukan pembersihan kata yang tidak diperlukan, angka angka, dan simbol yang tidak terbaca pada data teks. 2. Case Folding Proses dalam menyamaratakan besar kecilnya kata pada kalimat. Adapun tujuannya penyamarataan dalam deteksi pada sistem UNIX yang dapat membaca case sensitif (huruf kapital atau bukan sangat berpengaruh). 3. Tokenization Proses pemotongan kalimat menjadi sejumlah kata kata secara urut. Apabila ada pengulangan / kata yang sama dalam susunan kalimat akan tetap di potong sesuai urutan nya. 4. Stopwords Removal Proses menghilangkan kata yang tidak memiliki makna. Kamus kata stop words diambil dari penelitian [6]. 5. Stemming Proses utama ini adalah proses mentransofrmasikan kata kata pada sebuah dokumen / teks menjadi kata dasar (root words) atau proses dalam penghilangan imbuhan [1]. 3. HASIL DAN PEMBAHASAN Penelitian yang dilakukan akan membandingkan dua metode stemming. Metode stemming Nazief & Adriani dengan Tala. Data teks yang akan digunakan pengujian menggunakan sumber data berita dan tweet dari twitter. Sumber data akan dikumpulkan dilakukan proses preprocessing / text processing sebelum dilakukan stemming pada setiap kata menggunakan metode stemming. Pada proses stemming, kata yang sudah di lakukan proses stemming akan di simpan yang kemudian akan digunakan untuk perbandingan hasil stemming dari kedua metode. Pengukuran akurasi akan diperoleh dari jumlah kata dasar yang ditemukan dibagi dengan total kata. Untuk pengukuran kecepatan proses akan menggunakan fungsi pada bahasa pemrograman PHP menggunakan selisih waktu selesai proses stemming di kurangi waktu awal proses stemming. 3.1. Pengujian Data Berita Pengujian dilakukan pada seluruh data berita dan di peroleh hasil yang d apat dilihat pada Tabel 1 untuk metode Nazief & Adriani sedangkan Tabel 2 untuk metode Tala.

Tabel 1. Tabel Pengujian Nazief & Adriani Data Berita 1 531600 255 187 68 73,33% 55,212 2 531606 109 78 31 71,55% 18,789 3 531610 172 158 14 91,86% 32,46 4 531612 125 105 20 84,00% 25,103... 506 531616 63 59 4 93,65% 5,717 Total 58.964 46.430 12.534 12.791,23 Rata rata 116,530 91,759 24,771 78,46 % 25,279 Tabel 2. Tabel Pengujian Tala Data Berita 1 531600 257 150 107 52,36% 24,7 2 531606 109 62 47 56,88% 7,5 3 531610 173 142 31 82,08% 9,5 4 531612 125 83 42 66,40% 9,1... 506 531616 63 51 12 80,95 % 2,6 Total 59.253 38.874 20.379 5.609,7 Rata rata 117,101 78.826 40,275 65,29 % 11,086 Pada Tabel 1 diperoleh informasi untuk akurasi rata rata pada metode Nazief &Adriani 78,46% dengan total 58.964 kata. Untuk Tabel 2 nilai akurasi rata rata yang diperoleh pada metode Tala 65,29% dengan total 59.253 kata. Untuk waktu proses stemming, Nazief & Adriani memiliki waktu rata rata 25,27 detik sedangkan Tala 11,08 detik. 3.2. Pengujian Data Twitter Pengujian dilakukan pada seluruh data tweet dan di peroleh hasil yang dapat dilihat pada Tabel 3 untuk metode Nazief & Adriani sedangkan Tabel 4 untuk metode Tala. Tabel 3. Tabel Pengujian Nazief & Adriani Data Twitter 1 1 4 1 3 25,00% 0,32 2 2 7 4 3 57,14% 1,178 3 3 5 2 3 40,00% 0,42 4 4 5 2 3 40,00 % 0,858...... 600 600 6 3 3 50 %1,043 Total 3.492 1.973 1.519 469,743 Rata rata 5,820 3,288 2,532 55,26 % 0,782 Tabel 4. Hasil Pengujian Tala Data Twitter 1 1 4 1 3 25,00% 0,1 2 2 7 4 3 42,85% 0,3 3 3 5 2 3 40,00% 0,4 4 4 5 2 3 40,00% 0,3 5 5 7 2 5 28,57% 0,5

... É É É É É É 600 600 6 3 3 50 % 0,4 Total 3.482 1.650 1.832 276 Rata rata 5,803 2,750 3,053 45,90 % 0,46 Pada Tabel 3 diperoleh informasi untuk akurasi rata rata pada metode Nazief &Adriani 55,26% dengan total 3.492 kata. Untuk Tabel 2 nilai akurasi rata rata yang diperoleh pada metode Tala 45,90% dengan total 3.482 kata. Untuk waktu proses stemming, Nazief & Adriani waktu rata rata 0,78 detik sedangkan Tala 0,46 detik. 3.3. Perbandingan Pengujian Dari hasil pengujian yang dilakukan menggunakan dua sumber data terhadapa penggunana kedua metode stemming, maka untuk hasil perbandingan pada Gambar 1 sebagai berikut. Gambar 1 Grafik Perbandingan Akurasi Perbandingan yang dilakukan dalam pengujian pada Gambar 1 pada akurasi kedua metode stemming dalam melakukan steming pada sumber data yang digunakan. Dengan menggunakan sumber data berita, metode Nazief & Adirani memiliki nilai akurasi rata rata 78,46% menggunakan data berita sedangkan menggunakan data tweet 55,26%. Untuk akurasi rata rata metode Tala menggunakan sumber data berita sebesar 65,29% sedangkan menggunakan sumber data tweet memiliki nilai akurasi rata rata 45,90%. Dari perbandingan tersebut bahwa metode Nazief & Adriani memiliki akurasi lebih baik dibandingkan dengan metode Tala untuk proses stemming.

Pada Gambar 2, menampilkan perbandingan waktu proses stemming yang di perlukan dari kedua metode. Untuk metode Nazief & Adriani menggunakan sumber data berita memiliki waktu tercepat 46,15 detik dan waktu proses rata rata 25,27 detik. Menggunakan sumber data tweet dari twitter memiliki waktu tercepat 0,11 detik dan rata rata 0,78 detik. Menggunakan metode Tala, dengan sumber data berita memiliki waktu tercepat 0,4 detik dan rata rata 11,08 detik. Data tweet yang di proses menggunakan Tala memiliki waktu tercepat 0,1 detik dan nilai rata rata 0,46 detik. Dari Gambar 2 tersebut metode Tala memiliki waktu tercepat dibandingkan dengan metode Nazief & Adriani. 4. KESIMPULAN Berdasarkan dari pembahasan yang sudah dilakukan dapat ditarik kesimpulan untuk penelitian ini adalah sebagai berikut. 1. Nilai akurasi rata rata yang diperoleh menggunakan sumber data berita dengan jumlah 506 berita untuk metode Nazief & Adriani 78,46% dengan total kata 58.964 kata, ditemukan kata dasar 46.43 0 kata. Untuk metode Tala memiliki nilai akurasi rata rata 65,29% dengan total kata 59.253, ditemukan kata dasar 3 8.874 kata. 2. Nilai akurasi rata rata yang diperoleh menggunakan sumber data twitter dengan jumlah 600 tweet untuk metode Nazief & Adriani 5 5,26% dengan total kata 3.492 kata, ditemukan kata dasar 1.973 kata. Dengan metode Tala nilai rata rata akurasi 45,90% dengan total kata 3.482 kata, ditemukan kata dasar 1.650 kata. 3. Untuk waktu proses stemming tercepat menggunakan sumber data berita dan metode Nazief & Adriani 25,27 detik untuk nilai rata rata sedangkan menggunakan metode Tala 11,08 detik. Waktu proses dengan sumber data berita dan metode Nazief & Adriani 0,78 detik sedangkan menggunakan metode Tala 0,46 detik. 4. Dari pengujian yang dilakukan, Nazief & Adriani memiliki nilai akurasi lebih tinggi dibandingkan dengan Tala. Sedangkan untuk waktu proses stemming yang tercepat menggunakan metode Tala dibandingkan Nazief & Adriani. 5. SARAN Berdasarkan dari penelitian yang sudah disimpulkan maka dalam upaya pengembangan pada penelitian berikutnya dikemukakan beberapa saran sebagai berikut.

1. Kualitas / tingkat akurasi yang sangat dipengaruhi dari kamus kata dasar yang bisa lebih lengkap untuk digunakan dalam pencarian tipe kata dasar. 2. Peningkatan metode stemming sehingga hasil dari proses stemming dapat sesuai dengan sumber data yang di olah. 3. Penerapan penelitian serupa atau berikutnya terkait dengan pengolahan kata dan kalimat Bahasa Indonesia dalam proses stemming. UCAPAN TERIMA KASIH Penulis mengucapkan terima kasih kepada STMIK Amikom Yogyakarta yang telah memberi dukungan financial terhadap penelitian ini. DAFTAR PUSTAKA [1] Afuan L., 2013, Stemming Dokumen Teks Bahasa Indonesia Menggunakan Algoritma Porter, Jurnal Telematika, Vol. 6, No. 2, Agustus 2013. [2] Agusta L., 2009, Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief &Adriani untuk Stemming Dokumen Teks Bahasa Indonesia, Konferensi Nasional Sistem dan Informatika 2009, Bali, November 2009. [3] Siswo M., 2013, Implementasi Stemmer Tala pada Aplikasi Berbasis Web. Jurnal Teknologi Informasi DINAMIK, Vol. 18, No. 1, Januari 2013. [4] Bagus P., Sunarfri B., 2013, Peningkatan Algoritma Porter Stemmer Bahasa Indonesia berdasarkan Metode Morfologi dengan Mengaplikasikan 2 Tingkat Morfologi dan Aturan Kombinasi Awalan dan Akhiran, JNTETI, Vol. 2, No. 1, Mei 2013. [5] Nopiyanti D., Ade K., 2014, Aplikasi Pencarian Kata Dasar Dokumen Berbahasa Indonesia Dengan Metode Stemming Porter Menggunakan PHP & MYSQL, Prosiding Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2014), Oktober 2014. [6] Tala. F. Z., 2003, A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia, Master of Logic Project Institute for Logic, Language and Computation Universiteit van Amsterdam The Netherlands, 2003. [7] Hasibuan, Zainal A., 2007, Metodologi Penelitian Pada Bidang Komputer dan Teknologi Informasi. Jakarta: Univerisitas Indonesia.