MODIFIKASI ALGORITMA PORTER UNTUK STEMMING PADA KATA BAHASA INDONESIA

Ukuran: px
Mulai penontonan dengan halaman:

Download "MODIFIKASI ALGORITMA PORTER UNTUK STEMMING PADA KATA BAHASA INDONESIA"

Transkripsi

1 MODIFIKASI ALGORITMA PORTER UNTUK STEMMING PADA KATA BAHASA INDONESIA Badrus Zaman Program Studi Sistem Informasi, Fakultas Sains dan Teknologi, Universitas Airlangga Jl. Dr. Ir. Soekarno MERR Surabaya ABSTRAK Proses stemming dalam information retrieval (IR) diperlukan untuk meningkatkan performansi dari IR itu sendiri, baik dari segi kecepatan maupun ketepatan. Dalam perkembangannya stemming telah dikembangkan untuk berbagai bahasa, di antaranya Porter Stemmer. Porter stemmer dikembangkan untuk stemming kata bahasa Inggris, yang dikembangkan berdasarkan morfologi kata. Tujuan penelitian ini adalah mengembangkan Porter stemmer yang dimodifikasi untuk stemming kata pada bahasa Indonesia. Stemmer ini selain menggunakan morfologi kata pada bahasa Indonesia, juga menggunakan kamus imbuhan. Kamus imbuhan tersebut berisi kata dasar terkait dengan imbuhan yang akan dihapus. Uji coba dilakukan terhadap 50 dokumen berita online berbahasa Indonesia yang didapatkan dari web portal berita online. Hasil ujicoba menunjukkan bahwa tingkat kebenaran sistem yang dikembangkan dalam melakukan stemming sebesar 0.66, sedangkan kecepatan sistem dalam melakukan stemming tiap kata sebesar detik. Kata Kunci: stemming, algoritma porter, bahasa Indonesia 1. PENDAHULUAN Dalam sebuah sistem temu kembali informasi (Information Retrieval/IR) terdapat kumpulan dokumen, yang setiap dokumennya dideskripsikan oleh kata-kata (term). Istilah yang memiliki akar kata yang sama, umumnya memiliki arti yang sama, misalnya hubung, hubungan, hubungkan, hubungi, dan menghubungi. Jika kelima istilah ini dikelompokkan ke dalam satu kelompok dengan menghilangkan imbuhannya baik awalan atau akhiran, kinerja sistem IR dapat meningkat. Proses penghilangan akhiran kata akan mengurangi jumlah total istilah dalam sistem IR sehingga mengurangi ukuran dan kompleksitas data dalam sistem. Proses penghilangan imbuhan ini dinamakan dengan proses stemming (Manning dkk., 2008), (Baeza-Yates dan Ribeiro-Neto, 1999). Menurut Husni dan Zaman (2005), secara umum, stemming dapat dilakukan dengan 2 cara, yakni manual dan otomatis. Cara otomatis dapat dilakukan dengan berbagai pendekatan, di antaranya metode affix removal yang digunakan dalam Porter stemmer. Menurut Ali dan Ibrahim (2012), Porter stemmer merupakan algoritma stemming dikembangkan oleh Martin Porter di Universitas Cambridge pada tahun 1980 yang diterapkan pada bahasa Inggris. Metode yang digunakan dalam melakukan stemming dengan memanfaatkan morfologi kata pada bahasa Inggris. Dalam hal ini imbuhan berupa akhiran (sufiks). Cara ini cukup efektif karena tidak tergantung terhadap kamus kata dasar, dan proses stemming dapat dilakukan lebih cepat (Tala, 2003). Berdasarkan porter stemmer yang menggunakan rule afiksasi untuk bahasa Inggris, maka dikembangkan stemmer untuk bahasa Indonesia. Stemmer ini dibuat berdasarkan aturan morfologi pada bahasa Indonesia (Tala, 2003). Penelitian ini coba mengembangkan modifikasi porter stemmer untuk stemming kata pada bahasa Indonesia dengan memanfaatkan morfologi bahasa Indonesia dan kamus kecil. Kamus kecil adalah kamus yang berisi sekumpulan kata yang terkait dengan imbuhan yang akan dihilangkan. Jadi, proses stemming dapat lebih cepat dilakukan. Tujuan dari penelitian ini adalah untuk melihat efektivitas stemmer yang dikembangkan jika dilihat dari ketepatan (correctness) dan lamanya proses stemming. 2. TINJAUAN PUSTAKA 2.1 Stemming Stemming pada dasarnya adalah proses pemetaan dari penguraian berbagai bentuk kata baik itu prefix, sufix, maupun gabungan antara prefix dan sufix (confix), menjadi bentuk kata dasarnya (stem) (Baeza-Yates dan Ribeiro-Neto, 1999), (Gupta, 2014). Secara umum, stemming dapat dilakukan dengan 2 cara, yakni manual dan otomatis. Cara otomatis dapat dilakukan dengan berbagai pendekatan, yakni affix removal, successor, table dan N-gram. Sedangkan metode affix removal terbagi menjadi 2, yakni longest match dan simple removal. Diagram pembagian dari teknik stemming ditunjukkan pada Gambar 1 (Husni dan Zaman, 2005). Proses stemming dilakukan dengan menghilangkan semua imbuhan (affixes) baik yang terdiri dari awalan (prefixes), sisipan (infixes), 543

2 akhiran (suffixes) dan confixes (kombinasi dari awalan dan akhiran) untuk mendapatkan kata dasar. Gambar 1. Pembagian metode stemming 2.2 Morfologi Bahasa Indonesia Ramlan (1997) mendefinisikan morfologi adalah bagian dari ilmu bahasa yang membicarakan atau yang mempelajari tentang seluk-beluk bentuk kata serta pengaruh perubahan-perubahan bentuk kata terhadap golongan dan arti kata. Morfologi dalam bahasa Indonesia terdiri dari dari struktur infleksional dan derivasional (Tala, 2003). Berikut ini adalah penjelasan mengenai morfologi pada bahasa Indonesia (Tala, 2003) Infleksional Infleksional adalah struktur sederhana yang diikuti oleh imbuhan yang tidak mempengaruhi kata dasar. Struktur ini dibagi menjadi 2, yaitu sufiks partikel dan kata ganti. Partikel berfungsi untuk memberikan penekanan pada kata. Macam-macam dari partikel adalah lah, -kah, -tah, -pun. Partikel ditulis serangkai dengan kata yang mendahuluinya, kecuali partikel pun yang ditulis terpisah. Kata ganti terdiri dari ku. mu, dan nya. Akhiran ku sebagai kata ganti ia, -mu sebagai kata kanti kamu, dan nya sebagai kata ganti ia. Tiap sufiks pada kelompok partikel dan kata ganti mungkin saja terjadi pada kata yang sama. Bila hal ini terjadi, maka harus mengikuti aturan sufiks pada kata ganti mendahului partikel. Sehingga struktur penulisan infleksional dapat disimpulkan seperti pada Gambar 2. Infleksional = (kata dasar + kata ganti) (kata dasar + partikel) (kata dasar + kata ganti + partikel) Gambar 2. Struktur morfologi kata infleksional pada Bahasa Indonesia Derivasional Derivasional adalah struktur sederhana yang diikuti imbuhan yang dapat mempengaruhi kata dasar. Derivasional pada struktur bahasa Indonesia terdiri prefix, suffix, dan konfix. Prefix yang sering muncul antara lain ber-, di-, ke-, meng-, per-, dan ter-. Beberapa prefiks seperti ber-, meng-, peng-, per-, ter- dapat terjadi pada beberapa bentuk. Bentuk tersebut tergantung dari huruf pertama dari kata dasar. Pada struktur kata derivasional terdapat proses peluluhan yaitu mengalami perubahan pengucapan, seperti kata sapu menjadi menyapu yang terdiri dari prefiks mengdan kata dasar sapu. Sufiks derivasional antara lain -i, -kan, dan an. Penambahan pada sufiks berbeda dengan prefiks, karena tidak pernah mengubah pengucapan pada kata turunannya. Konfiks merupakan gabungan dari prefix dan sufiks, di mana prefiks dan sufiks disisipkan bersama kata turunan yang baru. Namun, tidak semua kombinasi dari prefiks dan sufiks dapat digabungkan menjadi konfiks. Ada beberapa kombinasi dari prefiks dan sufiks yang tidak dibolehkan seperti yang ditunjukkan pada Tabel 1. Tabel 1. Pasangan konfiks yang tidak diperbolehkan Prefiks Sufiks ber di ke meng peng ter i an i kan an i kan an Prefiks atau konfiks dapat ditambahkan pada kata yang sudah ditambahkan prekfiks atau konfiks sebelumnya, sehingga akan menghasilkan struktur prefiks yang ganda. Namun, tidak semua prefiks atau konfiks dapat ditambahkan pada prefiks atau konfiks tertentu untuk membentuk prefik ganda. Aturan untuk menentukan prefiks ganda ditunjukkan pada Tabel 2. Tabel 2. Aturan urutan untuk prefix ganda Prefiks 1 Prefiks 2 meng di ter ke per ber Dari penjelasan di atas, dapat disimpulkan struktur derivasional didefinisikan seperti pada Gambar

3 Derivasional = prefiks sufiks konfiks prefiks ganda Di mana: prefiks = prefiks + kata dasar sufiks = kata dasar + sufiks konfiks = prefiks + kata dasar + sufiks prefiks ganda = (prefiks2 + prefiks1) (prefiks + konfiks) ( fik 2 + fik 1 + fik ) Gambar 3. Struktur morfologi kata derivasional pada Bahasa Indonesia Gabungan Infleksional dan Derivasional Dari uraian struktur morfologi infleksional dan derivasional, maka didapatkan struktur morfologi bahasa Indonesia secara umum, yang ditunjukkan pada Gambar 4. [Pre1] + [Pre2] + KD + [Suf] + [KG] + [Par] Dimana: Pre1 : prefiks 1 Pre2 : prefiks 2 KD : kata dasar Suf : sufiks KG : kata ganti Par : partikel Gambar 4. Struktur morfologi kata Bahasa Indonesia secara umum 2.3 Porter Stemmer Algoritma porter berdasarkan kenyataan bahwa kebanyakan sufiks pada bahasa Inggris merupakan kombinasi dari sufiks yang kecil dan sederhana. Tiap langkah proses pemenggalan kata dilakukan secara serial yang mensimulasikan proses kata infleksional dan derivasional. Pada tiap langkah, sufiks tertentu dihilangkan dengan aturan substitusi. Aturan substitusi diterapkan ketika sejumlah kondisi atau batasan tertentu terpenuhi. Sebagai contoh kondisi yang sederhana antara lain panjang minimum hasil stem (jumlah urutan huruf vokal dan konsonan). Panjang minimum ini disebut dengan hasil (measure). Kondisi sederhana lainnya adalah stem dilakukan bila stem berakhir dengan huruf konsonan atau bila stem terdapat huruf vocal.bila semua kondisi pada suatu aturan sesuai, maka aturan tersebut diterapkan. Hal ini akan berakibat pada pengurangan sufiks, kemudian dilanjutkan pada langkah berikutnya. Jika kondisi pada suatu aturan tidak sesuai maka dicoba kondisi untuk aturan lainnya, sehingga aturan tersebut cocok atau aturan pada langkah tersebut tidak bisa dipakai. Garis besar algoritma Porter Stemmer ditunjukkan dengan ilustrasi pada Gambar 5 (Ali dan Ibrahim, 2012). Gambar 5. Struktur morfologi kata Bahasa Indonesia secara umum 2.4 Evaluasi Algoritma Stemming Adisantoso dkk. (2003), mengemukakan bahwa evaluasi algoritma stemming dapat dilakukan dengan beberapa 3 kriteria, yaitu: a. Correctness Kondisi overstemming terjadi jika terlalu banyak bagian dari kata yang dihilangkan. Sedangkan understemming terjadi jika terlalu sedikit bagian kata yang dihilangkan. b. Retrieval effectiveness Kriteria retrieval effectiveness didapatkan dari keefektifan suatu sistem temu kembali inforrnasi dalam menemukembalikan dokumen yang relevan setelah menerapkan algoritma stemming. c. Compression Performance Kriteria compression performance dinilai dari ukuran indeks yang dihasilkan dengan menggunakan algoritma stemmer tertentu. Menurut Sembok dan Ata (2013), beberapa kesalahan yang dapat terjadi dalam proses stemming yang dapat mempengaruhi tingkat kebenaran (correctness) di antaranya adalah overstemming dan understemming. 2.5 Algoritma Porter untuk Stemming pada Kata Bahasa Indonesia Struktur morfologi kata bahasa Indonesia yang terdiri dari kombinasi struktur derivasional dan infleksional yang kecil dan sederhana, sesuai dengan ide dasar dari algoritma Porter Stemmer. Urutan langkah-langkah pada Porter Stemmer disesuaikan dengan struktur pada kata bahasa Indonesia. Sehingga dapat mengurangi tingkat kompleksitas 545

4 struktur kata sehingga menghasilkan kata dasar (stem) yang benar (Zaman dan Winarko, 2011). Karena bahasa Inggris dan bahasa Indonesia merupakan kelas bahasa yang berbeda, maka beberapa perubahan diperlukan untuk disesuaikan dengan bahasa Indonesia. Modifikasi tersebut terdiri dari perubahan pada sekumpulan aturan-aturan dan kondisi pengukuran. Karena pada Algoritma Porter hanya dapat melakukan pengurangan sufiks (suffixs stripping), maka beberapa aturan tambahan diperlukan untuk menangani pengurangan prefiks, konfiks dan juga pengejaan yang mengalami peluluhan huruf pertama pada kata dasar (Tala, 2003). Secara umum desain algoritma dari porter stemmer yang sudah dimodifikasi, ditunjukkan pada Gambar 6. Gambar 6. Algoritma Porter stemmer yang dimodifikasi untuk kata pada Bahasa Indonesia Aturan imbuhan Berdasarkan analisis morfologi pada pembahasan sebelumnya, terdapat 5 kelompok aturan untuk bahasa Indonesia. Lima aturan ini didefinisikan dengan kondisi terbalik dengan kejadian afiks pada proses perubahan. Ini berarti bahwa sufiks infleksional seperti partikel, dan kata ganti, dihilangkan terlebih dahulu kemudian menghilangkan afiks derivasional. Kelima aturan tersebut, adalah: a. Penanganan infleksional partikel Aturan yang diterapkan untuk infleksional partikel sesuai dengan Tabel 3. Menurut Ramlan (1997), penulisan partikel pun terpisah, sedangkan partikel tah termasuk dalam partikel yang tidak produktif, sehingga dalam hal ini untuk kedua partikel tersebut diabaikan. Tabel 3. Aturan tahap pertama menangani infleksional partikel Sufiks Pengganti Kondisi Contoh kah null null diakah dia lah null null adalah ada b. Penanganan infleksional kata ganti Aturan yang diterapkan untuk infleksional kata ganti sesuai dengan Tabel 4. Tabel 4. Aturan tahap kedua menangani infleksional kata ganti Sufiks Pengganti Kondisi Contoh ku null null bukuku buku mu null null bukumu buku nya null null bukunya buku c. Penanganan prefix derivasional pertama Aturan yang diterapkan untuk prefix derivasional pertama sesuai dengan Tabel 5. Tabel 5. Aturan tahap ketiga menangani derivasional prefiks pertama Prefiks Pengganti Kondisi Contoh meng null null mengukur ukur meny s V...* menyapu sapu men t V... menuduh tuduh men null null menduga duga mem p V... memukul pukul mem null null membakar bakar me null null merusak merusak peng null null pengukur ukur peny s V... Penyelam selam pen t V... penari tari pen null null penduga duga pem p V... pemandu pandu pem null null pembaca baca di null null diukur ukur ter null null tersipu sipu ke null null kekasih kasih d. Penanganan prefix derivasional pertama Aturan yang diterapkan untuk prefix derivasional kedua sesuai dengan Tabel 6. Tabel 6. Aturan tahap empat menangani derivasional prefiks kedua Prefik s Peng ganti Kondisi Contoh ber null null berlari lari bel null ajar belajar ajar be null K*er... bekerja kerja per null null Perlambat lambat pel null ajar pelajar ajar pe null null pekerja kerja 546

5 e. Penanganan sufiks derivasional Aturan yang diterapkan untuk infleksional partikel sesuai dengan Tabel 7. Bentuk dipthong seringkali membuat masalah, terutama dipthong ai dan oi ketika berada di akhir kata. Dipthong akan sangat sulit dipisahkan secara otomatis dari kata derivat dengan akhiran i seperti tandai yang terdiri dari 3 suku kata yaitu tan-da-i. Karena jumlah kata dengan dipthong lebih sedikit daripada jumlah kata dengan akhiran, maka dipthong dihilangkan atau dianggap tidak ada. Karakter terakhir (-i) dihilangkan sebagai hasil akhir dari proses stemming. Tabel 7. Aturan tahap kelima menangani derivasional sufiks Sufi ks Pen gga nti Kondisi kan null prefiks {ke, peng} an null prefiks {di,meng,ter} i null V K...c 1 c 1, c 1 s, c 2 i dan prefiks {ber,ke,peng} Contoh tarikkan tarik (meng)abaikan a bai makanan makan (per)janjian janji tandai tanda (men)dapati dapat Pemisahan prefiks dan pembenaran ejaan Pemisahan awalan dapat dialkukan seperti halnya melakukan pemisahan pada akhiran, dengan penggantian pada awal kata. Awalan pada beberapa kasus mengubah ejaan sebuah kata, sehingga koreksi atau pembenaran ejaan harus dilakukan. Sulit untuk implementasi koreksi ejaan ketika beberapa aturan pada struktur derivational pada bahasa Indonesia memiliki ambiguitas. Contohnya: memisahkan awalan meng- pada kata mengubah yang berasal dari kata ubah atau kubah. Hal ini tentu akan menyebabkan kesalahan stemming Pemisahan sisipan dan sisipan ganda Pemisahan sisipan dilakukan dengan melakukan penggantian awalan dan akhiran secara berurutan. Pemisahan awalan diakukan dulu. Kondisi lain ditambahkan untuk mengecek kemungkinan akhiran untuk membentuk kombinasi sisipan yang diperbolehkan dengan awalan yang sudah dihilangkan sebelumnya. Dengan mengabaikan akhiran inflectional, ada 5 kemungkinan kata turunan, yaitu: hanya awalan, hanya akhiran, kata sisipan, awalan dari sebuah kata sisipan, sisipan dari sebuah kata awalan. 3 kemungkinan pertama bisa didapatkan dari pemisahan awalan dan akhiran secara berurutan dan kondisi lain dari sisipan yang diperbolehkan. 2 kemungkinan yang lain sebenarnya adalah awalan ganda yang bisa diperoleh dengan menambahkan pemisahan awalan atau akhiran lain, yang mana tergantung pada pengghapusan awalan dan akhiran sebelumnya. 3. METODOLOGI PENELITIAN 3.1 Bahan Bahan yang digunakan dalam penelitian ini adalah 50 dokumen berbahasa Indonesia dengan tema kesehatan, politik, ekonomi, dan budaya yang diambil dari beberapa sumber portal berita di internet. Jumlah kalimat pada tiap dokumen berkisar kalimat. Komposisi dokumen yang digunakan untuk ujicoba ditunjukkan pada Tabel 8. Dokumendokumen ini digunakan sebagai masukan pada sistem. Tabel 8. Rekapitulasi hasil ujicoba stemming terhadap kata-kata pada dokumen Topik Jumlah Dokumen Kesehatan 12 Politik 12 Ekonomi 12 Budaya Alat Alat penelitian yang digunakan berupa notebook dengan spesifikasi: a. Processor Intel Core Duo 1,60GHZ. b. Memori 2 GB. c. Sistem Operasi Microsoft Windows XP Professional Sp 2. d. Bahasa Pemrograman PHP. e. Spreadsheet Microsoft Excel Rancangan Sistem Flowchart Rancangan sistem secara umum dibagi menjadi 4 tahap, yaitu input dokumen, bagi menjadi kumpulan kata, penghilangan stopword, dan stemming. Sebagaimana dikemukakan oleh Fachrurrozi dkk. (2013), dan Zaman & Winarko (2011), stopword adalah daftar kata yang jumlahnya sangat besar yang mempunyai fungsi namun tidak perlu digunakan sebagai penciri dokumen. Contohnya: dan, yang, atau, ini, itu dan lain-lain. Daftar stopword yang digunakan sebagai acuan dalam penelitian ini adalah stopword yang digunakan oleh Tala (2003). Gambaran dari rancangan sistem ini ditunjukkan pada Gambar

6 Dokumen 1 Stopword daftar kata 1 Pisah Kata kata stopword 2 Hapus Stopword daftar kata tanpa stopword 2 kamus partikel kata partikel 3 Hapus partikel kata kata ganti 4 Hapus kata ganti daftar kata tanpa partikel user 3 kamus kata ganti 5 daftar kata tanpa kata ganti Hapus prefiks1 5 kamus prefiks 2 4 kamus prefiks 1 kata prefiks 1 kata prefiks 2 hapus prefiks 2 6 daftar kata tanpa prefiks 1 Gambar 7. Rancangan sistem Document Flow Diagram (DFD) Perancangan proses dengan Data Flow Diagram (DFD) bertujuan untuk mengetahui proses tranformasi data dari input dokumen hingga menjadi output berupa hasil stemming. a. Context Diagram Diagram konteks dibuat untuk menggambarkan sistem secara umum dan entitas yang terlibat di dalamnya. Dalam konteks diagram system yang akan dibuat terdapat 1 eksternal yakni user. Diagram konteks ini seperti pada Gambar 8. User memasukkan dokumen pada sistem, kemudian user menerima hasil stemming. user Dokumen Hasil Stemming Gambar 8. Context diagram sistem 0 Modifikasi Algoritma Porter untuk Stemming pada Kata Bahasa Indonesia + b. DFD Level 0 Dari context diagram pada Gambar 7 kemudian dijabarkan menjadi DFD Level 0 seperti yang ditunjukkan pada Gambar 9. Pada level ini terdapat 6 proses, yaitu pisah kata, hapus stopword, hapus partikel, hapus kata ganti, hapus prefix 1, hapus prefiks2, dan hapus sufiks. Proses hapus stoword dilakukan dengan cara membandingkan suatu kata dengan daftar kata stopword dari datastore stopword. Hal ini juga berlaku bagi kelima proses lainnya di mana sebelum dilakukan penghapusan suatu imbuhan, terlebih dahulu dicek dahulu ke masingmasing datastore, misalnya sub proses menghapus partikel, maka harus dicek dahulu di datastore kamus partikel. user daftar kata tanpa prefiks 2 Hasil Stemming 6 kamus sufiks kata sufiks Gambar 9. DFD Level 0 sistem 7 hapus sufiks 3.4 Evaluasi Sistem Evaluasi sistem dilakukan melalui 2 cara, yaitu correctness dan waktu. Correctness diukur dengan cara membandingkan hasil stemming dengan kamus kata dasar bahasa Indonesia, sedangkan waktu diukur berdasarkan waktu rata-rata yang dibutuhkan oleh sistem untuk melakukan stemming. 4. HASIL DAN PEMBAHASAN 4.1 Implementasi Sistem Berdasarkan rancangan pada pembahasan sebelumnya, maka secara umum untuk melakukan stemming diperlukan 5 sub proses, yaitu pemenggalan partikel, kata ganti, prefiks1, prefiks2, dan sufiks. Salah satu implementasi sistem untuk menghapus imbuhan partikel yang ditunjukkan pada Gambar if(!word.compare(word.size()-3,3,"kah")) { word.resize(word.size()-3); imbuhan.push_back(konfiks(0,"kah")); } else if(!word.compare(word.size()-3,3,"lah")) { word.resize(word.size()-3); imbuhan.push_back(konfiks(0,"lah")); } } Gambar 10. Algoritma menghapus partikel 4.2 Desain user interface (UI) Sistem menerima masukan dokumen berupa teks, kemudian dengan event klik tombol proses akan dilakukan proses stemming terhadap dokumen tersebut. Halaman UI untuk masukan dokumen pada sistem ditunjukkan pada Gambar

7 Gambar 11. Tampilan UI sistem untuk memasukkan dokumen Tampilan UI hasil dari keluaran sistem ditunjukkan pada Gambar 12. Hasil keluaran sistem yang utama ada 2, yaitu waktu yang dibutuhkan untuk melakukan stemming keseluruhan kata pada dokumen, dan tingkat kebenaran hasil stemming sistem. Hasil stemming untuk kata yang berwarna biru berarti sukses atau kata tersebut terdapat pada kamus kata dasar bahasa Indonesia, sedangkan warna hitam berarti gagal dalam melakukan stemming. Selain 2 hasil utama di atas, juga terdapat jumlah kata sebelum diproses, dan sesudah diproses oleh sistem. Jumlah kata tersebut terjadi pengurangan karena di awal proses terjadi penghapusan stopword. Artinya kata-kata yang termasuk stopword tidak ikut dilakukan stemming. 4.3 Ujicoba Ujicoba sistem dilakukan terhadap ke-50 dokumen yang sudah dipersiapkan. Tiap dokumen dihitung jumlah kata yang akan di-stemming, waktu yang dibutuhkan untuk stemming keseluruhan kata pada dokumen tersebut, dan persentase kebenaran hasil stemming yang dibandingkan dengan kamus kata dasar bahasa Indonesia. Jumlah kata awal untuk keseluruhan dokumen adalah kata. Kemudian dilakukan proses penghilangan stopword sehingga jumlah kata saat ini adalah Jumlah yang terakhir ini kemudian diperlakukan proses stemming. Dari jumlah ini sistem berhasil melakukan stemming sebanyak kata atau dengan kata lain tingkat kebenaran (correctness) sebesar Sedangkan waktu yang dibutuhkan untuk memproses keseluruhan kata (setelah dihapus stopword) selama detik atau dengan rata-rata proses stemming per kata selama detik. Hasil rekapitulasi untuk masing-masing dokumen berdasarkan topik ditunjukkan pada Tabel 9 (appendix). Dari rekapitulasi ujicoba tersebut dapat ditunjukkan bahwa untuk topik Budaya memiliki tingkat kebenaran stemming sebesar 0.66 dengan waktu rata-rata yang dibutuhkan untuk stemming per kata selama detik. Waktu yang dibutuhkan untuk melakukan proses stemming bersifat relatif, di antaranya relatif terhadap alat atau pun bahasa pemrograman yang digunakan. Sedangkan tingkat kebenaran hasil stemming ternyata dipengaruhi oleh jumlah koleksi kata dasar pada masing-masing imbuhan. Semakin lengkap, maka akurasi dari hasil sistem semakin baik. 5. KESIMPULAN Berdasarkan hasil ujicoba dan evaluasi, maka dapat disimpulkan beberapa hal, di antaranya: a. Proses stemming untuk kata pada bahasa Indonesia dapat mengadopsi algoritma porter stemmer. b. Akurasi porter stemmer yang dimodifikasi untuk stemming pada kata bahasa Indonesia adalah 0.66 sedangkan rata-rata waktu proses tiap kata selama detik. c. Hasil akurasi stemming sangat bergantung pada koleksi kamus kata dasar terkait imbuhan. Semain lengkap koleksi, maka akurasi dari hasil stemming akan semakin baik. Gambar 12. Tampilan UI sistem saat menghasilkan hasil keluaran 6. SARAN Untuk mencapai hasil penghitungan analisis Porter Stemmer yang lebih akurat dan maksimal maka kamus kata terkait imbuhan yang terdapat dalam program harus selalu di update mengikuti perkembangan kata bahasa Indonesia. 549

8 7. PUSTAKA Adisantoso, J., Wigena, A. H., & Akhmadi, C. H. (2003). Algoritma Pemotong Akhiran Baku untuk Kata dalam Bahasa Indonesia Berbasis Algoritma Porter. Majalah Ilmiah Ilmu Komputer, Vol.1 No.1, 1-8. Ali, N. H., & Ibrahim, N. S. (2012). Porter Stemming Algorithm for Semantic Checking. Proceedings of International Conference on Computer and Information Technology (ICCIT) 2012, (hal ). Baeza-Yates, R., & Ribeiro-Neto, B. (1999). Modern Information Retrieval. New York: ACM Press. Fachrurrozi, M., Yusliani, N., & Yoanita, R. U. (2013). Frequent Term Based Text Summarization for Bahasa Indonesia. International Conference on Innovation in Engineering and Technology (ICIET 2013) Dec , (hal ). Bangkok (Thailand). Gupta, V. (2014). Suffix Stripping Based Verb Stemming for Hindi. International Journal of Advanced Research in Computer Science and Software Engineering Volume 4, Issue 1, January, 179. Husni, M., & Zaman, B. (2005). Perangkat lunak Peringkas Dokumen Berbahasa Indonesia dengan Hybrid Stemming. Surabaya: Teknik Informatika Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember. Manning, C. D., Raghavan, P., & Schutze, H. (2008). Introduction to Information Retrieval. New York: Cambridge University Press. Ramlan, M. (1997). Ilmu Bahasa Indonesia: Morfologi Suatu Tinjauan Deskriptif. Yogyakarta: CV Karyono. Sembok, T. M., & Ata, B. A. (2013). Arabic Word Stemming Algorithms and Retrieval Effectiveness. Proceeedings of the World Congress on Engineering Vol III, WCE 2013, July 3-5, London, U.K. Tala, F. Z. (2003). A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia. Amsterdam: Institute for Logic, Language and Computation, Universiteit van Amsterdam. Zaman, B., & Winarko, E. (2011). Analisis Fitur Kalimat untuk Peringkas Teks Otomatis pada Bahasa Indonesia. Indonesian Journal of Computing and Cybernatics Systems (IJCSS), APPENDIX Tabel 9. Rekapitulasi hasil ujicoba stemming terhadap kata-kata pada dokumen berdasarkan topik Topik A B C T1 (detik) T2 (detik) Correctn ess Kesehatan Politik ,815 2, Ekonomi ,091 2, Budaya ,053 3, Jumlah 24,601 16,035 10,840 Rata-rata A : Jumlah kata sebelum dihapus stopword B : Jumlah kata setelah dihapus stopword C : Jumlah kata yang berhasil di-stemming T1 : Waktu untuk memproses stemming keseluruhan kata 550

PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA

PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA Ledy Agusta Fakultas Teknologi Informasi Universitas Kristen Satya Wacana ledyagusta@gmail.com

Lebih terperinci

Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25

Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25 54 Widiasri, M., dkk.: Peningkatan Kinerja Pencarian Dokumen Tugas Akhir Menggunakan Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi

Lebih terperinci

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita 6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional

Lebih terperinci

IMPLEMENTASI DAN ANALISIS ALGORITMA STEMMING NAZIEF & ADRIANI DAN PORTER PADA DOKUMEN BERBAHASA INDONESIA

IMPLEMENTASI DAN ANALISIS ALGORITMA STEMMING NAZIEF & ADRIANI DAN PORTER PADA DOKUMEN BERBAHASA INDONESIA ISSN (Print) : 1693-1173 ISSN (Online) : 2548-4028 IMPLEMENTASI DAN ANALISIS ALGORITMA STEMMING NAZIEF & ADRIANI DAN PORTER PADA DOKUMEN BERBAHASA INDONESIA Dwi Wahyudi 1), Teguh Susyanto 2), Didik Nugroho

Lebih terperinci

SISTEM TEMU BALIK INFORMASI

SISTEM TEMU BALIK INFORMASI SISTEM TEMU BALIK INFORMASI Algoritma Nazief dan Adriani Disusun Oleh: Dyan Keke Rian Chikita Agus Dwi Prayogo 11/323494/PA/14356 11/323813/PA/14362 11/323856/PA/14367 PRODI S1 ILMU KOMPUTER JURUSAN ILMU

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Information Retrieval System Sistem temu kembali informasi ( information retrieval system) merupakan sistem yang dapat digunakan untuk menemukan informasi yang relevan dengan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Pengertian Stemming Stemming merupakan suatu proses atau cara dalam menemukan kata dasar dari suatu kata. Stemming sendiri berfungsi untuk menghilangkan variasi-variasi morfologi

Lebih terperinci

Implementasi Stemmer Tala pada Aplikasi Berbasis Web

Implementasi Stemmer Tala pada Aplikasi Berbasis Web Mardi Siswo Utomo Program Studi Teknik Informatika, Universitas Stikubank email : mardiutomo@gmail.com Abstrak Stemming adalah proses untuk mencari kata dasar pada suatu kata. Pada analisa temu kembali

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

Jurnal String Vol.1 No.2 Tahun 2016 ISSN :

Jurnal String Vol.1 No.2 Tahun 2016 ISSN : PERBANDINGAN ALGORITMA STEMMING PORTER DENGANARIFIN SETIONO UNTUK MENENTUKAN TINGKAT KETEPATAN KATA DASAR Dian Novitasari Program Studi Teknik Informatika, Universitas Indraprasta PGRI Emai : diannovita.unindra@gmail.com

Lebih terperinci

Analisa dan Evaluasi Afiks Stemming untuk Bahasa Indonesia

Analisa dan Evaluasi Afiks Stemming untuk Bahasa Indonesia ISSN : 088-9984 Seminar Nasional dan ExpoTeknik Elektro 0 Analisa dan Evaluasi Afiks Stemming untuk Bahasa Indonesia Jiwa Malem Marsya ) dan Taufik Fuadi Abidin ) ) Data Mining and IR Research Group FMIPA

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian

Lebih terperinci

Preprocessing Text Mining Pada Box Berbahasa Indonesia

Preprocessing Text Mining Pada  Box Berbahasa Indonesia Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Preprocessing Text Mining Pada Email Box Berbahasa Indonesia Gusti Ngurah Mega Nata 1), Putu Pande Yudiastra 2) STMIK STIKOM

Lebih terperinci

Peningkatan Algoritma Porter Stemmer

Peningkatan Algoritma Porter Stemmer JNTETI, Vol. 2, No. 2, Mei 2013 1 Peningkatan Algoritma Porter Stemmer Bahasa Indonesia berdasarkan Metode Morfologi dengan Mengaplikasikan 2 Tingkat Morfologi dan Aturan Kombinasi Awalan dan Akhiran Putu

Lebih terperinci

STEMMING DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN ALGORITMA PORTER ABSTRAK

STEMMING DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN ALGORITMA PORTER ABSTRAK STEMMING DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN ALGORITMA PORTER Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal Soedirman Jl. Mayjen Sungkono Blater Km

Lebih terperinci

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM Lusianto Marga Nugraha¹, Arie Ardiyanti Suryani², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Stemming

Lebih terperinci

PENERAPAN ALGORITMA STEMMING NAZIEF & ADRIANI DAN SIMILARITY PADA PENERIMAAN JUDUL THESIS

PENERAPAN ALGORITMA STEMMING NAZIEF & ADRIANI DAN SIMILARITY PADA PENERIMAAN JUDUL THESIS PENERAPAN ALGORITMA STEMMING NAZIEF & ADRIANI DAN SIMILARITY PADA PENERIMAAN JUDUL THESIS Hafiz Ridha Pramudita Magister Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman,

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA Sigit Prasetyo Karisma Utomo 1, Ema Utami 2, Andi Sunyoto 3 1,2,3 Magister Teknik Informatika STMIK AmikomYogyakarta e-mail: 1 aku@sigitt.com,

Lebih terperinci

BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah Analisis Kebutuhan Analisis Masalah

BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah Analisis Kebutuhan Analisis Masalah BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah 3.1.1 Analisis Kebutuhan Ada banyak hal yang berhubungan dengan sastra atau ilmu bahasa yang dapat diterapkan di dalam teknologi, seperti penerjemahan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

BAB I PERSYARATAN PRODUK

BAB I PERSYARATAN PRODUK BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat

Lebih terperinci

1. Pendahuluan. 1.1 Latar belakang

1. Pendahuluan. 1.1 Latar belakang 1. Pendahuluan 1.1 Latar belakang Pada saat ini, kebutuhan setiap individu terhadap Internet semakin meningkat. Hal ini terlihat dari semakin banyaknya fasilitas yang ditawarkan dari dunia Internet itu

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI 2.1 Sinonim kata 2.1.1. Definisi Sinonim Menurut Chaer (2009), Relasi makna adalah hubungan kemaknaan atau relasi semantik antara sebuah kata atau satuan bahasa lainnya dengan akta

Lebih terperinci

STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER

STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER Dony Yudha Lestiyanto, A12.2009.03537 Sistem Informasi S1 Universitas Dian Nuswantoro Semarang 2014 Abstrak Stemming

Lebih terperinci

APLIKASI PENENTUAN KATA DASAR DARI KATA BERIMBUHAN PADA KALIMAT BAHASA INDONESIA DENGAN ALGORITMA STEMMING

APLIKASI PENENTUAN KATA DASAR DARI KATA BERIMBUHAN PADA KALIMAT BAHASA INDONESIA DENGAN ALGORITMA STEMMING APLIKASI PENENTUAN KATA DASAR DARI KATA BERIMBUHAN PADA KALIMAT BAHASA INDONESIA DENGAN ALGORITMA STEMMING Julianto Wibowo Mahasiswa Program Studi Teknik Informatika, STMIK Budi Darma Medan Jl. Sisimangaraja

Lebih terperinci

BAB I PENDAHULUAN. Kata-kata Bahasa Indonesia kaya akan imbuhan. Kurang lebih ada sekitar

BAB I PENDAHULUAN. Kata-kata Bahasa Indonesia kaya akan imbuhan. Kurang lebih ada sekitar BAB I PENDAHULUAN 1.1. LATAR BELAKANG Kata-kata Bahasa Indonesia kaya akan imbuhan. Kurang lebih ada sekitar 35 imbuhan resmi yang disebutkan dalam Kamus Besar Bahasa Indonesia. Imbuhan-imbuhan ini dapat

Lebih terperinci

IMPLEMENTASI ALGORITMA ENHANCED CONFIX STRIPPING STEMMER PADA KAMUS SISTEM BAHASA ISYARAT INDONESIA SKRIPSI ANNIFA IQRAMITHA

IMPLEMENTASI ALGORITMA ENHANCED CONFIX STRIPPING STEMMER PADA KAMUS SISTEM BAHASA ISYARAT INDONESIA SKRIPSI ANNIFA IQRAMITHA IMPLEMENTASI ALGORITMA ENHANCED CONFIX STRIPPING STEMMER PADA KAMUS SISTEM BAHASA ISYARAT INDONESIA SKRIPSI ANNIFA IQRAMITHA 091402028 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI

Lebih terperinci

STUDI PERBANDINGAN ALGORITMA - ALGORITMA STEMMING UNTUK DOKUMEN TEKS BAHASA INDONESIA. Manase Sahat H Simarangkir

STUDI PERBANDINGAN ALGORITMA - ALGORITMA STEMMING UNTUK DOKUMEN TEKS BAHASA INDONESIA. Manase Sahat H Simarangkir STUDI PERBANDINGAN ALGORITMA - ALGORITMA STEMMING UNTUK DOKUMEN TEKS BAHASA INDONESIA Manase Sahat H Simarangkir Magister Teknik informatika, Komputer, Universitas Presiden Jababeka Education Park Jl.

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi Penelitian adalah sekumpulan peraturan, kegiatan, dan prosedur yang digunakan oleh pelaku suatu disiplin ilmu. Metodologi juga merupakan analisis teoritis mengenai

Lebih terperinci

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

Jurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017

Jurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017 TEXT MINING DALAM PENENTUAN KLASIFIKASI DOKUMEN SKRIPSI DI PRODI TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER BERBASIS WEB Teuku Muhammad Johan dan Riyadhul Fajri Program Studi Teknik Informatika Fakultas

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN 19 BAB 3 METODE PENELITIAN 3.1. Tahap Pembentukan Knowledge Graph Sekumpulan kata-kata dalam suatu dokumen tidak akan terepresentasi sepenuhnya ke dalam graf. Bagian inti dokumen yang akan menyebabkan

Lebih terperinci

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM : PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI Oleh : SEPTIAN BAGUS WAHYONO NPM : 0734010126 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS

Lebih terperinci

BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era

BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era BAB I PENDAHULUAN 1.1 Latar Belakang Information retrieval atau disingkat dengan IR adalah menemukan bahan (dokumen) dari dokumen terstruktur (biasanya teks) yang memenuhi kebutuhan informasi pada ruang

Lebih terperinci

Seminar Nasional Aplikasi Teknologi Informasi 2004 Yogyakarta, 19 Juni 2004

Seminar Nasional Aplikasi Teknologi Informasi 2004 Yogyakarta, 19 Juni 2004 Seminar Nasional Aplikasi Teknologi Informasi 2004 Yogyakarta, 19 Juni 2004 Sistem Stemming Otomatis untuk Kata dalam Bahasa Indonesia Rila Mandala, Erry Koryanti, Rinaldi Munir, Harlili Laboratorium Ilmu

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Peringkas Teks Otomatis Berikut ini akan dibahas mengenai teori-teori peringkas teks otomatis dalam beberapa subbab, yaitu sebagai berikut: 2.1.1 Definisi Peringkas Teks Otomatis

Lebih terperinci

Pemanfaatan Algoritma Porter Stemmer Untuk Bahasa Indonesia Dalam Proses Klasifikasi Jenis Buku

Pemanfaatan Algoritma Porter Stemmer Untuk Bahasa Indonesia Dalam Proses Klasifikasi Jenis Buku Indriyono, Pemanfaatan Algoritma Porter Stemmer Untuk Bahasa Indonesia Dalam Proses Klasifikasi Jenis Buku 301 Pemanfaatan Algoritma Porter Stemmer Untuk Bahasa Indonesia Dalam Proses Klasifikasi Jenis

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Information Retrieval (pencarian Informasi) adalah proses pemisahan dokumen-dokumen dari sekumpulan dokumen yang ada untuk memenuhi kebutuhan pengguna. Jumlah

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

BAB I PENDAHULUAN. Temu kembali informasi (information retrieval) adalah sebuah proses

BAB I PENDAHULUAN. Temu kembali informasi (information retrieval) adalah sebuah proses BAB I PENDAHULUAN 1.1 Latar Belakang Temu kembali informasi (information retrieval) adalah sebuah proses menemukan kembali dokumen-dokumen relevan untuk memenuhi kebutuhan informasi para pengguna (Manning,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Plagiarisme Menurut Peraturan Menteri Pendidikan RI Nomor 17 Tahun 2010 dikatakan: "Plagiat adalah perbuatan sengaja atau tidak sengaja dalam memperoleh atau mencoba memperoleh

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka

Lebih terperinci

Penerapan Algoritma Paice atau Husk untuk Stemming pada Kamus Bahasa Inggris ke Bahasa Indonesia

Penerapan Algoritma Paice atau Husk untuk Stemming pada Kamus Bahasa Inggris ke Bahasa Indonesia Penerapan Algoritma Paice atau Husk untuk Stemming pada Kamus Bahasa Inggris ke Bahasa Indonesia Damar Aji Asmara, Dewi Khairani, Siti Ummi Masruroh Program Studi Teknik Informatika Fakultas Sains dan

Lebih terperinci

BAB 1 PENDAHULUAN Pengantar

BAB 1 PENDAHULUAN Pengantar BAB 1 PENDAHULUAN 1.1. Pengantar Dewasa ini fungsi komputer semakin dimanfaatkan dalam segala bidang. Baik di bidang pendidikan, bisnis, ataupun penelitian. Penggunaan komputer kini tidak lagi terbatas

Lebih terperinci

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Komang Rinartha

Lebih terperinci

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: KHOZINATUL

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Natural Language Processing Natural language processing (NLP), merupakan salah satu pendekatan terkomputerisasi untuk menganalisa teks berdasarkan aspek teori dan teknologi. Menurut

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1. Rekomendasi Berita Portal berita online saat ini menjadi popular yang bisa menyediakan berita yang dapat diakses melalui internet, tantagannya adalah membantu user menemukan berita

Lebih terperinci

BAB 3. METODOLOGI PENELITIAN

BAB 3. METODOLOGI PENELITIAN BAB 3. METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian Pada penelitian ini menggunakan alat penelitian berupa perangkat keras dan perangkat lunak, yaitu : 1. Perangkat keras a. Processor Intel Core

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas seiring dengan sumber informasi yang banyak merupakan suatu bukti konkret bahwa informasi sangat dibutuhkan

Lebih terperinci

HASIL DAN PEMBAHASAN Analisis Pola Word Graph Kata Benda 1 Listen to Customer 2 Build or Revise Mock-up Customer Test Drives Mock-up

HASIL DAN PEMBAHASAN Analisis Pola Word Graph Kata Benda 1 Listen to Customer 2 Build or Revise Mock-up Customer Test Drives Mock-up 4 Listen to customer Gambar 1 Diagram metode pengembangan prototype. 1 Listen to Customer Tahap listen to customer merupakan tahap untuk melakukan pengumpulan kebutuhan pengguna (requirements gathering).

Lebih terperinci

APLIKASI PENCARIAN KATA DASAR DOKUMEN BERBAHASA INDONESIA DENGAN METODE STEMMING PORTER MENGGUNAKAN PHP & MYSQL

APLIKASI PENCARIAN KATA DASAR DOKUMEN BERBAHASA INDONESIA DENGAN METODE STEMMING PORTER MENGGUNAKAN PHP & MYSQL APLIKASI PENCARIAN KATA DASAR DOKUMEN BERBAHASA INDONESIA DENGAN METODE STEMMING PORTER MENGGUNAKAN PHP & MYSQL Dini Nopiyanti 1 Kemal Ade Sekarwati 2 1,2 Jurusan Sistem Informasi, FIKTI, Universitas Gunadarma

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

BAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA

BAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA BAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA 2.1 Konsep dan Landasan Teori 2.1.1 Konsep Morfologi adalah ilmu yang mempelajari seluk-beluk bentuk kata serta fungsi perubahan-perubahan bentuk kata

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Indonesia adalah bahasa resmi dari negara Indonesia. Bahasa Indonesia memiliki sekitar 23 juta penutur asli pada tahun 2010, dan lebih dari 140.000.000 penutur

Lebih terperinci

BAB III METODOLOGI PENELITIAN. ini. Pada dasarnya penelitian ini terpisah antara pengembangan MBROLA

BAB III METODOLOGI PENELITIAN. ini. Pada dasarnya penelitian ini terpisah antara pengembangan MBROLA BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian yang dilakukan dapat dilihat pada gambar 3.1 dibawah ini. Pada dasarnya penelitian ini terpisah antara pengembangan MBROLA dan sistem

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Permasalahan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Permasalahan BAB 1 PENDAHULUAN 1.1 Latar Belakang Permasalahan Teknik Struktur Data dan Data Mining merupakan salah satu ilmu komputer yang penting dan menarik perhatian teori informatika. Saat ini teknik ini sudah

Lebih terperinci

Penanganan Kasus Overstemming dan Understemming dengan Modifikasi Algoritma Stemming

Penanganan Kasus Overstemming dan Understemming dengan Modifikasi Algoritma Stemming Penanganan Kasus Overstemming dan Understemming dengan Modifikasi Algoritma Stemming Stephanie Betha R.H Informatika, AMIK Purnama Niaga Indramayu Jl Ir.H.Djuanda No.256 Indramayu ntephbetha@gmail.com

Lebih terperinci

SISTEM PENCARIAN PASAL-PASAL TINDAK PIDANA PELANGGARAN BERDASARKAN KUHP DENGAN METODE STRING MATCHING BOYER-MOORE SKRIPSI

SISTEM PENCARIAN PASAL-PASAL TINDAK PIDANA PELANGGARAN BERDASARKAN KUHP DENGAN METODE STRING MATCHING BOYER-MOORE SKRIPSI SISTEM PENCARIAN PASAL-PASAL TINDAK PIDANA PELANGGARAN BERDASARKAN KUHP DENGAN METODE STRING MATCHING BOYER-MOORE SKRIPSI Diajukan Untuk Memenuhi Sebagai Persyaratan Dalam Memperoleh Gelar Sarjana Komputer

Lebih terperinci

IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET

IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III BAB 3 METODE PENELITIAN 3.1. Tahap pengumpulan data Data awal dalam penelitian ini adalah dokumen berupa artikel teks berita online dalam bahasa Indonesia yang dikumpulkan secara acak dari portal

Lebih terperinci

STEMMING KATA KERJA BAHASA INDONESIA PADA FILE TEKS MENGGUNAKAN ALGORITMA LOVINS DAN ALGORITMA PAICE/HUSK. Proposal Tugas Akhir. Logo kampus.

STEMMING KATA KERJA BAHASA INDONESIA PADA FILE TEKS MENGGUNAKAN ALGORITMA LOVINS DAN ALGORITMA PAICE/HUSK. Proposal Tugas Akhir. Logo kampus. Disiapkan Oleh: Sunaryo, S.Kom Email: sunaryo.online@gmail.com STEMMING KATA KERJA BAHASA INDONESIA PADA FILE TEKS MENGGUNAKAN ALGORITMA LOVINS DAN ALGORITMA PAICE/HUSK Proposal Tugas Akhir Logo kampus

Lebih terperinci

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan pengetahuan dan kehidupan manusia sungguh dipercepat dengan kemudahan akses terhadap begitu banyak informasi. Pada beberapa waktu yang lalu akses terhadap

Lebih terperinci

beberapa tag-tag lain yang lebih spesifik di dalamnya.

beberapa tag-tag lain yang lebih spesifik di dalamnya. metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Desain Penelitian Desain penelitian adalah tahapan atau gambaran yang akan dilakukan dalam melakukan penelitian, untuk memudahkan penelitian dalam melakukan penelitian dibutuhkan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Lembaga pendidikan mempunyai peran yang sangat vital dalam melahirkan sumber daya manusia yang berkualitas dan mampu bersaing di era globalisasi. Untuk membentuk sumber

Lebih terperinci

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB IV IMPLEMENTASI DAN PENGUJIAN 90 BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Sistem Tahap ini merupakan tahap dari implementasi program serta implementasi dari setiap proses tahap penelitian. 4.1.2 Persiapan Arsitektur Pada

Lebih terperinci

UKDW BAB 1 PENDAHULUAN Latar Belakang

UKDW BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Dengan perkembangan teknologi yang semakin pesat, setiap orang dituntut untuk bisa memanfaatkan dengan baik perkembangan teknologi dan dapat menggunakan di dalam kehidupan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Kata Pengertian kata secara sederhana adalah sekumpulan huruf yang mempunyai arti. Dalam kamus besar bahasa indonesia (KBBI) pengertian kata adalah unsur bahasa yang diucapkan

Lebih terperinci

BAB I PENDAHULUAN. tersebut dibuktikan dengan semakin canggihnya perangkat keras seperti prosesor,

BAB I PENDAHULUAN. tersebut dibuktikan dengan semakin canggihnya perangkat keras seperti prosesor, BAB I PENDAHULUAN 1.1. Latar Belakang Akhir-akhir ini teknologi komputer berkembang dengan pesat. Hal tersebut dibuktikan dengan semakin canggihnya perangkat keras seperti prosesor, memori, dan sebagainya.

Lebih terperinci

IMPLEMENTASI METODE SUPPORT VECTOR MACHINES UNTUK PENCARIAN INFORMASI BUKU RIKI HIDAYAT

IMPLEMENTASI METODE SUPPORT VECTOR MACHINES UNTUK PENCARIAN INFORMASI BUKU RIKI HIDAYAT IMPLEMENTASI METODE SUPPORT VECTOR MACHINES UNTUK PENCARIAN INFORMASI BUKU RIKI HIDAYAT 10108371 Latar Belakang Masalah 1. Jumlah buku yang semakin banyak. 2. Belum adanya sistem pencarian informasi buku

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kemajuan yang pesat di bidang teknologi informasi terutama internet, telah menimbulkan lonjakan informasi yang hebat. Hal ini terjadi karena internet memungkinkan banyak

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

Ekstraksi Kata Dasar Secara Berjenjang (Incremental Stemming) Berbasis Aturan Morfologi untuk Teks Berbahasa Indonesia

Ekstraksi Kata Dasar Secara Berjenjang (Incremental Stemming) Berbasis Aturan Morfologi untuk Teks Berbahasa Indonesia JURNAL INFOTEL Informatika - Telekomunikasi - Elektronika Website Jurnal : http://ejournal.st3telkom.ac.id/index.php/infotel ISSN : 2085-3688; e-issn : 2460-0997 Ekstraksi Secara Berjenjang (Incremental

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan

Lebih terperinci

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM Jurnal Diajukan kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta untuk

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Desain penelitian adalah tahapan atau gambaran yang akan dilakukan

BAB III METODOLOGI PENELITIAN. Desain penelitian adalah tahapan atau gambaran yang akan dilakukan BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian adalah tahapan atau gambaran yang akan dilakukan peneliti dalam melakukan penelitian. Desain penelitian dibuat untuk memudahkan peneliti

Lebih terperinci

BAB I PENDAHULUAN. aturan-aturan yang berlaku dalam bahasa tersebut. Sebuah kata dalam suatu bahasa dapat berupa simple word seperti table, good,

BAB I PENDAHULUAN. aturan-aturan yang berlaku dalam bahasa tersebut. Sebuah kata dalam suatu bahasa dapat berupa simple word seperti table, good, BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa baik lisan maupun tulisan merupakan alat yang berfungsi untuk menyampaikan suatu ide, gagasan, pikiran, perasaan, pengalaman dan pendapat. Oleh karena itu bahasa

Lebih terperinci

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

BAB 2 LANDASAN TEORI. 2.1 Text mining

BAB 2 LANDASAN TEORI. 2.1 Text mining BAB 2 LANDASAN TEORI Bab ini akan membahas landasan teori, penelitian terdahulu, kerangka pikir, dan hipotesis yang mendasari penyelesaian permasalahan dalam pengklasifikasian novel menggunakan TF-IDF.

Lebih terperinci

BAB I PENDAHULUAN I - 1

BAB I PENDAHULUAN I - 1 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dunia pendidikan merupakan dunia yang memerlukan perhatian khusus karena pendidikan merupakan faktor yang sangat mempengaruhi kualitas para calon penerus bangsa

Lebih terperinci

PENGARUH TEXT PREPROCESSING PADA CLUSTERING DOKUMEN TEKS BERBAHASA INDONESIA

PENGARUH TEXT PREPROCESSING PADA CLUSTERING DOKUMEN TEKS BERBAHASA INDONESIA PENGARUH TEXT PREPROCESSING PADA CLUSTERING DOKUMEN TEKS BERBAHASA INDONESIA Milatina, Abdul Syukur, Catur Supriyanto Pascasarjana Teknik Informatika Universitas Dian Nuswantoro ABSTRACT Document clustering

Lebih terperinci

BAB III METODE PENELITIAN. Pengetahuan Alam dan Jurusan Budidaya Perairan Fakultas Pertanian Universitas

BAB III METODE PENELITIAN. Pengetahuan Alam dan Jurusan Budidaya Perairan Fakultas Pertanian Universitas BAB III METODE PENELITIAN 3.1. Waktu dan Tempat Penelitian Penelitian ini dilakukan di Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam dan Jurusan Budidaya Perairan Fakultas Pertanian

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

SISTEM DETEKSI KEMIRIPAN DOKUMEN DENGAN ALGORITMA COSINE SIMILARITY DAN SINGLE PASS CLUSTERING

SISTEM DETEKSI KEMIRIPAN DOKUMEN DENGAN ALGORITMA COSINE SIMILARITY DAN SINGLE PASS CLUSTERING SISTEM DETEKSI KEMIRIPAN DOKUMEN DENGAN ALGORITMA COSINE SIMILARITY DAN SINGLE PASS CLUSTERING Sugiyamta Abstrak Kesamaan Dokumen dapat digunakan untuk menjadi petunjuk dan contoh mencari informasi yang

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN BAB III ANALISIS DAN PERANCANGAN Analisis dan perancangan berfungsi untuk mempermudah, memahami dan menyusun perancangan pada bab selanjutnya. Selain itu juga berfungsi untuk memberikan gambaran dan solusi

Lebih terperinci

Bab 1 PENDAHULUAN Latar Belakang Masalah

Bab 1 PENDAHULUAN Latar Belakang Masalah Bab 1 PENDAHULUAN Latar Belakang Masalah Pada masa sekarang ini perkembangan dalam dunia komputer terutama dalam bidang software telah maju dengan pesat dan mempengaruhi berbagai sektor kehidupan manusia,

Lebih terperinci

ALGORITMA STEMMING UNTUK KATA SERAPAN BAHASA INDONESIA

ALGORITMA STEMMING UNTUK KATA SERAPAN BAHASA INDONESIA ALGORITMA STEMMING UNTUK KATA SERAPAN BAHASA INDONESIA Nurul Hilal Ayyidar, Abdul Syukur, Hendro Subagyo Pascasarjana Teknik Informatika Universitas Dian Nuswantoro ABSTRACT Stemming algorithm is indispensable

Lebih terperinci

1. PENDAHULUAN 1.1 Latar belakang Masalah

1. PENDAHULUAN 1.1 Latar belakang Masalah 1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.

Lebih terperinci