PERANCANGAN SISTEM DETEKSI PLAGIAT PADA DOKUMEN TEKS DENGAN KONSEP SIMILARITY MENGGUNAKAN ALGORITMA RABIN KARP NASKAH PUBLIKASI

Ukuran: px
Mulai penontonan dengan halaman:

Download "PERANCANGAN SISTEM DETEKSI PLAGIAT PADA DOKUMEN TEKS DENGAN KONSEP SIMILARITY MENGGUNAKAN ALGORITMA RABIN KARP NASKAH PUBLIKASI"

Transkripsi

1 PERANCANGAN SISTEM DETEKSI PLAGIAT PADA DOKUMEN TEKS DENGAN KONSEP SIMILARITY MENGGUNAKAN ALGORITMA RABIN KARP NASKAH PUBLIKASI diajukan oleh Salmuasih kepada SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER AMIKOM YOGYAKARTA

2 2

3 DESIGN OF PLAGIARISM DETECTION SYSTEM FOR TEXT DOCUMENT WITH SIMILARITY CONCEPT USING RABIN KARP ALGORITHM PERANCANGAN SISTEM DETEKSI PLAGIAT PADA DOKUMEN TEKS DENGAN KONSEP SIMILARITY MENGGUNAKAN ALGORITMA RABIN KARP Salmuasih Andi Sunyoto Jurusan Teknik Informatika STMIK AMIKOM YOGYAKARTA ABSTRACT Plagiarism is becoming increasingly serious problem as the rapid development of technology. Various people can easily access digital content such as images, video, mp3, text documents, and source code that is usually the target of plagiarism. Ironically acts of plagiarism is most prevalent among academics as students and learners. In this case most often done is copy-paste-edit text documents. Plagiarism is a crime, because it recognizes people's property as a personal masterpiece. As anticipated, detection tools needed to analyze the acts committed plagiarism. This detection tool is built with a strategic approach Rabin-Karp algorithm, which is a multiple-pattern search algorithm. This algorithm is one of the best in analyzing compatibility between documents. It uses a hashing technique. The search will be more efficient with this technique because it will compare multiple digit numbers. Keywords: Plagiarism, String matching, Pattern Matching, Rabin-Karp, Hashing, Similarity 3

4 1. Pendahuluan Plagiarisme selalu menjadi perhatian di banyak sektor, terutama sektor akademis. Sering kita temui pekerjaan teman yang dihargai dengan nilai 0 karena diketahui telah menyalin hasil pekerjaan temannya yang lain. Praktik menyalin beberapa bagian atau keseluruhan tulisan tanpa mencantumkan sumber menjadi hal biasa yang sering ditemukan pada tugas harian, makalah, bahkan skripsi. Pencegahan dan pendeteksian merupakan cara yang dapat dilakukan untuk mengurangi plagiarisme. Pencegahan berarti menghalangi munculnya plagiarisme yang lebih ditekankan kepada moral masyarakat dan sistem pendidikan. Cara ini akan memberikan efek jangka panjang yang luar biasa. Pendeteksian berarti cara untuk mengungkapkan plagiarisme. Beberapa perangkat lunak yang didesain untuk mendeteksi plagiarisme dokumen, diantaranya Turnitin, Eve2, CopyCatchGold, WordCheck, Glatt, Moss, JPlag. Berdasarkan analisis informasi yang ada di web, pendeteksi terbaik sesuai fungsinya adalah Turnitin (Lukashenko, dkk, 2007). Pendeteksian plagiarisme atau plagiat menggunakan konsep similarity atau kemiripan dokumen merupakan salah satu cara untuk mendeteksi copy&paste plagiarism dan disguised plagiarism. Menggunakan metode fingerprinting, pendeteksian plagiat ini tidak memperhatikan adanya penulisan sumber rujukan. Pada sistem deteksi ini akan diaplikasikan text mining untuk tahap preprocessing dan algoritma Rabin Karp untuk string matching. Algoritma Rabin Karp adalah algoritma multiple pattern search yang sangat efisien untuk mencari string dengan pola banyak. Selanjutnya akan dibahas bagaimana algoritma Rabin Karp bekerja sekaligus implementasinya pada sebuah aplikasi dalam mendeteksi plagiarisme dokumen. 2. Landasan Teori 2.1 Plagiarisme Plagiarisme atau plagiat adalah penjiplakan atau pengambilan karangan, pendapat orang lain dan menjadikannya seolah-olah karangan sendiri (KBBI, 1997: 775). Berdasarkan penelitian, Gipp dan Meuschke (2011) mengkategorikan praktek plagiat berdasarkan cara yang digunakan, diantaranya : 1. Copy&Paste plagiarism, menyalin setiap kata tanpa perubahan. 2. Disguised plagiarism, tergolong kedalam praktek menutupi bagian yang disalin, teridentifikasi ke dalam empat teknik, yaitu shake&paste, expansive plagiarism, contractive plagiarism, dan mosaic plagiarism. 3. Technical disguise, teknik meringkas untuk menyembunyikan konten plagiat dari deteksi otomatis dengan memanfaatkan kelemahan dari metode analisis teks dasar, 4

5 misal dengan mengganti huruf dengan simbol huruf asing. 4. Undue paraphrasing, sengaja menuliskan ulang pemikiran asing dengan pemilihan kata dan gaya plagiator dengan menyembunyikan sumber asli. 5. Translated plagiarism, mengkonversi konten dari satu bahasa ke bahasa lain. 6. Idea plagiarism, menggunakan ide asing tanpa menyatakan sumber. 7. Self plagiarism, penggunaan sebagian atau keseluruhan tulisan pribadi yang tidak dibenarkan secara ilmiah. Taxonomy plagiat menurut Alzahrani, dkk digambarkan sebagai berikut: 2.2 Pendekatan Deteksi Plagiat Pendekatan sistem deteksi plagiat digolongkan menjadi dua, yaitu external dan intrinsic. Pendekatan external bertujuan untuk menemukan kesesuaian bagian teks secara harfiah, sedangkan pendekatan intrinsic mencoba untuk mengenali perubahan gaya penulisan (Stein, 2006). Strategi pendekatan external diantaranya: Perbandingan Teks Lengkap. Metode ini diterapkan dengan membandingkan semua isi dokumen (Gipp, Meusche, Beel 2011). Solusi untuk metode ini adalah algoritma Boyer-Moore dan algoritma Knuth-Morris-Pratt. Kesamaan Kata Kunci. Prinsip dari metode ini adalah mengekstrak kata kunci dari dokumen dan kemudian dibandingkan dengan kata kunci pada dokumen yang lain. Metode Fingerprinting, digunakan untuk mendeteksi keakuratan salinan antar dokumen, baik semua teks atau hanya sebagian teks saja. Prinsip kerja dari metode ini menggunakan teknik hashing, yaitu fungsi yang mengkonversi setiap string menjadi bilangan. Misalnya Rabin-Karp, Winnowing dan Manber. 2.3 Similarity Dokumen Konsep similarity sudah menjadi isu yang sangat penting di hampir setiap bidang ilmu pengetahuan. Zaka (2009) dalam disertasinya menjelaskan tiga macam teknik yang dibangun untuk menentukan nilai similarity (kemiripan) dokumen. 1. Distance-based similarity measure Distance-based similarity measure mengukur tingkat kesamaan dua buah objek dari segi jarak geometris dari variabel-variabel yang tercakup di dalam kedua objek tersebut. Metode Distance-based similarity ini meliputi Minkowski Distance, Manhattan/City block distance, Euclidean distance, Jaccard distance, Dice s Coefficient, Cosine similarity, Levenshtein Distance, Hamming distance, dan Soundex distance. 2. Feature-based similarity measure Feature-based similarity measure melakukan penghitungan tingkat kemiripan dengan merepresentasikan objek ke dalam bentuk feature-feature yang ingin 5

6 diperbandingkan. Feature-based similarity measure banyak digunakan dalam melakukan pengklasifikasian atau pattern maching untuk gambar dan teks. 3. Probabilistic-based similarity measure Probabilistic-based similarity measure menghitung tingkat kemiripan dua objek dengan merepresentasikan dua set objek yang dibandingkan dalam bentuk probability. Kullback Leibler Distance dan Posterior Probability termasuk dalam metode ini. 2.4 Text Mining Text mining adalah salah satu bidang khusus dari data mining. Feldman dan Sanger (2007) mendefinisikan text mining sebagai suatu proses menggali informasi dimana seorang user berinteraksi dengan sekumpulan dokumen menggunakan tools analisis yang merupakan komponen-komponen dalam data mining. Tujuan dari text mining adalah untuk mendapatkan informasi yang berguna dari sekumpulan dokumen. Dalam memberikan solusi, text mining mengadopsi dan mengembangkan banyak teknik dari bidang lain, seperti Data mining, Information Retrieval (IR), Statistic and Mathematic, Machine Learning, Linguistic, Natural Languange Processing (NLP), dan Visualization. Kegiatan riset untuk text mining antara lain ekstraksi dan penyimpanan teks, preprocessing akan konten teks, pengumpulan data statistik dan indexing, dan analisa konten (Triawati, 2009). Tahapan dalam text mining meliputi tokenizing, filtering, stemming, tagging dan analyzing (Mooney, 2006). 2.5 Indonesian Porter Stemmer Algoritma Porter ditemukan oleh Martin Porter Algoritma tersebut digunakan untuk stemming bahasa Inggris, kemudian karena proses stemming bahasa Inggris berbeda dengan bahasa Indonesia, maka dikembangkan algoritma Porter khusus untuk bahasa Indonesia (Porter Stemmer for Bahasa Indonesia) oleh W.B. Frakes pada tahun Algoritma / langkah-langkah pada Porter Stemmer: Menghapus partikel seperti: -kah, -lah, -tah Mengapus kata ganti (Possesive Pronoun), seperti ku, -mu, -nya Mengapus awalan pertama. Jika tidak ditemukan, maka lanjut ke langkah 4a, dan jika ada maka lanjut ke langkah 4b. a. Menghapus awalan kedua, dan dilanjutkan pada langkah ke 5a b. Menghapus akhiran, jika tidak ditemukan maka kata tersebut diasumsikan sebagai kata dasar (root word). Jika ditemukan maka lanjut ke langkah 5b. a. Menghapus akhiran dan kata akhir diasumsikan sebagai kata dasar (root word). b. Menghapus awalan kedua dan kata akhir diasumsikan sebagai kata dasar (root word). 6

7 2.6 String Matching String matching atau pencocokan string adalah subjek yang penting dalam kaitannya dengan text-processing. String matching merupakan bahasan yang sangat penting dalam ilmu komputer, karena teks adalah bentuk utama dalam pertukaran informasi (Charras-Lecroq, 2006). Persoalan pencarian string dirumuskan sebagai berikut (Munir, 2004) : 1. teks (text), yaitu (long) string yang panjangnya n karakter 2. pattern, yaitu string dengan panjang m karakter (m < n) yang akan dicari di dalam teks. Cara kerjanya adalah mencari lokasi pertama di dalam teks yang bersesuaian dengan pattern. Contoh : Pattern : hari Teks : kami pulang hari kamis target Penggunaan string matching mencakup pencarian pola dalam DNA sequence, search engine internet, menemukan halaman web yang relevan pada query, dapat pula dimanfaatkan untuk mendeteksi adanya plagiarisme karya tulis. Termasuk dalam algoritma string matching diantaranya algoritma Naive, algoritma Rabin Karp, algoritma Finite Automaton, dan algoritma Knuth Morris Pratt (Cormen, dkk, 2009). 2.7 Algoritma Rabin Karp Algoritma Rabin Karp ditemukan oleh Michael O. Rabin dan Richard M. Karp. Algoritma ini menggunakan metode hash dalam mencari suatu kata. Teori ini jarang digunakan untuk mencari kata tunggal, namun cukup penting dan sangat efektif bila digunakan untuk pencarian jamak (Atmopawiro, 2006). Rabin Karp merepresentasikan setiap karakter ke dalam bentuk desimal digit (digit radix-d) = {0, 1, 2, 3,, d}, dimana d =. Sehingga didapat masukan string k berturut-turut sebagai perwakilan panjang k desimal. Karakter string sesuai dengan jumlah desimal 31,415. Kemudian pola p dihash menjadi nilai desimal dan string direpresentasikan dengan penjumlahan digit-digit angka menggunakan aturan Horner's, misal (Elchison, 2004) : { A, B, C,..., Z } { 0, 1, 2,..., 26 } BAN = 14 CARD = 22 Untuk pola yang panjang dan teks yang besar, algoritma ini menggunakan operasi mod, setelah dikenai operasi mod q, nilainya akan menjadi lebih kecil dari q, misal: 7

8 BAN = = 14 = 14 mod 13 = 1 = BAN 1 CARD = = 22 = 22 mod 13 = 9 = CARD 9 Tetapi tidak semua nilai hash yang cocok berarti polanya cocok. Hal ini sering terjadi pada beberapa kasus, ini disebut spurious hits. Kemungkinan terjadinya diantaranya karena: Operasi mod terinterfensi oleh keunikan nilai hash (nilai mod q biasanya dipilih bilangan prima sehingga 10q hanya cocok dengan 1 kata komputer) 14 mod 13 = 1 27 mod 13 = 1 Informasi hilang setelah penjumlahan BAN = 14 CAM = 14 Sedangkan pseudocode dan rumus matematis yang digunakan adalah sebagai berikut (Cormen, dkk, 2009): RABIN-KARP-MATCHER (T, P, d, q) n = T.length m = P.length h = d m-1 mod q p = 0 t0 = 0 for i = 1 to m // preprocessing p = (dp + P[i]) mod q t0 = (dt0 + T[i]) mod q for s = 0 to n m if p == ts // matching if P[1.. m] == T[s s + m] print Pattern occurs with shift s if s < n m ts+1 = (d(ts - T[s + 1] h) + T[s + m + 1]) mod q Rumus matematis: t s+1 = (d (t s T [s + 1] h) + T [s + m + 1] mod q dimana t s t s+1 = nilai desimal dengan panjang m dari substring T [s s + m], untuk s = 0, 1,..., n - m = nilai desimal selanjutnya yang dihitung dari t s d = radix desimal (bilangan basis 10) 8

9 h = d m-1 n = panjang teks m = panjang pola q = nilai modulo Pengurangan dengan T [s + 1] * h adalah untuk menghilangkan high-order digit dari t s, mengalikan hasilnya dengan 10 untuk menggeser satu digit angka ke kiri, dan menambahkan low-order digit dengan T [s + m + 1]. Misalnya, jika m = 5 dan t s = 31415, maka kita ingin menghapus high-order digit T [s +1] = 3, masukkan low-order digit baru (anggap T [s +5 +1] = 2) dan modulo = 3 untuk memperoleh t s +1 = (10 ( * 10000)) + 2 mod 13 = mod 13 = 8 Gambar 2. 1 Algoritma Rabin Karp 2.8 Peningkatan Performa Algoritma Rabin Karp Telah kita pahami bahwa spurious hit adalah beban tambahan bagi algoritma yang akan meningkatkan waktu proses. Hal ini dikarenakan algoritma harus membandingkan pola terhadap teks yang hasil modulonya sama tetapi nilai hashnya berbeda. Untuk menghindari pencocokan yang tidak perlu, Singh dan Kochar (2008) memberikan solusi untuk tidak hanya membandingkan sisa hasil bagi, tetapi membandingkan hasil baginya juga. REM (n1/q) = REM (n2/q) and QUOTIENT (n1/q) = QUOTIENT (n2/q) Jadi, successful hit harus memenuhi dua syarat, yaitu nilai sisa hasil bagi dan nilai hasil baginya harus sama. Selebihnya adalah unsuccessful hit tanpa perlu melakukan 9

10 pencocokan lagi. Hal ini berarti tidak ada pemborosan waktu untuk mengecek spurious hit. RB_IMPROVED (T, P, d, q) n = T.length m = P.length h = d m-1 mod q p = 0 t0 = 0 Q = 0 pq = 0 h = d m-1 mod q for i = 1 to m // preprocessing p = (dp + P[i]) mod q t0 = (dt0 + T[i]) mod q for s = 0 to n m Q=T{s+1...s+ m] div q If ( ts = p and Q = pq) // matching print Pattern occurs with shift s if s < n m ts+1 = (d(ts - T[s + 1] h) + T[s + m + 1]) mod q 2.9 Pengukuran Nilai Similarity Mengukur similarity (kemiripan) dan jarak antara dua entitas informasi adalah syarat inti pada semua kasus penemuan informasi, seperti pada Information Retrieval dan Data Mining yang kemudian dikembangkan dalam bentuk aplikasi, salah satunya adalah sistem deteksi plagiat. Penggunaan ukuran similarity yang tepat tidak hanya meningkatkan kualitas pilihan informasi tetapi juga membantu mengurangi waktu dan biaya proses (Zaka, 2009). Kosinov (2001) menyarankan untuk mengaplikasikan Dice's Similarity Coefficient dalam penghitungan nilai similarity yang menggunakan pendekatan k-gram. S = K * C (A + B) Dimana S adalah nilai similarity, A dan B adalah jumlah dari kumpulan k-grams dalam teks 1 dan teks 2. C adalah jumlah dari k-grams yang sama dari teks yang dibandingkan. 3. Analisis 3.1 Analisis Masalah Kegiatan plagiat dokumen teks adalah satu hal yang penting untuk diperhatikan. Berbagai macam cara telah ditawarkan sebagai solusi dari permasalahan ini, baik yang berefek jangka panjang maupun jangka pendek. Salah satunya adalah sistem deteksi plagiat. Jika selama ini mayoritas penanganan plagiat dilakukan secara manual, yang 10

11 selain menyita banyak waktu, tingkat ketelitian dan objektivitasnya juga relatif, sistem deteksi plagiat menawarkan hasil yang sebaliknya. Terlepas dari apakah sistem yang dibangun sudah dapat mengenali jenis plagiat lain yang tidak hanya copy-paste. Semua itu perlu kerjasama untuk pengembangan lebih lanjut sehingga sistem deteksi plagiat dapat bekerja lebih canggih sesuai tuntutan permasalahan. Tahap perancangan memutuskan bagaimana sistem akan berjalan, dalam hal hardware, software, dan infrastruktur jaringan; user interface, form dan laporan; spesifik program, database, serta dokumen-dokumen yang akan dibutuhkan. Meskipun sebagian besar keputusan strategis tentang sistem telah dibuat pada saat pembangunan konsep sistem selama tahap analisis, langkah-langkah pada tahap perancangan menentukan bagaimana tepatnya sistem akan berjalan (Alan Dennis, dkk, 2009). Gambar 3. 1 Skema aliran data pada sistem Sistem deteksi plagiat secara umum dirancang untuk dapat mendeteksi kemiripan isi pada dokumen teks, yang dimungkinkan kemiripan ini adalah hasil plagiat. Inputan sistem diperoleh dari file/dokumen (dalam hal ini file berupa plain text) yang diupload oleh user. Dokumen yang diupload otomatis akan tersimpan dalam database sistem, kemudian dokumen dibaca untuk mendapatkan informasi berupa id file, judul, penulis, jumlah kata, dan ukuran file. Selanjutnya dokumen akan melewati tahap preprocessing menggunakan text mining sebelum dibandingkan dengan dokumen-dokumen yang ada pada database sistem. Tahap ini terdiri dari tokenizing (memecah kalimat ke dalam potongan kata sekaligus mengubah huruf dalam dokumen menjadi huruf kecil/lowercase), filtering (membuang stopword/ kata yang tidak deskriptif), dan stemming (mengembalikan setiap kata ke bentuk dasarnya). Setelah itu, dokumen hasil preprocess akan melewati tahap processing menggunakan algoritma Rabin Karp. Tahap ini adalah tahap pencocokan dokumen. Tahap ini terdiri dari parsing K-gram (memecah kata ke dalam potongan karakter sebanyak k), hashing (mengubah potongan karakter k ke dalam nilai hash), dan string matching (pencocokan string hasil hashing). 11

12 Hasil pencocokan string kemudian dihitung nilai similarity nya menggunakan Dice's Similarity Coefficient, yang kemudian nilai tersebut diubah ke dalam bentuk prosentase similarity. Gambar 3. 2 Arsitektur sistem 3.2 Perancangan Proses System input dokumen <<include>> cek originality <<include>> User laporan originality <<extend>> detail laporan Gambar 3. 3 Use case diagram 12

13 1. Use case deskripsi Nama Use Case Aktor Stakeholders dan Interests Deskripsi Singkat Trigger Relationships: Extend Normal Flow of Events User 1. Masuk ke halaman utama website 2. Memilih menu Cek Originality 4. Input data file 5. Klik tombol Submit 7. Klik Cek Originality 9. Klik pada prosentase similarity 11. Klik Download Alternate/exceptional Flows User 9a. Klik Upload File lain 11a-1. Klik Print 11a-3. Klik Lihat Teks Penuh Tabel 3. 1 Tabel Use case Input File User User ingin mengecek keaslian file dengan menginput file terlebih dahulu Use case ini mendeskripsikan bagaimana User dapat mengecek keaslian file yang diinputkan User mengunjungi website PDS Cek Originality, Laporan originality, Detail laporan System 3. Menampilkan halaman Upload File 6. Menyimpan file dan menampilkan halaman konfirmasi 8. Mengecek originality dan menampilkan laporan dalam bentuk prosentase similarity 10. Menampilkan laporan dalam bentuk detail similarity 12. Mengunduh file 11a-2. Mencetak file System 11a-4. Menampilkan teks sumber 13

14 PreProcess:preProcess ProcessMining:processMining ProcessRabin:processRabin PostProcess:postProcess : User 1 : inputfile(id_file, judul, penulis, namafile) 2 : bacafile() 3 : tampil info file, jmlkata, ukfile 4 : pilih cek originality 5 : tokenizing() 6 : filtering() 7 : stemming() 8 : parsingkgram() 9 : hashing() 10 : stringmatching() 11 : similarity() 12 : tampil lap similarity opt 13 : uploadfile 14 : tampil form upload file 15 : detailsimilarity() 16 : tampil detail similarity 17 : lihattekssumber() 18 : teks sumber 19 : downloadpdf() 20 : download Pdf 21 : cetak() 22 : cetak file Gambar 3. 4 Sequence diagram 3.3 Perhitungan Manual Berikut contoh perhitungan manual dalam pengecekan dua buah file. File 1 : Dokumen akan dilakukan pengecekan kemiripan. File 2 : Mengecek kemiripan dokumen. Hasil tokenizing, filtering, dan stemming : File 1 : dokumenlakuecekmirip File 2 : ecekmiripdokumen 14

15 Tabel 3. 2 Hasil parsing k-gram No Parsing File 1 Hash Parsing File 2 Hash 1 doku ecek 2 okum cekm 3 kume ekmi 4 umen kmir 5 menl miri 6 enla irip 7 nlak ripd 8 laku ipdo 9 akue pdok 10 kuec doku 11 uece okum 12 ecek kume 13 cekm umen 14 ekmi 15 kmir 16 miri 17 irip Ket. : K-gram = 4 Modulo = 101 Berikut adalah penghitungan nilai hash : doku = (100*10 3 ) + (111*10 2 ) + (111*10 1 ) + (111*10 0 ) = 100, , , = 112,287 Mod = 112,287 mod 101 =76 Rem = 112,287 / 101 = okum = (111*10 3 ) + (107*10 2 ) + (117*10 1 ) + (109*10 0 ) = 111, , , = 122,979 Mod = 122,979 mod 101 = 62 Rem = 122,979 / 101 = Perhitungan ini dilakukan untuk seluruh parsing file 1 dan file 2, sehingga menghasilkan hashing modulo dan remainder untuk seluruh substring. Kemudian nilainilai tersebut akan dicocokkan menggunakan string matching dan dilakukan pembobotan menggunakan Dice's Similarity Coefficient. 15

16 Tabel 3. 3 Hasil penghitungan modulo dan remainder (hasil bagi) File 1 File 2 No Parsing Hashmod Remainder Parsing Hashmod Remainder Match 1 doku , ecek ,07921 no 10 doku , doku ,75248 yes 11 okum , okum ,61386 yes 12 kume , kume ,0396 yes 13 umen , umen ,42574 yes 14 ecek , ecek ,07921 yes 15 cekm , cekm ,87129 yes 16 ekmi , ekmi ,77228 yes 17 kmir , kmir ,85149 yes 18 miri ,49505 miri ,49505 yes 19 irip , irip ,9802 yes Similarity = ((10*2) / (17+13)) * 100% = (20 / 30) * 100% = 2/3 * 100% = 66.67% 4. Hasil Penelitian dan Pembahasan 4.1 Hasil uji berdasarkan banyaknya konten file Tabel 4.1 berikut adalah informasi file yang akan digunakan untuk pengujian pada tabel 4.2 dan tabel 4.3. File uji terdiri dari empat buah file yang masing-masing telah dilakukan penghapusan sebanyak 15%. Tabel 4. 1 Informasi file uji No Id Nama Kata Ukuran (byte) _File_uji_14_kata.txt _File_uji_28_kata.txt _File_uji_42_kata.txt _File_uji_56_kata.txt Tabel 4. 2 Hasil uji berdasarkan banyaknya konten file No Uji File 1 File 2 Similarity (%) Waktu (s) _File_uji_14_kata.txt 10_File_uji_14_kata.txt _File_uji_28_kata.txt 10_File_uji_14_kata.txt _File_uji_42_kata.txt 11_File_uji_14_kata.txt _File_uji_56_kata.txt 12_File_uji_14_kata.txt Dari tabel 4.2 diatas dapat diketahui bahwa semakin banyak konten file, maka semakin lama waktu proses. 16

17 4.2 Hasil uji tanpa menggunakan stemming Tabel 4. 3 Hasil uji tanpa mengunakan stemming No Uji File 1 File 2 Similarity (%) Waktu (s) _File_uji_14_kata.txt 10_File_uji_14_kata.txt _File_uji_28_kata.txt 10_File_uji_14_kata.txt _File_uji_42_kata.txt 11_File_uji_14_kata.txt _File_uji_56_kata.txt 12_File_uji_14_kata.txt Dari tabel 4.3 diatas dapat diketahui bahwa tanpa menggunakan stemming akan mempercepat waktu proses, tetapi akurasi yang similarity nya rendah. 4.3 Hasil uji modulo pada algoritma Rabin-Karp tabel 4.1. File yang digunakan untuk pengujian modulo dan k-gram adalah file 1 dan 2 pada Tabel 4. 4 Hasil uji modulo No Uji Kgram Modulo Similarity (%) Waktu (s) Berdasarkan tebel 4.4 diatas dapat disimpulkan bahwa modulo tidak berpengaruh pada prosentase similarity, tapi berpengaruh pada waktu proses. 4.4 Hasil uji k-gram pada algoritma Rabin-Karp Tabel 4. 5 Hasil uji k-gram No Uji Kgram Modulo Similarity (%) Waktu (s) Berdasarkan tabel 4.5 dapat diketahui bahwa semakin kecil k-gram, akurasi similarity nya semakin tinggi. 17

18 5. Kesimpulan dan Saran 5.1 Kesimpulan Berdasarkan percobaan-percobaan yang telah dilakukan, dapat ditarik kesimpulan sebagai berikut: 1. Sistem dalam membandingkan file memberikan hasil berupa prosentase similarity. 2. Berikut faktor yang mempengaruhi performa algoritma Rabin Karp : a. Semakin banyak konten sebuah file, waktu prosesnya (running time) akan semakin lama. b. Penggunaan stemming berpengaruh pada keakuratan nilai similarity dan waktu proses. Dengan menggunakan stemming waktu proses cenderung lebih lama, tetapi tingkat akurasi similaritynya lebih tinggi. c. Nilai modulo berpengaruh pada waktu proses, tetapi tidak pada nilai similarity. d. Semakin kecil k-gram menghasilkan akurasi nilai similarity yang lebih baik, dibandingkan k-gram yang lebih besar. 5.2 Saran Berikut saran-saran untuk penelitian lebih lanjut: 1. Sistem dapat membandingkan file uji dengan semua file sumber pada database sistem. 2. Jika masih menggunakan algoritma Rabin-Karp, lebih dibenahi pada tahap stemming agar hasil pencocokannya lebih akurat. 3. Sistem dapat mengkonversi dokumen teks dengan ekstensi lain seperti.doc dan.pdf, untuk kemudahan pengguna. 4. Sistem diharapkan dapat mendeteksi sinonim dan berbagai bentuk plagiat. 18

19 Daftar Pustaka Atmopawiro, Alsasian Pengkajian dan Analisis Tiga Algoritma Efisien Rabin-Karp, Knuth-Morris-Pratt, dan Boyer-Moore dalam Pencarian Pola dalam Suatu Teks. Makalah tidak Terpublikasi. Program Studi Teknik Informatika Institut Teknologi Bandung. Cormen, Thomas H, Charles E. Leiserson, Ronald L. Rivest, Clifford Stein Introduction to Algorithms. MIT Press, USA. Dennis, Alan. Haley, Barbara Wixom, David Tegarden System Analysis Design UML Version 2.0 An Object-Oriented Approach Third Edition. John Wiley & Sons, Inc. USA. Feldman, Ronen, James Sanger The Text Mining Handbook. Cambridge University Press. Gipp, Bela, Norman Meuschke Citation Pattern Matching Algorithms for Citationbased Plagiarism Detection: Greedy Citation Tiling, Citation Chunking and Longest Common Citation Sequence. Proceeding of the 11 th ACM Symposium on Document Engineering. Mountain View, CA, USA. Information Retrieval Tutorial : Stemming Porter untuk Bahasa Indonesia. diakses Selasa, 3 juli 2012 jam wib. KBBI 1997, 775. Kosinov, Serhiy Evaluation of n-grams conflation approach in text-based information retrieval. Unpublished journal. Computing Science Department, University of Alberta, Canada. Lecroq. Thierry, Christian Charras Handbook of Exact String-Matching Algoritms. didownload Sabtu, 19 Mei 2012 jam wib Lukashenko, Romans, Vita Graudina, Janis Grundspenkis Computer-Based Plagiarism Detection Methods and Tools: An Overview. International Conference on Computer Systems and Technologies CompSysTech 07. Mooney, Raymond J CS 391L: Machine Learning Text Categorization. Lecture slides. University of Texas at Austin. Munir, Rinaldi Bahan Kuliah IF2251 Strategi Algoritmik : Algoritma Pencarian String (String Matching). Departemen Teknik Informatika. ITB Bandung. Rabin Karp Matching. personal/ personalpages/ shomper/ cs3410_web/ resources/ rabin_karp_matching.ppt diakses Senin, 5 November 2012 jam wib. 19

20 Similarity Measure. diakses Kamis, 7 Maret 2013 jam wib. Singh, Rajender Chillar, Barjesh Kochar RB-Matcher: String Matching Technique. World Academy of Science, Engineering and Technology 42. Stein, Benno, Sven Meyer zu Eissen Selected Papers from the 29th Annual Conference of the German Classification Society (GfKl) Magdeburg: Near Similarity Search and Plagiarism Analysis. ISBN , pp , c Springer Triawati, Candra Metode Pembobotan Statistical Concept Based untuk Klastering dan Kategorisasi Dokumen Berbahasa Indonesia. IT TELKOM Bandung. Zaka, Bilal Theory and Applications of Similarity Detection Technique. Disertation. Institute for Information Systems and Computer Media (IISCM), Graz University of Technology Austria. 20

Implementasi Algoritma Rabin Karp untuk Pendeteksian Plagiat Dokumen Teks Menggunakan Konsep Similarity

Implementasi Algoritma Rabin Karp untuk Pendeteksian Plagiat Dokumen Teks Menggunakan Konsep Similarity Implementasi Algoritma Rabin Karp untuk Pendeteksian Plagiat Dokumen Teks Menggunakan Konsep Similarity Salmuasih Teknik Informatika STMIK AMIKOM Yogyakarta Yogyakarta, Indonesia email: sal_252@yahoo.com

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada bab ini, akan dibahas landasan teori mengenai pendeteksian kemiripan dokumen teks yang mengkhususkan pada pengertian dari keaslian dokumen, plagiarisme, kemiripan dokumen, dan

Lebih terperinci

APLIKASI PENDETEKSI KEMIRIPANPADA DOKUMEN MENGGUNAKAN ALGORITMA RABIN KARP

APLIKASI PENDETEKSI KEMIRIPANPADA DOKUMEN MENGGUNAKAN ALGORITMA RABIN KARP APLIKASI PENDETEKSI KEMIRIPANPADA DOKUMEN MENGGUNAKAN ALGORITMA RABIN KARP Inta Widiastuti 1, Cahya Rahmad 2, Yuri Ariyanto 3 1,2 Jurusan Elektro, Program Studi Teknik Informatika, Politeknik Negeri Malang

Lebih terperinci

PERBANDINGAN PENGUNAAN STEMMING PADA DETEKSI KEMIRIPAN DOKUMEN MENGGUNAKAN METODE RABIN KARP DAN JACCARD SIMILARITY

PERBANDINGAN PENGUNAAN STEMMING PADA DETEKSI KEMIRIPAN DOKUMEN MENGGUNAKAN METODE RABIN KARP DAN JACCARD SIMILARITY PERBANDINGAN PENGUNAAN STEMMING PADA DETEKSI KEMIRIPAN DOKUMEN MENGGUNAKAN METODE RABIN KARP DAN JACCARD SIMILARITY Adji Sukmana 1), Kusrini 2), Andi Sunyoto 3) 1,2,3) Magister Teknik Informatika, Universitas

Lebih terperinci

IMPLEMENTASI ALGORITMA RABIN KARP DAN STEMMING NAJIEF ANDRIANI UNTUK DETEKSI PLAGIARISME DOKUMEN

IMPLEMENTASI ALGORITMA RABIN KARP DAN STEMMING NAJIEF ANDRIANI UNTUK DETEKSI PLAGIARISME DOKUMEN SWABUMI, Vol.5 Maret 207, pp. 84-89 ISSN : 2355-990X E-ISSN : 2549-578 IMPLEMENTASI ALGORITMA RABIN KARP DAN STEMMING NAJIEF ANDRIANI UNTUK DETEKSI PLAGIARISME DOKUMEN Satia Suhada, Saeful Bahri 2 STMIK

Lebih terperinci

PERANCANGAN APLIKASI PENCARIAN ISI FILE YANG SAMA PADA HARDISK DRIVE DENGAN ALGORITMA STRING MATCHING

PERANCANGAN APLIKASI PENCARIAN ISI FILE YANG SAMA PADA HARDISK DRIVE DENGAN ALGORITMA STRING MATCHING Jurnal INFOTEK, Vol 1, No 1, Februari 2016 ISSN 2502-6968 (Media Cetak) PERANCANGAN APLIKASI PENCARIAN ISI FILE YANG SAMA PADA HARDISK DRIVE DENGAN ALGORITMA STRING MATCHING Bobby Anggara Mahasiswa Program

Lebih terperinci

BAB I PENDAHULUAN. berinovasi menciptakan suatu karya yang original. Dalam hal ini tindakan negatif

BAB I PENDAHULUAN. berinovasi menciptakan suatu karya yang original. Dalam hal ini tindakan negatif 1 BAB I PENDAHULUAN I.1 Latar Belakang Pada dasarnya manusia menginginkan kemudahan Dalam segala hal. Sifat tersebut akan memicu tindakan negatif apabila dilatarbelakangi oleh motivasi untuk berbuat curang

Lebih terperinci

PERBANDINGAN PENDEKATAN DETEKSI PLAGIARISM DOKUMEN DALAM BAHASA INGGRIS. ABSTRAK

PERBANDINGAN PENDEKATAN DETEKSI PLAGIARISM DOKUMEN DALAM BAHASA INGGRIS. ABSTRAK PERBANDINGAN PENDEKATAN DETEKSI PLAGIARISM DOKUMEN DALAM BAHASA INGGRIS 1 Ana Kurniawati 2 I Wayan Simri Wicaksana 1,2 Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Gunadarma ({ana,iwayan}@staff.gunadarma.ac.id)

Lebih terperinci

APLIKASI PENDETEKSI PLAGIARISME TUGAS DAN MAKALAH PADA SEKOLAH MENGGUNAKAN ALGORITMA RABIN KARP

APLIKASI PENDETEKSI PLAGIARISME TUGAS DAN MAKALAH PADA SEKOLAH MENGGUNAKAN ALGORITMA RABIN KARP Versi Online: https://journal.ubm.ac.id/index.php/alu Vol.I (No. 1 ) : 12-17. Th. 2018 ISSN: 2620-620X APLIKASI PENDETEKSI PLAGIARISME TUGAS DAN MAKALAH PADA SEKOLAH MENGGUNAKAN ALGORITMA RABIN KARP Plagiarisme

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Algoritma Rabin-Karp Algoritma Rabin-Karp adalah suatu algoritma pencarian string yang diciptakan Michael O. Rabin dan Richard M. Karp pada tahun 1987 yang menggunakan fungsi

Lebih terperinci

Jurnal Coding, Sistem Komputer Untan Volume 04, No.1 (2016), hal ISSN : x

Jurnal Coding, Sistem Komputer Untan Volume 04, No.1 (2016), hal ISSN : x APLIKASI PENDETEKSI PLAGIAT TERHADAP KARYA TULIS BERBASIS WEB MENGGUNAKAN NATURAL LANGUAGE PROCESSING DAN ALGORITMA KNUTH-MORRIS-PRATT [1] Rio Alamanda, [2] Cucu Suhery, [3] Yulrio Brianorman [1][2][3]

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang 1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Plagiarisme atau sering disebut plagiat adalah penjiplakan atau pengambilan karangan, pendapat, dan sebagainya dari orang lain dan menjadikannya seolah-olah karangan

Lebih terperinci

BAB I PENDAHULUAN. yang cepat sangat berpengaruh terhadap gaya hidup manusia. Pertukaran

BAB I PENDAHULUAN. yang cepat sangat berpengaruh terhadap gaya hidup manusia. Pertukaran BAB I PENDAHULUAN 1.1 Latar Belakang Dewasa ini, perkembangan teknologi yang pesat dan penyebaran internet yang cepat sangat berpengaruh terhadap gaya hidup manusia. Pertukaran informasi antara satu pihak

Lebih terperinci

PENERAPAN ALGORITMA STEMMING NAZIEF & ADRIANI DAN SIMILARITY PADA PENERIMAAN JUDUL THESIS

PENERAPAN ALGORITMA STEMMING NAZIEF & ADRIANI DAN SIMILARITY PADA PENERIMAAN JUDUL THESIS PENERAPAN ALGORITMA STEMMING NAZIEF & ADRIANI DAN SIMILARITY PADA PENERIMAAN JUDUL THESIS Hafiz Ridha Pramudita Magister Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman,

Lebih terperinci

IMPLEMENTASI ALGORITMA RABIN KARP UNTUK REKOMENDASI JUDUL BERITA INDONESIA TUGAS AKHIR

IMPLEMENTASI ALGORITMA RABIN KARP UNTUK REKOMENDASI JUDUL BERITA INDONESIA TUGAS AKHIR IMPLEMENTASI ALGORITMA RABIN KARP UNTUK REKOMENDASI JUDUL BERITA INDONESIA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: Adika

Lebih terperinci

DETEKSI PLAGIARISME DENGAN ALGORITMA RABIN KARP DAN ALGORITMA KLASTERISASI SUFFIX TREE PADA TEKS DOKUMEN TUGAS AKHIR

DETEKSI PLAGIARISME DENGAN ALGORITMA RABIN KARP DAN ALGORITMA KLASTERISASI SUFFIX TREE PADA TEKS DOKUMEN TUGAS AKHIR DETEKSI PLAGIARISME DENGAN ALGORITMA RABIN KARP DAN ALGORITMA KLASTERISASI SUFFIX TREE PADA TEKS DOKUMEN TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas

Lebih terperinci

APLIKASI STATISTIK PENDETEKSIAN PLAGIARISME DOKUMENT TEXT DENGAN ALGORITMA RABIN KARP

APLIKASI STATISTIK PENDETEKSIAN PLAGIARISME DOKUMENT TEXT DENGAN ALGORITMA RABIN KARP APLIKASI STATISTIK PENDETEKSIAN PLAGIARISME DOKUMENT TEXT DENGAN ALGORITMA RABIN KARP Dedi Leman 1, Gunadi Widi Nurcahyo 2, Sarjon Defit 3 Teknik Informasi, Magister Komputer, Universitas Putra Indonesia

Lebih terperinci

ANALISIS K-GRAM, BASIS DAN MODULO RABIN-KARP SEBAGAI PENENTU AKURASI PERSENTASE KEMIRIPAN DOKUMEN

ANALISIS K-GRAM, BASIS DAN MODULO RABIN-KARP SEBAGAI PENENTU AKURASI PERSENTASE KEMIRIPAN DOKUMEN ANALISIS K-GRAM, BASIS DAN MODULO RABIN-KARP SEBAGAI PENENTU AKURASI PERSENTASE KEMIRIPAN DOKUMEN Andysah Putera Utama Siahaan 1, Sugianto 2 1 Fakultas Ilmu Komputer, Universitas Pembangunan Panca Budi,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kemajuan teknologi informasi dan komunikasi tidak hanya membawa dampak positif, tetapi juga membawa dampak negatif, salah satunya adalah tindakan plagiarisme (Kharisman,

Lebih terperinci

DETEKSI KEMIRIPAN DOKUMEN TEKS MENGGUNAKAN ALGORITMA MANBER SKRIPSI IQBAL MAULANA DJAFAR

DETEKSI KEMIRIPAN DOKUMEN TEKS MENGGUNAKAN ALGORITMA MANBER SKRIPSI IQBAL MAULANA DJAFAR DETEKSI KEMIRIPAN DOKUMEN TEKS MENGGUNAKAN ALGORITMA MANBER SKRIPSI IQBAL MAULANA DJAFAR 091402012 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA

Lebih terperinci

DETEKSI PLAGIAT DOKUMEN MENGGUNAKAN ALGORITMA RABIN-KARP

DETEKSI PLAGIAT DOKUMEN MENGGUNAKAN ALGORITMA RABIN-KARP DETEKSI PLAGIAT DOKUMEN MENGGUNAKAN ALGORITMA RABIN-KARP Hari Bagus Firdaus Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10, Bandung

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka

Lebih terperinci

Jurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017

Jurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017 TEXT MINING DALAM PENENTUAN KLASIFIKASI DOKUMEN SKRIPSI DI PRODI TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER BERBASIS WEB Teuku Muhammad Johan dan Riyadhul Fajri Program Studi Teknik Informatika Fakultas

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

ANALISIS PENGUKURAN SELF PLAGIARISM MENGGUNAKAN ALGORITMA RABIN-KARP DAN JARO-WINKLER DISTANCE DENGAN STEMMING TALA

ANALISIS PENGUKURAN SELF PLAGIARISM MENGGUNAKAN ALGORITMA RABIN-KARP DAN JARO-WINKLER DISTANCE DENGAN STEMMING TALA ANALISIS PENGUKURAN SELF PLAGIARISM MENGGUNAKAN ALGORITMA RABIN-KARP DAN JARO-WINKLER DISTANCE DENGAN STEMMING TALA Jayanta 1), Halim Mahfud 2), Titin Pramiyati 3) 1), 3) Fakultas Ilmu Komputer UPN Veteran

Lebih terperinci

Analsis dan Implementasi Algoritma Winnowing dengan Synonym Recognition pada Deteksi Plagiarisme untuk Dokumen Teks Berbahasa Indonesia

Analsis dan Implementasi Algoritma Winnowing dengan Synonym Recognition pada Deteksi Plagiarisme untuk Dokumen Teks Berbahasa Indonesia Analsis dan Implementasi Algoritma Winnowing dengan Synonym Recognition pada Deteksi Plagiarisme untuk Dokumen Teks Berbahasa Indonesia Jody 1, Agung Toto Wibowo 2, Anditya Arifianto 3 1.2.3 Teknik Informatika,

Lebih terperinci

SISTEM DETEKSI KEMIRIPAN JUDUL SKRIPSI PRODI TEKNIK INFORMATIKA MENGGUNAKAN ALGORITMA RABIN-KARP

SISTEM DETEKSI KEMIRIPAN JUDUL SKRIPSI PRODI TEKNIK INFORMATIKA MENGGUNAKAN ALGORITMA RABIN-KARP SISTEM DETEKSI KEMIRIPAN JUDUL SKRIPSI PRODI TEKNIK INFORMATIKA MENGGUNAKAN ALGORITMA RABIN-KARP SKRIPSI Diajukan Untuk Memenuhi Salah Satu Syarat Guna Memperoleh Gelar Sarjana Komputer (S.Kom) Pada Progam

Lebih terperinci

BAB 2 LANDASAN TEORI. 2.1 Pengertian Text Mining

BAB 2 LANDASAN TEORI. 2.1 Pengertian Text Mining 13 BAB 2 LANDASAN TEORI 2.1 Pengertian Text Mining Text Mining dapat juga diartikan sebagai penambangan data berupa teks yang bersumber dari dokumen untuk mencari karta-kata yang merupakan perwakilan isi

Lebih terperinci

UKDW. Bab 1 PENDAHULUAN

UKDW. Bab 1 PENDAHULUAN Bab 1 PENDAHULUAN 1.1. Latar Belakang Masalah Pada dasarnya manusia menginginkan kemudahan dalam segala hal. Sifat tersebut akan memicu tindakan negatif apabila dilatar belakangi oleh motivasi untuk berbuat

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang

Lebih terperinci

IMPLEMENTASI METODE STRING MATCHING UNTUK APLIKASI PENGARSIPAN DOKUMEN (STUDI KASUS : SMPN 3 SUMBER KAB. CIREBON)

IMPLEMENTASI METODE STRING MATCHING UNTUK APLIKASI PENGARSIPAN DOKUMEN (STUDI KASUS : SMPN 3 SUMBER KAB. CIREBON) JURNAL DIGIT, Vol. 7 No.1 Mei 2017, pp. 50~61 50 IMPLEMENTASI METODE STRING MATCHING UNTUK APLIKASI PENGARSIPAN DOKUMEN (STUDI KASUS : SMPN 3 SUMBER KAB. CIREBON) Ida Mulyawati 1, Ridho Taufiq Subagio

Lebih terperinci

BAB I PENDAHULUAN. penjiplakan suatu tulisan. Neville (2010) dalam buku The Complete Guide to

BAB I PENDAHULUAN. penjiplakan suatu tulisan. Neville (2010) dalam buku The Complete Guide to BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi dari tahun ke tahun selalu berkembang secara signifikan. Jumlah pengguna internet yang besar dan semakin berkembang mempunyai pengaruh

Lebih terperinci

KLASTERISASI DOKUMEN ARTIKEL ILMIAH MENGGUNAKAN ALGORITMA SINGLE PASS CLUSTERING DENGAN DETEKSI KESAMAAN KATA TUGAS AKHIR

KLASTERISASI DOKUMEN ARTIKEL ILMIAH MENGGUNAKAN ALGORITMA SINGLE PASS CLUSTERING DENGAN DETEKSI KESAMAAN KATA TUGAS AKHIR KLASTERISASI DOKUMEN ARTIKEL ILMIAH MENGGUNAKAN ALGORITMA SINGLE PASS CLUSTERING DENGAN DETEKSI KESAMAAN KATA TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika

Lebih terperinci

APLIKASI PENERJEMAH KALIMAT BAHASA INDONESIA KE BAHASA SIMALUNGUN DENGAN ALGORITMA BERRY - RAVINDRAN

APLIKASI PENERJEMAH KALIMAT BAHASA INDONESIA KE BAHASA SIMALUNGUN DENGAN ALGORITMA BERRY - RAVINDRAN APLIKASI PENERJEMAH KALIMAT BAHASA INDONESIA KE BAHASA SIMALUNGUN DENGAN ALGORITMA BERRY - RAVINDRAN Saut Dohot Siregar 1*, Mawaddah Harahap 2, Yohana Marbun 3 1,2,3 Program Studi Teknik Informatika, Fakultas

Lebih terperinci

Implementasi Algoritma Jaro-Winkler Distance Untuk Sistem Pendeteksi Plagiarisme Pada Dokumen Skripsi

Implementasi Algoritma Jaro-Winkler Distance Untuk Sistem Pendeteksi Plagiarisme Pada Dokumen Skripsi Implementasi Algoritma Jaro-Winkler Distance Untuk Sistem Pendeteksi Plagiarisme Pada Dokumen Skripsi Panji Novantara* 1, Opin Pasruli 2 1,2 Fakultas Ilmu Komputer Universitas Kuningan * 1 panji@uniku.ac.id,

Lebih terperinci

Deteksi Plagiarisme Gambar menggunakan Algoritma Pencocokan Pola Rabin-Karp

Deteksi Plagiarisme Gambar menggunakan Algoritma Pencocokan Pola Rabin-Karp Deteksi Plagiarisme Gambar menggunakan Algoritma Pencocokan Pola Rabin-Karp Fadhil Imam Kurnia - 13515146 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,

Lebih terperinci

STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER

STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER Dony Yudha Lestiyanto, A12.2009.03537 Sistem Informasi S1 Universitas Dian Nuswantoro Semarang 2014 Abstrak Stemming

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

IMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI TINGKAT KEMIRIPAN FILE TEKS YANG BERBENTUK SKRIPSI SKRIPSI

IMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI TINGKAT KEMIRIPAN FILE TEKS YANG BERBENTUK SKRIPSI SKRIPSI IMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI TINGKAT KEMIRIPAN FILE TEKS YANG BERBENTUK SKRIPSI SKRIPSI WINDI ARINDA 091401061 PROGRAM STUDI S1 ILMU KOMPUTER

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

PENDETEKSIAN PLAGIASI DENGAN SISTEM PENGUKURAN SIMILARITAS PADA DOKUMEN KARYA ILMIAH MENGGUNAKAN STRING MATCHING ALGORITMA RABIN-KARP

PENDETEKSIAN PLAGIASI DENGAN SISTEM PENGUKURAN SIMILARITAS PADA DOKUMEN KARYA ILMIAH MENGGUNAKAN STRING MATCHING ALGORITMA RABIN-KARP PENDETEKSIAN PLAGIASI DENGAN SISTEM PENGUKURAN SIMILARITAS PADA DOKUMEN KARYA ILMIAH MENGGUNAKAN STRING MATCHING ALGORITMA RABIN-KARP JUNAIDI NOH, ST, MT Dosen Program Study Teknik Informatika UMMU Ternate

Lebih terperinci

Perbandingan dan Pengujian Beberapa Algoritma Pencocokan String

Perbandingan dan Pengujian Beberapa Algoritma Pencocokan String Perbandingan dan Pengujian Beberapa Algoritma Pencocokan String Hary Fernando Program Studi Teknik Informatika Institut Teknologi Bandung Jln. Ganesha No.10 Bandung, e-mail: hary@hary.web.id ABSTRAK Pencocokan

Lebih terperinci

Kombinasi Algoritma Pattern Matching dan BFS-DFS pada aplikasi Music Discovery

Kombinasi Algoritma Pattern Matching dan BFS-DFS pada aplikasi Music Discovery Kombinasi Algoritma Pattern Matching dan BFS-DFS pada aplikasi Music Discovery Disusun Oleh : Levanji Prahyudy / 13513052 Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung Kombinasi Algoritma

Lebih terperinci

SINONIM DAN WORD SENSE DISAMBIGUATION UNTUK MELENGKAPI DETEKTOR PLAGIAT DOKUMEN TUGAS AKHIR. Devi Dwi Purwanto

SINONIM DAN WORD SENSE DISAMBIGUATION UNTUK MELENGKAPI DETEKTOR PLAGIAT DOKUMEN TUGAS AKHIR. Devi Dwi Purwanto SINONIM DAN WORD SENSE DISAMBIGUATION UNTUK MELENGKAPI DETEKTOR PLAGIAT DOKUMEN TUGAS AKHIR Devi Dwi Purwanto Sistem Informasi Sekolah Tinggi Teknik Surabaya E-mail: devi@stts.edu Abstract Plagiarism can

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

BAB I PENDAHULUAN. Jiménez-Peris, dkk dalam paper-nya yang berjudul New Technologies in

BAB I PENDAHULUAN. Jiménez-Peris, dkk dalam paper-nya yang berjudul New Technologies in BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan Teknologi dan Informasi telah berkembang sedemikian hebatnya. Kemajuan di bidang komputer dan internet khususnya, semakin mempercepat terjadinya perubahan

Lebih terperinci

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha ABSTRAK Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian atau penemuan kembali informasi yang relevan terhadap kebutuhan pengguna. Kebutuhan pengguna, diekspresikan

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Permasalahan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Permasalahan BAB 1 PENDAHULUAN 1.1 Latar Belakang Permasalahan Teknik Struktur Data dan Data Mining merupakan salah satu ilmu komputer yang penting dan menarik perhatian teori informatika. Saat ini teknik ini sudah

Lebih terperinci

Penerapan Algoritma Jaro-Winkler Distance untuk Sistem Pendeteksi Plagiarisme pada Dokumen Teks Berbahasa Indonesia

Penerapan Algoritma Jaro-Winkler Distance untuk Sistem Pendeteksi Plagiarisme pada Dokumen Teks Berbahasa Indonesia 62 Penerapan Algoritma Jaro-Winkler Distance untuk Sistem Pendeteksi Plagiarisme pada Dokumen Teks Berbahasa Indonesia Ahmad Kornain* 1, Ferry Yansen 2, Tinaliah 3 1,2,3 STMIK Global Informatika MDP Jl.

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

IMPLEMENTASI n-gram TECHNIQUE DALAM DETEKSI PLAGIARISME PADA TUGAS MAHASISWA

IMPLEMENTASI n-gram TECHNIQUE DALAM DETEKSI PLAGIARISME PADA TUGAS MAHASISWA IMPLEMENTASI n-gram TECHNIQUE DALAM DETEKSI PLAGIARISME PADA TUGAS MAHASISWA Erick Alfons Lisangan Program Studi Teknik Informatika, Fakultas Teknologi Informasi, Universitas Atma Jaya Makassar Alamat

Lebih terperinci

BAB I PENDAHULUAN I.1. Latar Belakang [1] [2] [3] [4] [5]

BAB I PENDAHULUAN I.1. Latar Belakang [1] [2] [3] [4] [5] BAB I PENDAHULUAN I.1. Latar Belakang Algoritma adalah prosedur komputasi yang terdefinisi dengan baik yang menggunakan beberapa nilai sebagai masukan dan menghasilkan beberapa nilai yang disebut keluaran.

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang 1 BAB I PENDAHULUAN 1.1. Latar Belakang Perkembangan dunia IT (Information Technology) dengan hadirnya mesin pencarian (Search Engine) di dalam sistem komputer yang merupakan salah satu fasilitas internet

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

PENGEMBANGAN APLIKASI PENDETEKSI PLAGIARISME PADA DOKUMEN TEKS MENGGUNAKAN ALGORITMA RABIN-KARP. Oleh

PENGEMBANGAN APLIKASI PENDETEKSI PLAGIARISME PADA DOKUMEN TEKS MENGGUNAKAN ALGORITMA RABIN-KARP. Oleh PENGEMBANGAN APLIKASI PENDETEKSI PLAGIARISME PADA DOKUMEN TEKS MENGGUNAKAN ALGORITMA RABIN-KARP Oleh Kadek Versi Yana Yoga,0815051046 Jurusan Pendidikan Teknik Informatika Fakultas Teknik dan Kejuruan

Lebih terperinci

SISTEM PENDETEKSIAN KEMIRIPAN JUDUL SKRIPSI MENGGUNAKAN ALGORITMA WINNOWING

SISTEM PENDETEKSIAN KEMIRIPAN JUDUL SKRIPSI MENGGUNAKAN ALGORITMA WINNOWING SISTEM PENDETEKSIAN KEMIRIPAN JUDUL SKRIPSI MENGGUNAKAN ALGORITMA WINNOWING Nurdin1, Amin Munthoha1 Prodi Teknik Informatika Fakultas Teknik Universitas Malikussaleh Jalan Cot Teungku Nie Reuleut Kecamatan

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Text Mining Text mining, yang juga disebut sebagai Teks Data Mining (TDM) atau Knowledge Discovery in Text (KDT), secara umum mengacu pada proses ekstraksi informasi dari dokumen-dokumen

Lebih terperinci

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM : PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI Oleh : SEPTIAN BAGUS WAHYONO NPM : 0734010126 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS

Lebih terperinci

TECHNICAL REPORT PENGGUNAAN ALGORITMA PENCOCOKAN STRING BOYER-MOORE DALAM MENDETEKSI PENGAKSESAN SITUS INTERNET TERLARANG

TECHNICAL REPORT PENGGUNAAN ALGORITMA PENCOCOKAN STRING BOYER-MOORE DALAM MENDETEKSI PENGAKSESAN SITUS INTERNET TERLARANG TECHNICAL REPORT PENGGUNAAN ALGORITMA PENCOCOKAN STRING BOYER-MOORE DALAM MENDETEKSI PENGAKSESAN SITUS INTERNET TERLARANG Ario Yudo Husodo Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung

Lebih terperinci

ARSITEKTUR UNTUK APLIKASI DETEKSI KESAMAAN DOKUMEN BAHASA INDONESIA

ARSITEKTUR UNTUK APLIKASI DETEKSI KESAMAAN DOKUMEN BAHASA INDONESIA No Makalah : 073 ARSITEKTUR UNTUK APLIKASI DETEKSI KESAMAAN DOKUMEN BAHASA INDONESIA Anna Kurniawati 1, Kemal Ade Sekarwati 2, I wayan Simri Wicaksana 3 Jurusan Sistem Informasi Fakultas Ilmu komputer

Lebih terperinci

Pencarian File Teks Berbasis Content dengan Pencocokan String Menggunakan Algoritma Brute force

Pencarian File Teks Berbasis Content dengan Pencocokan String Menggunakan Algoritma Brute force Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Pencarian File Teks Berbasis Content dengan Pencocokan String Menggunakan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Perpustakaan merupakan faktor penting di dalam penunjang transformasi antara sumber ilmu (koleksi) dengan pencari ilmu (pengunjung). Perpustakaan juga sering disebut

Lebih terperinci

ANALISIS STRING MATCHING PADA JUDUL SKRIPSI DENGAN ALGORITMA KNUTH-MORRIS PRATT (KMP)

ANALISIS STRING MATCHING PADA JUDUL SKRIPSI DENGAN ALGORITMA KNUTH-MORRIS PRATT (KMP) ANALISIS STRING MATCHING PADA JUDUL SKRIPSI DENGAN ALGORITMA KNUTH-MORRIS PRATT (KMP) Wistiani Astuti whistieruslank@gmail.com Teknik Informatika, Universitas Muslim Indonesia Abstrak Skripsi adalah suatu

Lebih terperinci

IMPLEMENTASI ALGORITMA WINNOWING DAN PORTER STEMMER MENDETEKSI KEMIRIPAN DUA DOKUMEN BERBASIS WEB SKRIPSI LIDIA ARTA FERARI

IMPLEMENTASI ALGORITMA WINNOWING DAN PORTER STEMMER MENDETEKSI KEMIRIPAN DUA DOKUMEN BERBASIS WEB SKRIPSI LIDIA ARTA FERARI IMPLEMENTASI ALGORITMA WINNOWING DAN PORTER STEMMER MENDETEKSI KEMIRIPAN DUA DOKUMEN BERBASIS WEB SKRIPSI LIDIA ARTA FERARI 081401077 PROGRAM STUDI S1 ILMU KOMPUTER DEPARTEMEN ILMU KOMPUTER FAKULTAS ILMU

Lebih terperinci

Jurnal Informatika dan Komputer PENS

Jurnal Informatika dan Komputer PENS Jurnal Informatika dan Komputer PENS www.jurnalpa.eepis-its.edu Teknik Komputer Vol.2, No.2, 2015 Politeknik Elektronika Negeri Surabaya Aplikasi Pendeteksi Kemiripan Laporan Menggunakan Text Mining dan

Lebih terperinci

Analisis Perbandingan Performansi Algoritma Zhu-Takaoka dan Algoritma Karp-Rabin Pada Pencarian Kata Di Rumah Baca Buku Sunda

Analisis Perbandingan Performansi Algoritma Zhu-Takaoka dan Algoritma Karp-Rabin Pada Pencarian Kata Di Rumah Baca Buku Sunda Analisis Perbandingan Performansi Algoritma Zhu-Takaoka dan Algoritma Karp-Rabin Pada Pencarian Kata Di Rumah Baca Buku Sunda LATAR BELAKANG RUMAH BACA BUKU SUNDA BANYAKNYA Buku Banyaknya Algoritma 35

Lebih terperinci

BAB IV HASIL DAN UJI COBA

BAB IV HASIL DAN UJI COBA 37 BAB IV HASIL DAN UJI COBA Dalam tahap implementasi sistem ada beberapa syarat yang harus disiapkan sebelumnya. Syarat-syarat tersebut meliputi perangkat keras (hardware) dan perangkat lunak (software).

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Seiring dengan perkembangan teknologi informasi, maka proses dan media penyimpanan data pun semakin berkembang. Dengan adanya personal computer (PC), orang dapat menyimpan,

Lebih terperinci

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: KHOZINATUL

Lebih terperinci

DETEKSI KESESUAIAN BIDANG MINAT TERHADAP PROPOSAL TUGAS AKHIR MAHASISWA STUDI KASUS : MAHASISWA SI UKDW

DETEKSI KESESUAIAN BIDANG MINAT TERHADAP PROPOSAL TUGAS AKHIR MAHASISWA STUDI KASUS : MAHASISWA SI UKDW DETEKSI KESESUAIAN BIDANG MINAT TERHADAP PROPOSAL TUGAS AKHIR MAHASISWA STUDI KASUS : MAHASISWA SI UKDW Nia Meliana Umi Proboyekti, Jong Jek Siang Abstrak Pembuatan tugas akhir mahasiswa diharapkan sesuai

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Lahirnya teknologi informasi komputer dan fasilitas pendukungnya seperti layanan internet saat ini membuat perkembangan yang sangat luas. Segala informasi-informasi

Lebih terperinci

PERANCANGAN SISTEM PENENTUAN SIMILARITY KODE PROGRAM PADA BAHASA C DAN PASCAL DENGAN MENGGUNAKAN ALGORITMA RABIN-KARP

PERANCANGAN SISTEM PENENTUAN SIMILARITY KODE PROGRAM PADA BAHASA C DAN PASCAL DENGAN MENGGUNAKAN ALGORITMA RABIN-KARP PERANCANGAN SISTEM PENENTUAN SIMILARITY KODE PROGRAM PADA BAHASA C DAN PASCAL DENGAN MENGGUNAKAN ALGORITMA RABIN-KARP Ade Mirza Surahman Program Studi Teknik Informatika Fakultas Teknik Universitas Tanjungpura

Lebih terperinci

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma

Lebih terperinci

PERANCANGAN DAN IMPLEMENTASI SISTEM PENILAIAN JAWABAN ESAI OTOMATIS MENGGUNAKAN ALGORITMA RABIN-KARP KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI

PERANCANGAN DAN IMPLEMENTASI SISTEM PENILAIAN JAWABAN ESAI OTOMATIS MENGGUNAKAN ALGORITMA RABIN-KARP KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI PERANCANGAN DAN IMPLEMENTASI SISTEM PENILAIAN JAWABAN ESAI OTOMATIS MENGGUNAKAN ALGORITMA RABIN-KARP KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI I PUTU DHARMA ADE RAHARJA NIM. 1108605037 PROGRAM STUDI

Lebih terperinci

Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen

Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen Adi Radili 1, Suwanto Sanjaya 2 1,2 Teknik Informatika UIN Sultan Syarif Kasim Riau Jl. H.R. Soebrantas no. 155 KM. 18

Lebih terperinci

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang 58 BAB 3 METODE PENELITIAN 3.1 Analisis Masalah Seiring dengan perkembangan zaman, jumlah informasi yang disimpan dalam betuk digital semakin bertambah, sehingga dibutuhkan cara pengorganisasian dan pengelolaan

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

Pengembangan Sistem Verifikasi Mata Kuliah Dengan Parsing Data Text Transkrip Siakad Pada Jurusan Ilmu Komputer

Pengembangan Sistem Verifikasi Mata Kuliah Dengan Parsing Data Text Transkrip Siakad Pada Jurusan Ilmu Komputer Pengembangan Sistem Verifikasi Mata Kuliah Dengan Parsing Data Text Transkrip Siakad Pada Jurusan Ilmu Komputer 1 Astria Hijriani, 2 Dwi Sakethi, 3 Rian Pandu 1 Jurusan Ilmu Komputer FMIPA Unila 2 Jurusan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan

Lebih terperinci

Aplikasi String Matching Pada Fitur Auto-Correct dan Word-Suggestion

Aplikasi String Matching Pada Fitur Auto-Correct dan Word-Suggestion Aplikasi String Matching Pada Fitur Auto-Correct dan Word-Suggestion Johan - 13514206 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10

Lebih terperinci

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM Jurnal Diajukan kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta untuk

Lebih terperinci

Antplag: Portal Open Source Pendeteksi Plagiarisme di Kalangan Mahasiswa dan Dosen Politeknik Negeri Semarang

Antplag: Portal Open Source Pendeteksi Plagiarisme di Kalangan Mahasiswa dan Dosen Politeknik Negeri Semarang Antplag: Portal Open Source Pendeteksi Plagiarisme di Kalangan Mahasiswa dan Dosen Politeknik Negeri Semarang Dinny Rachma Putri 1, Mardiyono 2, Slamet Handoko 3 Jurusan Teknik Elektro, Politeknik Negeri

Lebih terperinci

APLIKASI DETEKSI PLAGIARISME BERDASARKAN STRING-MATCHING MENGGUNAKAN ALGORITMA RABIN-KARP SKRIPSI. oleh : DENI HADI SANTOSO NIM

APLIKASI DETEKSI PLAGIARISME BERDASARKAN STRING-MATCHING MENGGUNAKAN ALGORITMA RABIN-KARP SKRIPSI. oleh : DENI HADI SANTOSO NIM APLIKASI DETEKSI PLAGIARISME BERDASARKAN STRING-MATCHING MENGGUNAKAN ALGORITMA RABIN-KARP SKRIPSI oleh : DENI HADI SANTOSO NIM 07650041 JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Berkomunikasi satu sama lain merupakan salah satu sifat dasar manusia. Komunikasi berfungsi sebagai sarana untuk saling berinteraksi satu sama lain. Manusia terkadang

Lebih terperinci

Analisis Perbandingan Algoritma Rabin-Karp Dan Levenshtein Distance Dalam Menghitung Kemiripan Teks

Analisis Perbandingan Algoritma Rabin-Karp Dan Levenshtein Distance Dalam Menghitung Kemiripan Teks Analisis Perbandingan Algoritma Rabin-Karp Dan Levenshtein Distance Dalam Menghitung Kemiripan Teks 1 Andry Hery Purba, 2 Zakarias Situmorang 1 Teknik Informatika Unika St. Thomas S.U; Jln. Setia Budi

Lebih terperinci

BAB III ANALISIS MASALAH DAN RANCANGAN PROGRAM

BAB III ANALISIS MASALAH DAN RANCANGAN PROGRAM BAB III ANALISIS MASALAH DAN RANCANGAN PROGRAM III.1. Analisis Sistem yang Sedang Berjalan Proses analisa sistem merupakan langkah kedua pada pengembangan sistem. Analisa sistem dilakukan untuk memahami

Lebih terperinci

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK Lukman Syafie / JUPITER Volume XV No.2 (2016) 109 KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK Lukman Syafie Staf Pengajar Teknik Informatika, Fakultas Ilmu Komputer

Lebih terperinci

IMPLEMENTASI ALGORITMA BOYER MOORE DAN METODE N-GRAM UNTUK APLIKASI AUTOCOMPLETE DAN AUTOCORRECT

IMPLEMENTASI ALGORITMA BOYER MOORE DAN METODE N-GRAM UNTUK APLIKASI AUTOCOMPLETE DAN AUTOCORRECT IMPLEMENTASI ALGORITMA BOYER MOORE DAN METODE N-GRAM UNTUK APLIKASI AUTOCOMPLETE DAN AUTOCORRECT TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Akademik Studi Strata Satu (S1) Teknik Informatika Universitas

Lebih terperinci

Deteksi Otomatis Plagiarisme Source Code

Deteksi Otomatis Plagiarisme Source Code Deteksi Otomatis Plagiarisme Source Code LAPORAN TUGAS AKHIR Disusun sebagai syarat kelulusan tingkat sarjana oleh : CYNTHIA KUSTANTO / NIM. 13503066 PROGRAM STUDI TEKNIK INFORMATIKA SEKOLAH TEKNIK ELEKTRO

Lebih terperinci

Bab 3 Metoda dan Perancangan Sistem

Bab 3 Metoda dan Perancangan Sistem Bab 3 Metoda dan Perancangan Sistem Pada bab ini akan dibahas mengenai metode perancangan yang digunakan dalam membuat perancangan sistem aplikasi pendeteksian kata beserta rancangan design interface yang

Lebih terperinci

Preprocessing Text Mining Pada Box Berbahasa Indonesia

Preprocessing Text Mining Pada  Box Berbahasa Indonesia Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Preprocessing Text Mining Pada Email Box Berbahasa Indonesia Gusti Ngurah Mega Nata 1), Putu Pande Yudiastra 2) STMIK STIKOM

Lebih terperinci

BAB I PENDAHULUAN. dengan mudah diduplikasi (Schleimer, Wilkerson, & Aiken, 2003). Dengan

BAB I PENDAHULUAN. dengan mudah diduplikasi (Schleimer, Wilkerson, & Aiken, 2003). Dengan BAB I PENDAHULUAN 1.1 Latar Belakang Semakin berkembangnya teknologi informasi saat ini, dokumen digital dapat dengan mudah diduplikasi (Schleimer, Wilkerson, & Aiken, 2003). Dengan mudahnya duplikasi

Lebih terperinci

Pengembangan Aplikasi Perpustakaan Sekolah

Pengembangan Aplikasi Perpustakaan Sekolah Pengembangan Aplikasi Perpustakaan Sekolah Studi Kasus: SMP/SMU Charitas Jakarta 20 Nopember 2010 Astrid Callista Jurusan Sistem Informasi Universitas Pelita Harapan Tangerang, Indonesia astrid.callista@uph.edu

Lebih terperinci

ESSAY GRADING DENGAN KONSEP SIMILARITY RABIN KARP

ESSAY GRADING DENGAN KONSEP SIMILARITY RABIN KARP ESSAY GRADING DENGAN KONSEP SIMILARITY RABIN KARP Kompetensi : RPL (Rekayasa Perangkat Lunak) Nama : Ida Bagus Komang Winduyasa NIM : 1208605014 Pembimbing : 1. Agus Muliantara, S. Kom., M. Kom 2. I Putu

Lebih terperinci