PENDETEKSIAN KESAMAAN PADA DOKUMEN TEKS MENGGUNAKAN KOMBINASI ALGORITMA ENHANCED CONFIX STRIPPING DAN ALGORITMA WINNOWING SKRIPSI

dokumen-dokumen yang mirip
FOCUSED CRAWLER UNTUK MENGOPTIMALKAN PENCARIAN JURNAL MENGGUNAKAN METODE PORTER STEMMER

APLIKASI BERBASIS ANDROID PENCARIAN JARAK TERPENDEK DAN REKOMENDASI RUTE ANGKUTAN KOTA DI MEDAN MENGGUNAKAN ALGORITMA A*

DETEKSI KEMIRIPAN DOKUMEN TEKS MENGGUNAKAN ALGORITMA MANBER SKRIPSI IQBAL MAULANA DJAFAR

VISUALISASI TIGA DIMENSI (3D) PENYUSUNAN BARANG PADA GUDANG MENGGUNAKAN ALGORITMA STEEPEST ASCENT HILL CLIMBING

IMPLEMENTASI ALGORITMA ENHANCED CONFIX STRIPPING STEMMER PADA KAMUS SISTEM BAHASA ISYARAT INDONESIA SKRIPSI ANNIFA IQRAMITHA

IMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI TINGKAT KEMIRIPAN FILE TEKS YANG BERBENTUK SKRIPSI SKRIPSI

REKOMENDASI RUTE SPBU TERDEKAT MENGGUNAKAN ALGORITMA BELLMAN-FORD BERBASIS ANDROID

IMPLEMENTASI ALGORITMA WINNOWING DAN PORTER STEMMER MENDETEKSI KEMIRIPAN DUA DOKUMEN BERBASIS WEB SKRIPSI LIDIA ARTA FERARI

PENCARIAN ASSOCIATION RULES PADA DATA LULUSAN MAHASISWA PERGURUAN TINGGI MENGGUNAKAN ALGORITMA FP-GROWTH SKRIPSI SHARFINA FAZA

IMPLEMENTASI METODE COLLABORATIVE TAGGING PADA SISTEM REKOMENDASI ARTIKEL PUBLIKASI ILMIAH SKRIPSI HASMI FARHANDANI ANSARI

APLIKASI PERHITUNGAN PEMBAGIAN HARTA WARISAN BERDASARKAN HUKUM WARIS ISLAM DAN HUKUM WARIS PERDATA PADA PLATFORM ANDROID SKRIPSI

PERINGKASAN TEKS BERITA SECARA OTOMATIS MENGGUNAKAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) SKRIPSI DANDUNG TRI SETIAWAN

PREDIKSI BANJIR DENGAN MENGUNAKAN WEIGHTED EVOLVING FUZZY NEURAL NETWORK (WEFUNN) SKRIPSI REZA ELFANDRA SIREGAR

WORD PREDICTION MENGGUNAKAN WINDOWS API BERBASIS WORD FREQUENCIES SKRIPSI ADE N TAMBUNAN

PERANCANGAN PERMAINAN MENCARI KATA BERBASIS ANDROID MENGGUNAKAN ALGORITMA BRUTE FORCE SKRIPSI ROBET ARIS DWI PUTRA

PENERAPAN ALGORITMA GREEDY PADA PERMAINAN MILL BERBASIS ANDROID SKRIPSI SUANDO H SIMANJUNTAK

REKOMENDASI TAG PADA BERITA ONLINE MENGGUNAKAN TF-IDF DAN COLLABORATIVE TAGGING SKRIPSI SALMAN ALL FARIZI

OPTIMALISASI PENYUSUNAN BARANG PADA PETI KEMAS MENGGUNAKAN ALGORITMA THREE-DIMENSIONAL FIRST-FIT DECREASING SKRIPSI LEONARDO SILAEN

Identifikasi Nada Gitar dengan Menggunakan Metode Fast Fourier Transform (FFT)

ANALISIS DAN PERANCANGAN SISTEM KRIPTOGRAFI SIMETRIS TRIPLE DES DAN KRIPTOGRAFI ASIMETRIS RSA SKRIPSI BENY

APLIKASI AUGMENTED REALITY UNTUK MEMPERKENALKAN ULOS BATAK TOBA SKRIPSI ANDRE SEP MEDIO SITEPU

PERAMALAN PASAR PENJUALAN BATIK MENGGUNAKAN METODE EXTREME LEARNING MACHINE (ELM) SKRIPSI ABBAS MUNANDAR RAMBE

PERANCANGAN PERANGKAT LUNAK PENENTUAN JALUR KRITIS DARI SUATU JARINGAN KERJA PROYEK SKRIPSI AYU NURIANA SEBAYANG

DESAIN ROUTING INFORMATION PROTOCOL PADA JARINGAN KOMPUTER DENGAN PENGALOKASIAN JUMLAH HOST PER JARINGAN BERDASARKAN VLSM SKRIPSI

PENGENALAN POLA HURUF HIJAIYAH MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM) SKRIPSI NADYA AMELIA

PREDIKSI PRODUKSI PANEN KELAPA SAWIT MENGGUNAKAN JARINGAN SARAF RADIAL BASIS FUNCTION (RBF) SKRIPSI RINI JANNATI

PERANCANGAN APLIKASI PENGAMANAN DATA FILE MENGGUNAKAN KOMBINASI METODE AFFINE CIPHER DAN RSA SKRIPSI FITRA MAULIDA

PERANCANGAN PERMAINAN DOMINO BERBASIS ANDROID SKRIPSI MUHAMMAD ANDIKA SYAPUTRA

PENDETEKSI CELAH KEAMANAN PADA APLIKASI WEB DENGAN PENETRATION TESTING MENGGUNAKAN DATA VALIDATION TESTING SKRIPSI INDRA M.

PERANCANGAN CLIENT DENGAN PENGKLASIFIKASIAN MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI MOSES CHRISTIAN

PENERAPAN ALGORITMA MONTE CARLO TREE SEARCH PADA PERMAINAN HALMA SKRIPSI VINCENTIUS

IMPLEMENTASI ALGORITMA KNUTH-MORRIS-PRATH STRING MATCHING UNTUK MENCARI KATA ATAU ISTILAH PADA KAMUS KOMPUTER BERBASIS ANDROID.

SKRIPSI RANTI RAMADHIANA

SISTEM UNTUK MENGKLASIFIKASIKAN BENTUK SEL DARAH MERAH NORMAL DAN ABNORMAL DENGAN METODE SELF-ORGANIZING MAP (SOM)

PERBANDINGAN ALGORITMA APRIORI DAN ALGORITMA CT-Pro PADA KOMODITAS EKSPOR DAN IMPOR SKRIPSI ELISA SEMPA ARIHTA KABAN

SISTEM PENDUKUNG KEPUTUSAN ANALISIS INVESTASI TANAH UNTUK PERUMAHAN DENGAN METODE TOPSIS

SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK MENENTUKAN JARAK TERPENDEK MENGGUNAKAN ALGORITMA DIJKSTRA (Studi Kasus : Plaza / Mall Dikota Medan)

PENERAPAN PERINTAH SUARA BERBAHASA INDONESIA UNTUK MENGOPERASIKAN PERINTAH DASAR DI WINDOWS SKRIPSI RAISHA ARIANI SIRAIT

PERANCANGAN APLIKASI BELAJAR MENULIS ANGKA PADA ANAK MENGGUNAKAN ALGORITMA POINT IN POLYGON BERBASIS ANDROID SKRIPSI JOIN WIRA PRANATA

PENGKLASIFIKASIAN PENYAKIT GINJAL MENGGUNAKAN METODE NAIVE BAYES SKRIPSI MUHAMMAD IMANURRAHMAN

APLIKASI PENCARIAN FILE BERDASARKAN STRUKTUR KARAKTER DENGAN MENGGUNAKAN ALGORITMA APOSTOLICO GIANCARLO SKRIPSI YASIR NASUTION

SISTEM PENGANTARAN MAKANAN DENGAN PENDAYAGUNAAN VEHICLE MENGGUNAKAN GEOGRAPHICAL INFORMATION SYSTEM (GIS) DAN ALGORITMA A STAR (A*) SKRIPSI

GAME ADAPTASI RANGKU ALU BERBASIS ANDROID SKRIPSI RIZKI RAMADHAN NUR AHMAD

SKRIPSI. Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata Satu Program Studi Informatika

ANALISIS DAN PERANCANGAN SISTEM PAKAR UNTUK MENDIAGNOSIS PENYAKIT TANAMAN KARET MENGGUNAKAN METODE FAKTOR KEPASTIAN (CERTAINTY FACTOR) PADA SMARTPHONE

SKRIPSI ALMAN JULINIUS TARIGAN

PENENTUAN TIPE KEPRIBADIAN BERBASIS ANDROID DENGAN METODE CASE BASED REASONING (CBR) SKRIPSI TIANY DWI LESTARI

PERANCANGAN SISTEM PAKAR TES EQ (EMOTIONAL QUOTIENT) UNTUK MENGETAHUI ASPEK KEPRIBADIAN DENGAN METODE FORWARD CHAINING SKRIPSI

IDENTIFIKASI LOKASI FRAKTUR PADA CITRA DIGITAL TULANG TIBIA MENGGUNAKAN METODE ALGORITMA SCANLINE SKRIPSI SUSI ELFRIDA S

ANALISIS PERBANDINGAN ALGORITMA QUICKSORT, 3 WAY QUICKSORT, DAN RADIXSORT SKRIPSI PLOREN PERONICA PASARIBU

PENCARIAN KATA DAN SINONIM KATA DALAM DOKUMEN DENGAN MENGGUNAKAN ALGORITMA TWO SLIDING WINDOWS SKRIPSI FRANS OCTAVIANUS

PENERAPAN RECURRENT NEURAL NETWORK DALAM IDENTIFIKASI TULISAN TANGAN HURUF JEPANG JENIS KATAKANA SKRIPSI AMMAR ADIANSHAR

KLASIFIKASI KUALITAS BIJI KOPI DENGAN RADIAL BASIS FUNCTION SKRIPSI MEWATI PANJAITAN

SISTEM PENDUKUNG KEPUTUSAN PENENTUAN KELAYAKAN CALON ASISTEN LABORATORIUM BERBASIS ANDROID MENGGUNAKAN ALGORITMA ITERATIVE DICHOTOMISER 3 (ID3)

SISTEM INFORMASI MANAJEMEN KOPERASI SIMPAN PINJAM BERBASIS WEB SKRIPSI FERNANDO ABELTA K

KLASIFIKASI PENDARAHAN OTAK MENGGUNAKAN METODE EXTREME LEARNING MACHINE SKRIPSI AULIYA DOLI RIZKI S

APLIKASI PENGAMANAN DATA MENGGUNAKAN KOMBINASI ALGORITMA BLOWFISH DAN MODIFIED LEAST SIGNIFICANT BIT (MLSB) SKRIPSI AZHARUL WANDA SIREGAR

Universitas Sumatera Utara

APLIKASI LAYANAN INFORMASI AKADEMIK SEKOLAH BERBASIS SMS (STUDI KASUS: SMK SWASTA TELADAN MEDAN) SKRIPSI APRILIA RAMADHANI

SKRIPSI BILQIS

SISTEM PENDUKUNG KEPUTUSAN MENENTUKAN OPERATOR TERBAIK MENGGUNAKAN METODE TOPSIS (STUDI KASUS: CBOC REGIONAL 1/ PT. TELEKOMUNIKASI, TBK.

PERANCANGAN SISTEM PENDUKUNG KEPUTUSAN PENENTUAN JUMLAH PRODUKSI DENGAN METODE TSUKAMOTO (Studi Kasus pada PT Tanindo Subur Prima) SKRIPSI

PENERAPAN ALGORITMA COLUMN BY COLUMN DAN DEPTH-FIRST SEARCH DALAM PERMAINAN BABYLON TOWER SKRIPSI HARRY

SISTEM PERINGKAS BERITA ONLINE OTOMATIS MENGGUNAKAN ALGORITMA TEXTTEASER SKRIPSI ANWAR PASARIBU

PERMASALAHAN PENJADWALAN FLOW SHOP DALAM PROSES PENGECATAN BODY MOBIL DENGAN MENGGUNAKAN HARMONY SEARCH ALGORITHM SKRIPSI ANNAS MAIYASYA

PERANCANGAN APLIKASI BELAJAR HIJAIYAH PADA ANDROID MENGGUNAKAN METODE RECTANGLES COLLISION DETECTION SKRIPSI CAHYA RIZKI D ASMONO

APLIKASI UNTUK VISUALISASI SUARA JANTUNG MANUSIA PADA PLATFORM ANDROID SKRIPSI JULIA ANNISA SITEPU

PROGRAM STUDI S1 ILMU KOMPUTER

SKRIPSI BOHO SURIANTO NAIBAHO

IMPLEMENTASI ALGORITMA BLOWFISH PADA APLIKASI ENKRIPSI DAN DEKRIPSI CITRA BERBASIS WINDOWS SKRIPSI AHDA ANDI KURNIA

IMPLEMENTASI ALGORITMA BRUTE FORCE DAN ALGRITMA KNUTH-MORRIS-PRATT (KMP) DALAM PENCARIAN WORD SUGGESTION SKRIPSI ADLI ABDILLAH NABABAN

PERANCANGAN PERANGKAT LUNAK PENGKONVERSIAN TEKS SMS MENJADI SUARA SKRIPSI ANNE MARIA SINAGA

APLIKASI OTENTIKASI DOKUMEN MENGGUNAKAN ALGORITMA GOST DIGITAL SIGNATURE SKRIPSI ASMAYUNITA

PENERAPAN ALGORITMA GENETIKA DALAM PENENTUAN TATA LETAK RUANG SKRIPSI RIZKY YANDA

METODE HYBRID (BAYES DAN MULTIFACTOR EVALUATION PROCESS) DALAM SISTEM PENDUKUNG KEPUTUSAN SKRIPSI KHAIRUN NISA

PERBANDINGAN METODE DETEKSI TEPI CANNY, ROBERT DAN LAPLACIAN OF GAUSSIAN PADA HASIL CITRA CAMERA 360 SKRIPSI TIFANY BR SEMBIRING

APLIKASI KLASIFIKASI KOLEKTIBILITAS KREDIT PEMILIKAN RUMAH (KPR) MENGGUNAKAN DECISION TREE C5.0 SKRIPSI MASLIMONA HARIMITA RITONGA

IMPLEMENTASI FINGERPRINT RECOGNITION PADA KEAMANAN FOLDER SKRIPSI DIAN RAHMAD DERMAWAN

PERANCANGAN SECURE LOGIN WEBSITE MENGGUNAKAN ALGORITMA ENKRIPSI XXTEA ARDANI DWI ATMOJO

IDENTIFIKASI TIPE FILE DARI FILE FRAGMENT MENGGUNAKAN LONGEST COMMON SUBSEQUENCES (LCS) SKRIPSI FILBERT NICHOLAS

BAB III METODOLOGI PENELITIAN

DATA CLEANING PADA DATA DUPLIKAT MENGGUNAKAN LEVEINSTHEIN DISTANCE SKRIPSI MARSHA AYUDIA

IMPLEMENTASI METODE GENERATE AND TEST DALAM PENYELESAIAN PUZZLE 2048 BERBASIS MOBILE SKRIPSI

SISTEM PENDUKUNG KEPUTUSAN SELEKSI PENERIMAAN BEASISWA DEPARTEMEN AGAMA DI PESANTREN DARULARAFAH RAYA DENGAN METODE TOPSIS SKRIPSI

PENGENALAN KATA MENGGUNAKAN SELF-ORGANIZING MAP SEBAGAI INPUT KAMUS BERBASIS ANDROID FAJAR MATIUS GINTING

IMPLEMENTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI SKRIPSI ATIKA ZAFIKRI

IMPLEMENTASI METODE EXHAUSTIVE SEARCH UNTUK MENENTUKAN SHORTEST PATH ANTAR PUSAT PERBELANJAAN DI KOTA MEDAN SKRIPSI SILVIA NINGSIH PRATIWI

PERBANDINGAN KINERJA ALGORITMA FIXED LENGTH BINARY ENCODING (FLBE) DENGAN VARIABLE LENGTH BINARY ENCODING (VLBE) DALAM KOMPRESI TEXT FILE SKRIPSI

PERANCANGAN ALAT PENYIRAMAN TANAMAN OTOMATIS DENGAN SMARTPHONE ANDROID MENGGUNAKAN MIKROKONTROLER ARDUINO SKRIPSI AHMAD ROY MUDA SIREGAR

SIMULASI SCALING DAN ROOT PLANING MENGGUNAKAN LEAP MOTION CONTROLLER SKRIPSI ANNISA FARADINA

SISTEM MARKET BASKET UNTUK MENENTUKAN TATA LETAK PRODUK PADA SUATU SWALAYAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING SKRIPSI STEFFI ANDINA SEBAYANG

PERANCANGAN APLIKASI PEMBELAJARAN MAD DALAM AL-QURAN BERBASIS ANDROID

IMPLEMENTASI DAN ANALISIS KINERJA ALGORITMA ARITHMETIC CODING DAN SHANNON-FANO PADA KOMPRESI CITRA BMP SKRIPSI SYAHFITRI KARTIKA LIDYA

IMPLEMENTASI ALGORITMA RIJNDAEL PADA PENGAMANAN RECORD DAN FILE DATABASE SKRIPSI AMALIA PRATIWI

SISTEM INFORMASI PERSEDIAAN OBAT APOTIK SEKATA SARAH MENGGUNAKAN MICROSOFT VISUAL BASIC 6.0 TUGAS AKHIR TUTUR YENI OKTAVIA BR SILALAHI

IMPLEMENTASI NETWORK MONITORING DAN PACKET CAPTURING PADA CAMPUS NETWORK MENGGUNAKAN METODE RANDOM EARLY DETECTION (RED) SKRIPSI

IMPLEMENTASI HYBRID (CONTENT BASED DAN COLLABORATIVE FILTERING) PADA SISTEM REKOMENDASI SOFTWARE ANTIVIRUS DENGAN MULTI-CRITERIA RATING SKRIPSI

METODE DEPTH FIRST SEARCH UNTUK PENCARIAN RUTE JADWAL PENERBANGAN SKRIPSI MASPIN SAHPUTRA

PROGRAM STUDI S1 ILMU KOMPUTER FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013

PERANCANGAN APLIKASI PAILLIER CRYPTOSYSTEM UNTUK MENGAMANKAN DATA FILE SKRIPSI NOVY

Transkripsi:

PENDETEKSIAN KESAMAAN PADA DOKUMEN TEKS MENGGUNAKAN KOMBINASI ALGORITMA ENHANCED CONFIX STRIPPING DAN ALGORITMA WINNOWING SKRIPSI ADE CHANIA SION SAGALA 091402044 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2014

PENDETEKSIAN KESAMAAN PADA DOKUMEN TEKS MENGGUNAKAN KOMBINASI ALGORITMA ENHANCED CONFIX STRIPPING DAN ALGORITMA WINNOWING SKRIPSI Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi ADE CHANIA SION SAGALA 091402044 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2014

PERSETUJUAN Judul : PENDETEKSIAN KESAMAAN PADA DOKUMEN TEKS MENGGUNAKAN KOMBINASI ALGORITMA ENHANCED CONFIX STRIPPING DAN ALGORITMA WINNOWING Kategori : SKRIPSI Nama : ADE CHANIA SION SAGALA Nomor Induk Mahasiswa : 091402044 Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI Departemen : TEKNOLOGI INFORMASI Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI (FASILKOM-TI) UNIVERSITAS SUMATERA UTARA Diluluskan di Medan, 29 Agustus 2014 Komisi Pembimbing: Pembimbing 2 Pembimbing 1 Romi Fadillah Rahmat, B.Comp.Sc., M.Sc. Maya Silvi Lydia, B.Sc., M.Sc. NIP 19860303 201012 1 004 NIP 19740127 200212 2 001 Diketahui/Disetujui oleh Program Studi S1 Teknologi Informasi Ketua, M. Anggia Muchtar, S.T., MM.IT. NIP 19800110 200801 1 010

iii PERNYATAAN PENDETEKSIAN KESAMAAN PADA DOKUMEN TEKS MENGGUNAKAN KOMBINASI ALGORITMA ENHANCED CONFIX STRIPPING DAN ALGORITMA WINNOWING SKRIPSI Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya. Medan, 29 Agustus 2014 Ade Chania Sion Sagala 091402044

iv UCAPAN TERIMA KASIH Segala puji dan syukur penulis sampaikan kepada Tuhan Yesus yang telah memberikan berkat-nya yang melimpah sehingga penulis dapat menyelesaikan skripsi ini dengan baik untuk memperoleh gelar Sarjana Teknologi Informasi, Program Studi S1 Teknologi Informasi Universitas Sumatera Utara. Dengan segala kerendahan hati penulis ucapkan terima kasih kepada: 1. Ayah penulis, alm. Alfanus Februanto Sagala, S.H., ibu penulis, Chitra Dewi Siregar, dan adik penulis satu-satunya Milca Satriyani Sagala, A.md yang telah memberikan doa dan dukungan moral kepada penulis untuk menyelesaikan skripsi ini beserta keluarga besar yang telah turut mendoakan penulis. 2. Ibu Maya Silvi Lydia, B.Sc., M.Sc. dan Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc. selaku dosen pembimbing penulis yang telah meluangkan waktu, pikiran, saran, dan kritiknya untuk penulis dalam menyelesaikan skripsi ini. 3. Ibu Sarah Purnamawati, S.T., M.Sc dan Ibu Dr. Erna Budhiarti, M.IT. yang telah bersedia menjadi dosen penguji dan memberikan saran dan kritik yang membangun dalam penyelesaian skripsi ini. 4. Ketua dan Sekretaris Program Studi S1 Teknologi Informasi, Bapak M. Anggia Muchtar, S.T., MM.IT. dan Bapak Mohammad Fadly Syahputra, B.Sc., M.Sc.IT. 5. Seluruh dosen yang mengajar serta Ibu Delima dan Bang Faisal, sebagai staf Tata Usaha Program Studi Teknologi Informasi Universitas Sumatera Utara. 6. Sahabat-sahabat yang selalu mendukung dan memberi semangat kepada penulis, Fida Elvi Anderia Sebayang, S.TI, Stella Maris Harefa, S.TI, Cynthia Arilla Sembiring, S.TI, Riska Vinesia Butarbutar, S.TI, Jihan Meutia Fauzen, S.TI, Annifa Iqramitha, S.TI, dan semua teman angkatan 2009. 7. Sahabat penulis Maria Fransiska Sinaga, S.T., Septina Veronika Bancin, S.KG, dan Dewi Tambunan yang selalu mendoakan dan memberi semangat. 8. Seluruh rekan kuliah sejawat yang tidak dapat disebutkan satu persatu. Penulis menyadari bahwa masih banyak kekurangan dalam skripsi ini, untuk itu penulis mengharapkan saran dan kritik yang bersifat membangun dari semua pihak demi kesempuranaan skripsi ini. Akhir kata penulis ucapkan terima kasih.

v ABSTRAK Maraknya tindakan plagiarisme di dunia perkuliahan, baik plagiarisme dalam hal penyelesaian tugas maupun penyusunan karya ilmiah dapat mengurangi bahkan mematikan kreativitas seseorang dalam berkarya. Oleh karena itu, dibutuhkan sebuah aplikasi untuk mendeteksi tingkat kesamaan (similarity) sebuah dokumen teks dengan dokumen yang sudah ada. Penelitian ini menggunakan kombinasi dari algoritma Enhanced Confix Stripping (ECS) Stemmer untuk proses stemming teks yang dimasukkan dan algoritma Winnowing untuk menghitung tingkat kesamaannya (similarity) dengan dokumen dari database. Dengan ditentukannya nilai gram dan window pada perhitungan algoritma Winnowing, diharapkan dapat memudahkan user menggunakan aplikasi ini tanpa harus bingung menentukan nilai gram dan windownya untuk menghasilkan nilai similarity yang akurat. Hasil pengujian menyimpulkan nilai kesamaan (similarity) sekitar 23-26% dengan percobaan 3 jurnal yang berkategori sama dengan jurnal pembanding. Dan untuk pendeteksian tanpa stemming menghasilkan tingkat kesamaan (similarity) sekitar 35-40% dengan jumlah jurnal dan kategori yang sama pula. Kata kunci: enhanced confix stripping (ecs) stemmer, winnowing, plagiarisme, tingkat plagiat, similarity

vi SIMILARITY DETECTION FOR TEXT DOCUMENTS USING COMBINATION OF ENHANCED CONFIX STRIPPING STEMMER ALGORITHM AND WINNOWING ALGORITHM ABSTRACT The plethora of plagiarism in lecturing, such as for finishing projects or making scientific papers can diminish even stifle someone s creativity. Therefore, an application to detect a document for the similarity level of plagiarism with the existing one is needed. This research uses the combination of Enhanced Confix Stripping (ECS) Stemmer algorithm to stem the input text and Winnowing algorithm to numerate the similarity level with a document in database. The value of gram and window for the calculation of Winnowing algorithm are determined along with, so that it can abridge the user to use this application without being confused to determine the value of its gram and window to get an accurate similarity. The result concludes that the similarity is about 23-26% by three-same-category testing journals with the correlate journal in database. And the result of the nonstemming detection of similarity is about 35-40% with the same total of journals and category. Keywords: enhanced confix stripping (ecs) stemmer, winnowing, plagiarism, level of plagiarism, similarity

vii DAFTAR ISI PERSETUJUAN PERNYATAAN UCAPAN TERIMA KASIH ABSTRAK ABSTRACT DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR Halaman ii iii iv v vi vii ix x BAB 1 PENDAHULUAN 1 1.1. Latar Belakang 1 1.2. Rumusan Masalah 2 1.3. Batasan Masalah 3 1.4. Tujuan Penelitian 3 1.5. Manfaat Penelitian 3 1.6. Metodologi Penelitian 3 1.7. Sistematika Penulisan 4 BAB 2 TINJAUAN PUSTAKA 6 2.1. Plagiarisme 6 2.1.1. Pengertian Plagiarisme 6 2.1.2. Peraturan dan Hukum yang Mengatur Plagiarisme 8 2.2. Citasi 9 2.3. Algoritma Stemming Bahasa Indonesia 10 2.3.1. Algoritma Enhanced Confix Stripping Stemmer 11 2.4. Algoritma Winnowing 14 2.4.1. Rolling Hash 15 2.4.2. Tahapan Penerapan Algoritma Winnowing 16 2.4.3. Pengukuran Dan Persentase Similarity 17 2.5. Penelitian Terdahulu 18 BAB 3 ANALISIS DAN PERANCANGAN SISTEM 20 3.1. Analisis Data 20 3.1.1. Data Jurnal 20 3.1.2. Tabel Kata Dasar 21 3.1.3. Tabel Stoplist 21 3.2. Analisis Sistem 22 3.2.1. Proses Admin 22 a. Text Preprocessing 23 b. Penghapusan Stopwords 26 c. Stemming Enhanced Confix Stripping 27 d. Pembentukan Nilai Hash dan Fingerprint 31

viii Halaman 3.2.2. Proses User 45 3.3. Perancangan Sistem 46 3.3.1. Arsitektur Umum (General Architecture) 46 3.3.2. Diagram Use Case 46 3.3.3. Realisasi Definisi Use Case 47 3.4. Perancangan Tampilan Antarmuka 49 3.4.1. Rancangan Halaman Utama User 49 3.4.2. Rancangan Halaman Hasil Pendeteksian 49 3.4.3. Rancangan Halaman Home Admin 50 3.4.4. Rancangan Halaman Profile Admin 51 3.4.5. Rancangan Halaman Edit Dictionary Admin 51 3.4.6. Rancangan Halaman Proses Stemming 52 3.4.7. Rancangan Halaman Nilai Hash dan Fingerprint 53 BAB 4 IMPLEMENTASI DAN PENGUJIAN 54 4.1. Implementasi Sistem 54 4.1.1. Spesifikasi Perangkat Keras Dan Perangkat Lunak Yang Digunakan 54 4.1.2. Implementasi Perancangan Antarmuka 54 a. Tampilan Halaman Utama User 54 b. Tampilan Halaman Hasil Pendeteksian 55 c. Tampilan Halaman Home Admin 55 d. Tampilan Halaman Profile Admin 56 e. Tampilan Halaman Edit Dictionary Admin 56 f. Tampilan Halaman Proses Stemming 57 g. Tampilan Halaman Nilai Hash dan Fingerprint 57 4.2. Pengujian Sistem 58 4.2.1. Pengujian pada Proses yang Dilakukan Admin 58 4.2.2. Pengujian pada Proses yang Dilakukan User 60 4.2.3. Pengujian Kinerja Sistem 60 4.2.4. Hasil Pengujian Sistem 61 a. Hasil Pengujian Dengan Proses Stemming 61 b. Hasil Pengujian Tanpa Proses Stemming 62 BAB 5 KESIMPULAN DAN SARAN 64 5.1. Kesimpulan 64 5.2. Saran 64 DAFTAR PUSTAKA 65 LAMPIRAN A: Kode Program 68 LAMPIRAN B: Hasil Pendeteksian Kesamaan 74

ix DAFTAR TABEL Halaman Tabel 2.1. Aturan Dasar Awalan - Akhiran Yang Berlaku 11 Tabel 2.2. Urutan Pengembalian Akhiran 11 Tabel 2.3. Aturan Pemenggalan Awalan Algoritma Stemmer Nazief dan Adriani 11 Tabel 2.4. Aturan Pemenggalan Awalan Algoritma Enhanced Confix Stripping Stemmer 13 Tabel 2.5. Penelitian Terdahulu 19 Tabel 3.1. Tabel Kategori 20 Tabel 3.2. Tabel Keyword 24 Tabel 3.3. Tabel Kata Dasar 21 Tabel 3.4. Tabel Stoplist 22 Tabel 3.5. Nilai Fungsi Hash Kalimat 1 31 Tabel 3.6. Nilai Fungsi Hash Kalimat 2 38 Tabel 3.7. Realisasi Definisi Use case 47 Tabel 4.1. Daftar Jurnal Uji 60 Tabel 4.2. Daftar Jurnal Pembanding 60 Tabel 4.3. Hasil Pengujian Dengan Proses Stemming 61 Tabel 4.4. Hasil Pengujian Tanpa Proses Stemming 62

x DAFTAR GAMBAR Halaman Gambar 3.1. Flowchart Proses Admin 25 Gambar 3.2. Flowchart Text Preprocessing 26 Gambar 3.3. Flowchart Penghapusan Stopwords 25 Gambar 3.4. Flowchart Stemming ECS 29 Gambar 3.5. Flowchart Proses User 45 Gambar 3.6. General Architecture 46 Gambar 3.7. Diagram Use case 47 Gambar 3.8. Rancangan Halaman Utama User 49 Gambar 3.9. Rancangan Halaman Hasil Pendeteksian 50 Gambar 3.10. Rancangan Halaman Home Admin 50 Gambar 3.11. Rancangan Halaman Profile Admin 51 Gambar 3.12. Rancangan Halaman Edit Dictionary Admin 52 Gambar 3.13. Rancangan Halaman Proses Stemming 52 Gambar 3.14. Rancangan Halaman Nilai Hash dan Fingerprint 53 Gambar 4.1. Tampilan Halaman Utama User 55 Gambar 4.2. Tampilan Halaman Hasil Pendeteksian 55 Gambar 4.3. Tampilan Halaman Home Admin 56 Gambar 4.4. Tampilan Halaman Profile Admin 56 Gambar 4.5. Tampilan Halaman Edit Dictionary Admin 57 Gambar 4.6. Tampilan Halaman Proses Stemming 57 Gambar 4.7. Tampilan Halaman Nilai Hash dan Fingerprint 58 Gambar 4.8. Database Tabel Keyword 59