DETEKSI SIMILARITAS DOKUMEN ABSTRAK TUGAS AKHIR MENGGUNAKAN METODE LEVENSHTEIN DISTANCE

Ukuran: px
Mulai penontonan dengan halaman:

Download "DETEKSI SIMILARITAS DOKUMEN ABSTRAK TUGAS AKHIR MENGGUNAKAN METODE LEVENSHTEIN DISTANCE"

Transkripsi

1 DETEKSI SIMILARITAS DOKUMEN ABSTRAK TUGAS AKHIR MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Abdul Najib 1), Karyo Budi Utomo 2) 1), 2) Jurusan Teknologi Informasi, Politeknik Negeri Samarinda 1), 2) Abstrak - Deteksi similaritas sebuah dokumen dilakukan untuk mencari dan memeriksa kesamaan pada beberapa dokumen. Hal ini dilakukan untuk mencegah agar tidak ada dokumen yang mirip persis dengan dokumen lain. Laporan tugas akhir merupakan karya ilmiah yang berisi suatu pokok bahasan yang merupakan acuan untuk mengukur kemampuan mahasiswa dalam memahami masalah sesuai dengan minat yang diminatinya. Abstrak merupakan bagian dalam sebuah laporan tugas akhir, berupa ringkasan dari sebuah karya ilmiah yang berguna untuk memahami isi dari keseluruhan tulisan karya ilmiah. Pada penelitian ini, deteksi kemiripan dokumen dilakukan pada abstrak tugas akhir menggunakan algoritma levenshtein distance. Pendeteksian dilakukan menggunakan 1 data abstrak sebagai dokumen asli dan 4 data abstrak sebagai dokumen pembanding. Proses pendeteksian diawali dengan melakukan tahap preprocessing, setelah itu masuk ketahap pencocokan string menggunakan matrik edit distance. Hasil dari matrik tersebut adalah nilai edit distance yang akan menjadi penentu bobot similarity. Dokumen pembanding dinyatakan mirip dengan dokumen asli jika tingkat kemiripan atau similaritasnya mencapai 80%. Dari hasil penelitian ini didapatkan nilai similaritas terendah yaitu 23,45 % dan tertinggi 32,72 %. Kata Kunci Similaritas, Levenshtein distance, Preprocessing. 1. PENDAHULUAN Laporan tugas akhir merupakan karya ilmiah yang berisi suatu pokok bahasan yang merupakan acuan untuk mengukur kemampuan mahasiswa dalam memahami masalah sesuai dengan minat yang diminatinya. Abstrak merupakan bagian dalam sebuah laporan tugas akhir, berupa ringkasan dari sebuah karya ilmiah yang berguna untuk memahami isi dari keseluruhan tulisan karya ilmiah. Abstrak digunakan untuk memberikan gambaran secara detail kepada pembaca agar dapat memahami intisari dari penelitian yang telah dilakukan. Deteksi similaritas sebuah dokumen dilakukan untuk mencari dan memeriksa kesamaan pada beberapa dokumen. Hal ini dilakukan untuk mencegah agar tidak ada dokumen yang mirip persis dengan dokumen lain. Ukuran kesamaan teks memainkan peran yang sangat penting dalam penelitian dan aplikasi terkait teks dalam tugas seperti pengambilan informasi, klasifikasi teks, pengelompokkan dokumen, pendeteksian topik, pelacakan topik, pembuatan pertanyaan, jawaban pertanyaan, skor esai, skor jawaban singkat, terjemahan mesin, intisari teks dan lain-lain. Menemukan kesamaan antara kata-kata adalah bagian mendasar dari kesamaan teks yang kemudian digunakan sebagai fungsi utama untuk persamaan kalimat, paragraf dan dokumen. Kata- kata bisa serupa dalam dua cara leksikal dan semantik. Kata-kata serupa secara leksikal jika memiliki urutan karakter yang serupa. Kata-kata serupa secara semantik jika keduanya sama, berlawanan satu sama lain, digunakan dengan cara yang sama, digunakan dalam konteks yang sama dan satu adalah jenis yang lain[1]. Pendeteksian similaritas juga dapat digunakan sebagai acuan adanya tindakan penjiplakan yang dilakukan dari dokumen-dokumen sebelumnya. Namun pada penelitian ini, penelitian dilakukan hanya sampai pada penentuan mirip atau tidak dari dokumen yang dibandingkan. Untuk dapat menentukan sebuah dokumen plagiat, maka perlu dilakukan tahapantahapan lanjutan lainnya. Pendeteksian kemiripan dapat dilakukan menggunakan cara manual, yaitu membandingkan kalimat per kalimat pada dokumen pembanding dan dokumen asli. Namun cara tersebut dinilai sulit, ditambah lagi jika dokumen yang dibandingkan merupakan dokumen berbahasa Indonesia. Dokumen berbahasa Indonesia dikatakan sulit untuk dideteksi karena persamaan dan imbuhan kata yang sangat banyak. Untuk mencegah adanya dokumen tugas akhir yang mirip persis dengan penelitian sebelumnya, maka penulis tertarik untuk mendeteksi kemiripan dokumen menggunakan metode levenshtein distance. Dokumen yang akan diukur nilai similaritasnya diambil dari abstrak laporan tugas akhir. Metode levenshtein distance digunakan karena metode ini telah banyak digunakan pada penelitian sebelumnya untuk mendeteksi similaritas dokumen dan metode ini tidak memiliki batasan untuk panjang karakter yang akan digunakan [2]. Banyak aplikasi yang menggunakan algoritma ini, seperti pengecek ejaan, pemandu penerjemahan, perkiraan dari pengucapan dialek, mesin pencari, pemberi revisi file dengan membandingkan perbedaan dua buah file, pendeteksi pemalsuan, pengenal percakapan (speech recognition) dan sebagainya [3]. 58

2 Najib dan Utomo, Deteksi Similaritas Dokumen Abstrak Tugas Akhir Menggunakan Metode Algoritma ini berjalan dari pojok kiri atas sebuah array dua dimensi yang telah diisi sejumlah karakter string awal dan string target dan diberikan nilai cost. Nilai cost pada ujung kanan bawah menjadi nilai edit distance yang menggambarkan jumlah perbedaan dua string. Pengecekan dimulai dari iterasi awal dari kedua string kemudian dilakukan operasi penambahan, penyisipan dan penghapusan. Nilai edit distance yaitu terletak pada ujung kanan bawah matriks [4]. Tahap awal yang dilakukan sebelum melakukan pendeteksian kemiripan adalah preproessing. Preprocessing merupakan tahap awal yang dilakukan pada proses text mining. Dalam penelitian ini text mining digunakan untuk mencari kata kunci yang terdapat pada setiap dokumen yang akan dibandingkan, kemudian dokumen tersebut dapat dianalisa dan dilakukan pencocokan antara dokumen dengan menggunakan kata kunci yang telah dibuat untuk mengukur tingkat kemiripan dari dokumendokumen yang dibandingkan. Text mining adalah sebuah proses pengambilan data berupa teks dari sebuah sumber yaitu dokumen. Berdasarkan latar belakang diatas, maka dibuatlah perhitungan similaritas pada dokumen abstrak tugas akhir menggunakan metode levenshtein distance untuk mengukur tingkat kemiripan dari dokumen-dokumen abstrak yang dibandingkan. 2. METODE 2.1 Metode Penelitian Levenshtein distance dibuat oleh Vladimir Levenshtein pada tahun Pada perhitungan edit distance dari metode ini didapatkan dari matriks yang digunakan untuk menghitung jumlah perbedaan string antara dua string. Perhitungan jarak antara dua string ini ditentukan dari jumlah minimum operasi perubahan untuk membuat string A menjadi string B dengan menggunakan 3 macam operasi utama yaitu: (1) operasi penyisipan (insertion), (2) operasi penghapusan (deletion),(3) operasi penggatian (subtitution) [5]. Distance adalah jumlah perubahan yang diperlukan untuk mengubah suatu bentuk string ke bentuk string yang lain. Contohnya, string hasil dan hasal memiliki distance 1 karena diperlukan satu operasi untuk mengubah string hasal menjadi hasil. Hasil Levenshtein distance yang diperoleh sebenarnya tidak dapat langsung dimanfaatkan, namun perlu diolah untuk memenuhi kebutuhan aplikasi tersebut. Banyak aplikasi yang menggunakan algoritma ini, seperti pengecek ejaan, pemandu penerjemahan, perkiraan dari pengucapan dialek, mesin pencari, pemberi revisi file dengan membandingkan perbedaan dua buah file, pendeteksi pemalsuan, pengenal percakapan (speech recognition), dan sebagainya [3]. Mekanisme Metode Edit distance merupakan jumlah minimum point mutation yang diperlukan untuk merubah suatu string ke string yang lain. Point mutation tersebut adalah mengganti, menambah dan menghapus sebuah karakter [6]. Perhitungan edit distance didapatkan dari matriks yang digunakan untuk menghitung jumlah perbedaan string antara dua string. Ada 3 macam operasi utama yang dapat dilakukan oleh algoritma ini yaitu : 1. Operasi Pengubahan Karakter Operasi pengubahan karakter merupakan operasi menukar sebuah karakter dengan karakter lain. String gimpunan menjadi himpunan, dalam kasus ini karakter g yang terdapat pada awal string diganti dengan huruf h. String 1 H i m p u n a n String 2 G i m p u n a n Substitution H 2. Operasi Penambahan Karakter Operasi penambahan karakter berarti menyisipkan karakter ke dalam suatu string. Contohnya string disrit menjadi diskrit, dilakukan penyisipan karakter k ditengah string. Penyisipan karakter tidak hanya dilakukan ditengah string, namun bisa disisipkan diawal maupun diakhir. String 1 String 2 Insertion d i s k r i t d i s r i t k 3. Operasi Penghapusan Karakter Operasi penghapusan karakter dilakukan untuk menghilangkan karakter dari suatu string. Contohnya string matematikan karakter terakhir dihilangkan sehingga menjadi string matematika. Pada operasi ini dilakukan penghapusan karakter n. String 1 m a t e m a t i k a String 2 m a t e m a t i k a n Deletion n Dynamic Programming Pencarian edit distance dapat dilakukan dengan menggunakan beberapa metode, diantaranya algoritma dynamic programming dan hirschberg. Dalam penelitian ini digunakan algoritma dynamic 59

3 JUST TI, Volume 10 Nomor 1, Januari 2018: programming. Dynamic programming merupakan suatu algoritma yang membagi problem menjadi sub-sub problem dimana solusi yang optimal dapat dicari dari sub problem tersebut. Sub-sub problem dipecahkan dan hasilnya kemudian disimpan dalam bentuk tabel. Penggunaan tabel dimana tiap sel berisi solusi yang dihitung berdasarkan algoritma tersebut. Algoritma ini dapat digunakan jika sub-sub problem tidak independent, artinya sub problem tersebut mempunyai irisan dengan sub problem yang lain. Pemecahan setiap sub-sub problem hanya dilakukan sekali dan kemudian disimpan dalam bentuk tabel. Dynamic programming biasanya diaplikasikan untuk problem optimasi, dimana problem-problem tersebut solusinya mempunyai banyak kemungkinan [6]. Pengukuran Similarity Value Setelah mendapatkan nilai edit distance dari dua dokumen yang dibandingkan selanjutnya menghitung presenstase kemiripan dari dua dokumen tersebut. Untuk menghitung similarity value menggunakan persamaan 2.1 sebagai berikut: diff similarity value = (1 max(cs, ST) ) 100 Diff adalah edit distance, terletak pada baris ke m dan kolom ke n. CS adalah panjang string awal, ST adalah panjang string target, dan Max(CS,ST) adalah panjang string terbesar antarastring awal dan string target. Similarity value diasumsikan pada rentang 0 (nol) hingga 100(seratus) persen, yang artinya nilai 100 adalah nilai maksimum yang menunjukan bahwa dua kata adalah sama identik. Pendekatan ini mampu digunakan untuk mengukur bobot similarity antar dua string berdasarkan susunan karakter [7]. 3. HASIL DAN PEMBAHASAN Data yang digunakan adalah dokumen yang berformat teks dan berbahasa Indonesia. Dokumen yang akan menjadi bahan untuk dihitung kemiripannya didapatkan dari abstrak laporan tugas akhir mahasiswa Teknologi Informasi Politeknik Negeri Samarinda. Data yang dijadikan sebagai contoh perhitungan berjumlah 5 buah abstrak, dari keseluruhan data yang didapat digunakan 1 abstrak sebagai data dokumen asli dan 4 abstrak sebagai data dokumen pembanding. Dari masing-masing abstrak diambil 1 sampai dengan 2 kalimat yang akan dihitung kemiripannya. Data abstrak laporan tugas akhir yang akan dihitung presentase kemiripannya menggunakan metode levenshtein distance dapat dilihat pada Tabel 4.1 Tabel 4. 1 Data Dokumen Asli No DOKUMEN ASLI Ket 1 Dengan banyaknya jumlah mahasiswa(i) yang telah menyelesaikan tugas akhir begitu juga data dokumen tugas akhir dengan berbagai judul dan berbagai tema yang tentunya cukup banyak untuk di cari secara pengarsipan manual. Pada penelitian ini metode yang digunakan untuk permasalahan ini adalah Naïve Bayes Classifier dan data yang digunakan adalah Abstrak dari tugas akhir. Dok 1 Tabel 4. 2 Data Dokumen Pembanding No DOKUMEN PEMBANDING Ket 1 Penelitian ini bertujuan untuk merancang dan membangun aplikasi perhitungan nilai indeks prestasi kelulusan yang dapat diakses melalui perangkat lunak web browser untuk memudahkan akses yang lebih fleksibel. Diharapkan aplikasi ini dapat membantu mahasiswa mengakses informasi mengenai nilai yang dicapai semasa diperkuliahan. 2 Dalam tugas akhir ini akan mengembangkan kamera pengintai jarak jauh berbasis 3G pada HP E63. Dari hasil penelitian kamera pengintai jarak jauh berbasis 3G pada HP E63 suatu alat memanfaatkan telekomunikasi berbasis 3G untuk menjadikan keperluan keamanan dilingkungan sekitar. 3 Semakin lama teknologi semakin berkembang, kebutuhan akan sesuatu informasi meningkat pula. Maka dibutuhkan suatu cara agar dapat memperoleh suatu informasi data, tukar menukar data, dilakukan dengan aman dan stabil. Oleh karena itu lah VPN diciptakan umtuk menyenyelesaikan permasalahan dalam jaringan yang tidak aman. 4 Dengan menggunakan salah satu algoritma dari teknik asosiasi dalam data mining, yaitu algoritma apriori dapat memanfaatkan data yang tersimpan didalam data warehouse, sehingga diketahui keterkaitan dari nilai-nilai matakuliah yang telah dicapai oleh mahasiswa terhadap kompetensi dasar yang harus dimiliki oleh seorang lulusan informatika. Dok 2 Dok 3 Dok 4 Dok 5 60

4 Najib dan Utomo, Deteksi Similaritas Dokumen Abstrak Tugas Akhir Menggunakan Metode 3.1. Preprocessing Pada tahapan pre-processingg ini, data-data dokumen teks abstrak diatas akan di proses dengan beberapa tahapan seperti case folding, tokenizing, filtering, stemming, sorting dan analyzing. Tahap ini bertujuan untuk mencari kata kunci pada dokumen asli dan dokumen pembanding yang akan dihitung nilai similaritasnya. Seluruh tahapan dari preprocessing ini dilakukan menggukanan Microsoft excel. Data-data tersebut diletakan pada Microsoft Excel kemudian ditempatkan secara terpisah di dalam sheets yang ada. Data asli dan data pembanding yang sudah siap kemudian dikumpulkan dalam satu sheets. Ada 6 proses yang dilakukan pada tahap preprocessing, yaitu case folding, tokenizing, filtering, stemming,sorting dan filtering Implementasi Metode Setelah semua data asli dan pembanding melalui tahap preprocessing, maka data-data tersebut dicocokkan dengan menggunakan algoritma levenshtein distance. Pencocokan dilakukan menggunakan matrik 2 dimensi. Entri pada matrik tersebut mempresentasikan nilai terkecil dari string awal (string 1) menjadi string target (string 2). Nilai yang terdapat pada ujung kanan bawah matrik adalah nilai edit distance yang menggambarkan jumlah perbedaan antar kedua string. Tabel 4.13 merupakan contoh matrik edit distance, string awal berisi kata konspirasi dan string target berisi kata kompilasi. Tabel 4. 3 Matrik edit distance Baris dan kolom pada Tabel 4.3 diatas diisi dengan langkah sebagai berikut : 1. Masukkan string awal dan string target ke kotak yang tersedia, setiap 1 kotak berisi 1 karakter. 2. Matrik m[0,0] akan diisi dengan nilai 0 3. Elemen matrik m[i,0] akan diisi dengan nilai matrik [i-1,0] Elemen matrik m[0,j] akan diisi dengan nilai [0,j-1] Untuk matrik elemen matrik lainnya m[i,j] diisi dengan urutan langkah dibawah ini : a. Bentuk dynamic programming dalam proses ini adalah [i-1,j-1]+ cost. Jika nilai i = j, maka cost bernilai 0, sehingga bentuknya menjadi [i-1,j-1]+ 0. Namun, jika nilai i j berarti cost bernilai 1. Bentuk dynamic programmingnya menjadi m[i-1,j- 1]+1, Operasi yang sedang dilakukan yaitu substitusi atau penggantian i menjadi j. b. Pada proses pencocokan string, operasi penghapusan i pada string awal juga dapat dilakukan. Bentuk dynamic programming untuk operasi penghapusan adalah m[i,j-1]+1. c. Operasi terakhir yang mungkin terjadi pada proses pencocokan adalah penyisipan atau insertion, bentuk dynamic programming yang digunakan dalam proses penyisipan adalah m[i,j- 1]+1. d. Terakhir mencari nilai minimum dari ketiga operasi diatas. 6. Matrik m[i,j] berwarna merah merupakan nilai edit distance. Pada proses pencocokan string 1 menjadi string 2 menggunakan matrik edit distance, 3 kemungkinan yang dapat terjadi adalah operasi penggantian, operasi penghapusan dan operasi penyisipan. Karena algoritma levenshtein distance merupakan jumlah minimum untuk merubah string 1 menjadi string 2, maka proses terakhir dari pencocokan diatas pada point d yaitu mencari nilai minimun dari ketiga operasi tersebut. Perhitungan matrik pada Tabel 4.3 dilakukan sebagai contoh. Nilai edit distance dari data uji pada Tabel 4.1 dan 4.2 dapat dilihat pada tabel 4.4. Tabel 4. 4 Hasil matrik edit distance DOKUMEN NILAI EDIT DISTANCE PANJANG STRING AWAL (CS) PANJANG STRING TARGET (ST) Dok Dok Dok Dok Pengukuran Similarity Value Pengukuran nilai similaritas dilakukan menggunakan rumus pada persamaan 2.2. Nilai similaritas dari masing-masing dokumen diperoleh dari nilai edit distance dibagi dengan panjang maksimal string dari kedua string lalu dikalikan dengan 100%. Data yang digunakan adalah panjang dari panjang string awal dan string target serta nilai edit 61

5 JUST TI, Volume 10 Nomor 1, Januari 2018: distance dari setiap dokumen yang dapat dilihat pada Tabel 4.4. Pengukuran nilai similaritas Dok 2. similarity value = ( ) 100 = ( ) 100 = 31.25% 176 Dari rumus diatas diketahui bahwa diff merupakan nilai edit distance dan max(cs,st) merupakan panjang maksimal dari string awal (CS) dan string target (ST). Dengan rumus yang sama, berikut pengukuran similaritas untuk dokumendokumen yang dibandingkan lainnya. Pengukuran nilai similaritas dok 3 similarity value = ( ) 100 = ( ) 100 = 23.45% 145 Pengukuran nilai similaritas dok 4 similarity value = ( ) 100 = ( ) 100 = 32.72% 162 Pengukuran nilai similaritas dok 5 similarity value = ( ) 100 = ( ) 100 = 29.03% 186 Hasil perhitungan diatas menunjukkan nilai similaritas terendah ditunjukkan oleh dok 3 yaitu 23,45% dan nilai similaritas tertinggi ditunjukkan dok 4 sebesar 32,72%. REFERENSI [1] Wael H.G & Aly A.F. (2013). A Survey of Textual Similarity Approaches. Intenational Journal of Computer Application, Vol.68, No.13. [2] Ali, A. (2011). Textual Similarity. Kongens Lyngby: Technical University of Denmark. [3] Dwitiyastuti R.N, Muttaqin A & Aswin M. (2013). Pengoreksi Kesalahan Ejaan Bahasa Indonesia menggunakan Metode Levenshtein distance. Jurnal Mahasiswa Teknik Elektro Universitas Brawijaya, Vol.1, No.2. [4] Adriyani N.M.M, Santiyasa I.W & Muliantara (2010). Implementasi Algoritma Levenshtein distance dan Metode Empiris untuk Menampilkan Saran Perbaikan Kesalahan Pengetikan Dokumen Berbahasa Indonesia. Jurnal Elektronik Ilmu Komputer Universitas Udayana, Vol.1, No.1. [5] Ariyani N.H, Sutardi & Ramadhan R. (2016). Aplikasi Pendeteksi Kemiripan Isi Teks Dokumen Menggunakan Metode Levenshtein distance. semantik, [6] Mulyanto, A. (2010). Analisis Edit Distance Menggunakan Algoritma Dynamic Programming. Saintek, Vol. 5, No.2. [7] Winarsono D, Siahaan O.D & Yuhana U. (2009). Sistem Penilaian Otomatis Kemiripan Kalimat menggunakan Kalimat Syntatic- Semantic Similarity pada System E-learning. Jurnal Ilmiah Kursor, Vol. 5, No.2, KESIMPULAN Berdasarkan dari penelitian yang dilakukan menggunakan metode levenshtein distance untuk mendeteksi similaritas abstrak, maka dapat disimpulkan sebagai berikut : 1 Metode levenshtein distance dapat digunakan untuk mendeteksi kemiripan antar dokumen dengan menghasilkan nilai edit distance yang akan digunakan untuk menghitung presentase kemiripan kedua dokumen tersebut. 2 Hasil perbandingan dari dokumen tersebut menunjukkan nilai similaritas terkecil yaitu 23,45% dan tertinggi 32,72%. 62

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Regular Expression Regular expression atau yang sering disebut sebagai Regex adalah sebuah formula untuk pencarian pola suatu kalimat/string (Kuchling,2002). Sering kali orang

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada bab ini, akan dibahas landasan teori mengenai pendeteksian kemiripan dokumen teks yang mengkhususkan pada pengertian dari keaslian dokumen, plagiarisme, kemiripan dokumen, dan

Lebih terperinci

Implementasi Pencocokan String Tidak Eksak dengan Algoritma Program Dinamis

Implementasi Pencocokan String Tidak Eksak dengan Algoritma Program Dinamis Implementasi Pencocokan String Tidak Eksak dengan Algoritma Program Dinamis Samudra Harapan Bekti 13508075 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,

Lebih terperinci

Aplikasi Pendeteksi Dugaan Awal Plagiarisme Pada Tugas Siswa Dan Mahasiswa Berdasarkan Kemiripan Isi Teks Menggunakan Algoritma Levenshtein Distance

Aplikasi Pendeteksi Dugaan Awal Plagiarisme Pada Tugas Siswa Dan Mahasiswa Berdasarkan Kemiripan Isi Teks Menggunakan Algoritma Levenshtein Distance Aplikasi Pendeteksi Dugaan Awal Plagiarisme Pada Tugas Siswa Dan Mahasiswa Berdasarkan Kemiripan Isi Teks Menggunakan Algoritma Levenshtein Distance Hamidillah Ajie,Agung Surya Bangsa Abstrak Tujuan dari

Lebih terperinci

OPTIMASI QUERY UNTUK PENCARIAN DATA MENGGUNAKAN PENGURAIAN KALIMAT DAN ALGORITME LEVENSHTEIN DISTANCE

OPTIMASI QUERY UNTUK PENCARIAN DATA MENGGUNAKAN PENGURAIAN KALIMAT DAN ALGORITME LEVENSHTEIN DISTANCE OPTIMASI QUERY UNTUK PENCARIAN DATA MENGGUNAKAN PENGURAIAN KALIMAT DAN ALGORITME LEVENSHTEIN DISTANCE M. El Bahar Conoras 1, Aprian Dwi Kurnawan 2 1,2 Magister Teknik Informatika, UNIVERSITAS AMIKOM YOGYAKARTA

Lebih terperinci

Saintek Vol 5, No 2 Tahun 2010 ANALISIS EDIT DISTANCE MENGGUNAKAN ALGORITMA DYNAMIC PROGRAMMING. Arip Mulyanto

Saintek Vol 5, No 2 Tahun 2010 ANALISIS EDIT DISTANCE MENGGUNAKAN ALGORITMA DYNAMIC PROGRAMMING. Arip Mulyanto Saintek Vol 5, No 2 Tahun 2010 ANALISIS EDIT DISTANCE MENGGUNAKAN ALGORITMA DYNAMIC PROGRAMMING Arip Mulyanto Fakultas Teknik Universita Negeri Gorontalo Abstract Edit distance merupakan jumlah minimum

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang teori-teori dan konsep dasar yang mendukung pembahasan dari sistem yang akan dibuat. 2.1. Katalog Perpustakaan Katalog perpustakaan merupakan suatu

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

BAB I PENDAHULUAN Latar belakang

BAB I PENDAHULUAN Latar belakang BAB I PENDAHULUAN Bab ini membahas mengenai garis besar Tugas Akhir yang meliputi latar belakang, tujuan, rumusan dan batasan masalah, metodologi pembuatan tugas akhir, dan sistematika penulisan laporan.

Lebih terperinci

RANCANG BANGUN SISTEM PENYELARASAN KATA BERBAHASA INDONESIA DENGAN MENGGUNAKAN ALGORITMA LEVENSHTEIN DISTANCE

RANCANG BANGUN SISTEM PENYELARASAN KATA BERBAHASA INDONESIA DENGAN MENGGUNAKAN ALGORITMA LEVENSHTEIN DISTANCE RANCANG BANGUN SISTEM PENYELARASAN KATA BERBAHASA INDONESIA DENGAN MENGGUNAKAN ALGORITMA LEVENSHTEIN DISTANCE KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI NI MADE MUNI ADRIYANI NIM. 0808605046 PROGRAM STUDI

Lebih terperinci

Jurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017

Jurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017 TEXT MINING DALAM PENENTUAN KLASIFIKASI DOKUMEN SKRIPSI DI PRODI TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER BERBASIS WEB Teuku Muhammad Johan dan Riyadhul Fajri Program Studi Teknik Informatika Fakultas

Lebih terperinci

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan

Lebih terperinci

APLIKASI PENDETEKSI KEMIRIPAN ISI TEKS DOKUMEN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE

APLIKASI PENDETEKSI KEMIRIPAN ISI TEKS DOKUMEN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE semantik, Vol.2, No.1, Jan-Jun 2016, pp. 279-286 ISSN : 2502-8928 (Online) 279 APLIKASI PENDETEKSI KEMIRIPAN ISI TEKS DOKUMEN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Na firul Hasna Ariyani *1, Sutardi

Lebih terperinci

ANALISIS KINERJA ALGORITMA LEVENSHTEIN DISTANCE DALAM MENDETEKSI KEMIRIPAN DOKUMEN TEKS

ANALISIS KINERJA ALGORITMA LEVENSHTEIN DISTANCE DALAM MENDETEKSI KEMIRIPAN DOKUMEN TEKS Jurnal LOG!K@, Jilid 6, No. 2, 2016, Hal. 131-143 ISSN 1978 8568 ANALISIS KINERJA ALGORITMA LEVENSHTEIN DISTANCE DALAM MENDETEKSI KEMIRIPAN DOKUMEN TEKS B. P. Pratama 1) dan S. A. Pamungkas 2) 1) Program

Lebih terperinci

Bab 2 Tinjauan Pustaka 2.1 Penelitian Terdahulu

Bab 2 Tinjauan Pustaka 2.1 Penelitian Terdahulu Bab 2 Tinjauan Pustaka 2.1 Penelitian Terdahulu Penelitian mengenai penggunaan metode String Matching salah satunya adalah oleh McCulloch dan Pitts pada Finite automata. Finite automata dapat dinyatakan

Lebih terperinci

BAB I PENDAHULUAN. Jiménez-Peris, dkk dalam paper-nya yang berjudul New Technologies in

BAB I PENDAHULUAN. Jiménez-Peris, dkk dalam paper-nya yang berjudul New Technologies in BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan Teknologi dan Informasi telah berkembang sedemikian hebatnya. Kemajuan di bidang komputer dan internet khususnya, semakin mempercepat terjadinya perubahan

Lebih terperinci

PENERAPAN ALGORITMA DISTANCE UNTUK FITUR AUTOCOMPLETE PADA APLIKASI KATALOG PERPUSTAKAAN DI UNIVERSITAS ALMUSLIM

PENERAPAN ALGORITMA DISTANCE UNTUK FITUR AUTOCOMPLETE PADA APLIKASI KATALOG PERPUSTAKAAN DI UNIVERSITAS ALMUSLIM PENERAPAN ALGORITMA DISTANCE UNTUK FITUR AUTOCOMPLETE PADA APLIKASI KATALOG PERPUSTAKAAN DI UNIVERSITAS ALMUSLIM FARHAN a a Jurusan Teknik Informatika Fakultas Ilmu Komputer Universitas Almuslim Jln. Almuslim

Lebih terperinci

SISTEM PENGKOREKSIAN KATA KUNCI DENGAN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Studi Kasus Pada Website Universitas Halmahera.

SISTEM PENGKOREKSIAN KATA KUNCI DENGAN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Studi Kasus Pada Website Universitas Halmahera. SISTEM PENGKOREKSIAN KATA KUNCI DENGAN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Studi Kasus Pada Website Universitas Halmahera Oleh : Benisius Sejumlah penelitian terhadap mesin pencari (search engine)

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Bahasa merupakan alat komunikasi lingual manusia baik secara lisan maupun tulisan. Dalam membuat suatu karya ilmiah, penggunaan Bahasa Indonesia harus sesuai

Lebih terperinci

PENERAPAN FUZZY STRING MATCHING

PENERAPAN FUZZY STRING MATCHING PENERAPAN FUZZY STRING MATCHING PADA APLIKASI PENCARIAN TUGAS AKHIR MAHASISWA JURUSAN SISTEM INFORMASI BERBASIS WEB (Studi Kasus: Fakultas Sains dan Teknologi UIN Suska Riau) 1 Ardi Isbad Amar Gurning,

Lebih terperinci

4 HASIL DAN PEMBAHASAN

4 HASIL DAN PEMBAHASAN 24 4 HASIL DAN PEMBAHASAN 4.1 Data Korpus Data korpus berisi berita-berita nasional berbahasa Indonesia dari tanggal 11 Maret 2002 sampai 11 April 2002. Berita tersebut berasal dari berita online harian

Lebih terperinci

ANALISIS PENGUKURAN SELF PLAGIARISM MENGGUNAKAN ALGORITMA RABIN-KARP DAN JARO-WINKLER DISTANCE DENGAN STEMMING TALA

ANALISIS PENGUKURAN SELF PLAGIARISM MENGGUNAKAN ALGORITMA RABIN-KARP DAN JARO-WINKLER DISTANCE DENGAN STEMMING TALA ANALISIS PENGUKURAN SELF PLAGIARISM MENGGUNAKAN ALGORITMA RABIN-KARP DAN JARO-WINKLER DISTANCE DENGAN STEMMING TALA Jayanta 1), Halim Mahfud 2), Titin Pramiyati 3) 1), 3) Fakultas Ilmu Komputer UPN Veteran

Lebih terperinci

Implementasi Algoritma Levenshtein Pada Sistem Pencarian Judul Skripsi/Tugas Akhir

Implementasi Algoritma Levenshtein Pada Sistem Pencarian Judul Skripsi/Tugas Akhir 46 JURNAL SISTEM DAN INFORMATIKA Implementasi Algoritma Levenshtein Pada Sistem Pencarian Judul Skripsi/Tugas Akhir Ida Bagus Ketut Surya Arnawa STIKOM Bali Jl.Raya Puputan No. 86 Renon, Denpasar-Bali

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa Inggris merupakan salah satu bahasa yang sering digunakan baik pada percakapan sehari-hari maupun pada dunia akademik. Penelitian mengenai pemeriksaan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

IMPLEMENTASI FUZZY SEARCH UNTUK PENDETEKSI KATA ASING PADA DOKUMEN MICROSOFT WORD

IMPLEMENTASI FUZZY SEARCH UNTUK PENDETEKSI KATA ASING PADA DOKUMEN MICROSOFT WORD JURNAL TEKNIK INFORMATIKA VOL 10 NO. 1, APRIL 2017 1 IMPLEMENTASI FUZZY SEARCH UNTUK PENDETEKSI KATA ASING PADA DOKUMEN MICROSOFT WORD Ichsan Taufik 1, Izma Dewi Aishia 2, Jumadi 3 Jurusan Teknik Informatika,

Lebih terperinci

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB I PENDAHULUAN I.1. Latar Belakang Masalah BAB I PENDAHULUAN I.1. Latar Belakang Masalah Dalam era teknologi seperti saat ini, informasi berupa teks sudah tidak lagi selalu tersimpan dalam media cetak seperti kertas. Orang sudah mulai cenderung

Lebih terperinci

IMPLEMENTASI FUZZY SEARCH UNTUK PENDETEKSI KATA ASING PADA DOKUMEN MICROSOFT WORD

IMPLEMENTASI FUZZY SEARCH UNTUK PENDETEKSI KATA ASING PADA DOKUMEN MICROSOFT WORD JURNAL TEKNIK INFORMATIKA, APRIL 2017 1 IMPLEMENTASI FUZZY SEARCH UNTUK PENDETEKSI KATA ASING PADA DOKUMEN MICROSOFT WORD Ichsan Taufik 1, Izma Dewi Aishia 2, Jumadi 3 Jurusan Teknik Informatika, Fakultas

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.

Lebih terperinci

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen

Lebih terperinci

PENGUKURAN SIMILARITAS STRUKTURAL PADA MODEL PROSES BISNIS (STUDI KASUS: ORDER TO CASH DAN PROCURE TO PAY DALAM SISTEM ERP)

PENGUKURAN SIMILARITAS STRUKTURAL PADA MODEL PROSES BISNIS (STUDI KASUS: ORDER TO CASH DAN PROCURE TO PAY DALAM SISTEM ERP) PENGUKURAN SIMILARITAS STRUKTURAL PADA MODEL PROSES BISNIS (STUDI KASUS: ORDER TO CASH DAN PROCURE TO PAY DALAM SISTEM ERP) Ratih Nindyasari Fakultas Teknik, Program Studi Teknik Informatika Universitas

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Pada bab ini akan dibahas mengenai teori-teori yang menjadi landasan untuk penelitian model phonetic similarity bahasa Indonesia. 2.1. Phonetic similarity Phonetic similarity secara

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 Edisi... Volume..., Bulan 20.. ISSN :

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 Edisi... Volume..., Bulan 20.. ISSN : Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 PENGEMBANGAN KOREKSI ESAI OTOMATIS PADA ELEARNING DI SMK PLUS ANNABA SUKABUMI DENGAN MENGGUNAKAN METODE LATENT SEMANTYC ANALYSIS (LSA) Mashun Sofyan

Lebih terperinci

BAB 2 LANDASAN TEORI. 2.1 Pengertian Text Mining

BAB 2 LANDASAN TEORI. 2.1 Pengertian Text Mining 13 BAB 2 LANDASAN TEORI 2.1 Pengertian Text Mining Text Mining dapat juga diartikan sebagai penambangan data berupa teks yang bersumber dari dokumen untuk mencari karta-kata yang merupakan perwakilan isi

Lebih terperinci

II. TEORI DASAR. Kata Kunci levenshtein; program dinamis; edit distance; twitter

II. TEORI DASAR. Kata Kunci levenshtein; program dinamis; edit distance; twitter Aplikasi Program Dinamis dalam Menoleransi Kata Kunci dengan Algoritma untuk Disposisi Tweets ke Dinas-Dinas dan Instansi di Bawah Pemerintah Kota Bandung Ade Yusuf Rahardian - 151079 Program Studi Teknik

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Di dalam dunia pemrograman komputer, kode program (source code) adalah kumpulan deklarasi atau pernyataan dari bahasa pemrograman computer yang di tulis dan bisa dibaca

Lebih terperinci

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 10, Oktober 2017, hlm. 1082-1088 http://j-ptiik.ub.ac.id Analisis Sentimen Pada Ulasan Aplikasi Mobile Menggunakan

Lebih terperinci

APLIKASI STATISTIK PENDETEKSIAN PLAGIARISME DOKUMENT TEXT DENGAN ALGORITMA RABIN KARP

APLIKASI STATISTIK PENDETEKSIAN PLAGIARISME DOKUMENT TEXT DENGAN ALGORITMA RABIN KARP APLIKASI STATISTIK PENDETEKSIAN PLAGIARISME DOKUMENT TEXT DENGAN ALGORITMA RABIN KARP Dedi Leman 1, Gunadi Widi Nurcahyo 2, Sarjon Defit 3 Teknik Informasi, Magister Komputer, Universitas Putra Indonesia

Lebih terperinci

Penggunaan Algoritma Greedy untuk menyelesaikan Permainan Othello

Penggunaan Algoritma Greedy untuk menyelesaikan Permainan Othello Penggunaan Algoritma Greedy untuk menyelesaikan Permainan Othello Annisa Muzdalifa - 13515090 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha

Lebih terperinci

Penerapan Algoritma Program Dinamis Dalam Fitur Koreksi Kata Otomatis Pada Aplikasi Pesan

Penerapan Algoritma Program Dinamis Dalam Fitur Koreksi Kata Otomatis Pada Aplikasi Pesan Penerapan Algoritma Program Dinamis Dalam Fitur Koreksi Kata Otomatis Pada Aplikasi Pesan Alif Raditya Rochman (13511013) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut

Lebih terperinci

BAB I PENDAHULUAN. karya tulis. Berbagai aplikasi seperti Ms. Word, Notepad, maupun Open Office

BAB I PENDAHULUAN. karya tulis. Berbagai aplikasi seperti Ms. Word, Notepad, maupun Open Office BAB I PENDAHULUAN 1.1 Latar Belakang Seiring dengan perkembangan teknologi, maka kegunaan komputer dirasa makin besar. Komputer berperan penting dalam mempermudah pekerjaan sehari hari. Salah satu manfaat

Lebih terperinci

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma

Lebih terperinci

IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE

IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE Novario Jaya Perdana 1, Diana Purwitasari 2 Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

PERANCANGAN SISTEM PENDETEKSI PLAGIARISME TERHADAP TOPIK PENELITIAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN MODEL BAYESIAN

PERANCANGAN SISTEM PENDETEKSI PLAGIARISME TERHADAP TOPIK PENELITIAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN MODEL BAYESIAN PERANCANGAN SISTEM PENDETEKSI PLAGIARISME TERHADAP TOPIK PENELITIAN MENGGUNAKAN METODE K-MEANS CLUSTERING DAN MODEL BAYESIAN Mufti Ari Bianto 1), Siti Rahayu 2), Miftahul Huda 3) ), Kusrini 4) 1), 2),3),4)

Lebih terperinci

Penerapan Algoritma Boyer Moore-Dynamic Programming untuk Layanan Auto-Complete dan Auto-Correct

Penerapan Algoritma Boyer Moore-Dynamic Programming untuk Layanan Auto-Complete dan Auto-Correct Penerapan Algoritma Boyer Moore-Dynamic Programming untuk Layanan Auto-Complete dan Auto-Correct Christabella Chiquita B. - 13509050 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika

Lebih terperinci

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK F.13 TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK Bania Amburika 1*,Yulison Herry Chrisnanto 1, Wisnu Uriawan 2 1 Jurusan Informatika, Fakultas MIPA, Universitas

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Seiring dengan perkembangan zaman, perusahaanperusahaan dan sekolah ataupun universitas yang ada di Indonesia juga mengalami perkembangan. Hal ini dialami oleh perusahaan

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB III ANALISIS DAN PERANCANGAN SISTEM BAB III ANALISIS DAN PERANCANGAN SISTEM Pada pengembangan suatu sistem diperlukan analisis dan perancangan sistem yang tepat, sehingga proses pembuatan sistem dapat berjalan dengan lancar dan sesuai seperti

Lebih terperinci

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB Abdul Rokhim 1), Achmad ainul yaqin 2) 1) Program Studi/Prodi

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Terdapat tiga tahapan utama dalam penelitian ini. Ketiga tahapan tersebut yaitu, pembentukan klaster data SMS, pembentukan model klasifikasi, serta implementasi model klasifikasi

Lebih terperinci

BAB 2. TINJAUAN PUSTAKA

BAB 2. TINJAUAN PUSTAKA BAB 2. TINJAUAN PUSTAKA 2.1. Penelitian yang Mendahului Penulis mencermati berbagai penelitian terkait dengan analisis similaritas, seperti diurai pada beberapa paragraf berikut. Bao, et al. (2007) membandingkan

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

BAB I PENDAHULUAN. dengan mudah diduplikasi (Schleimer, Wilkerson, & Aiken, 2003). Dengan

BAB I PENDAHULUAN. dengan mudah diduplikasi (Schleimer, Wilkerson, & Aiken, 2003). Dengan BAB I PENDAHULUAN 1.1 Latar Belakang Semakin berkembangnya teknologi informasi saat ini, dokumen digital dapat dengan mudah diduplikasi (Schleimer, Wilkerson, & Aiken, 2003). Dengan mudahnya duplikasi

Lebih terperinci

dimana P(A B) artinya peluang A jika diketahui keadaan B. Kemudian dari persamaan 2.1 didapatkan persamaan 2.2.

dimana P(A B) artinya peluang A jika diketahui keadaan B. Kemudian dari persamaan 2.1 didapatkan persamaan 2.2. 1.1 Naive Bayes Classifier Naive bayes classifier merupakan salah satu metode machine learning yang dapat digunakan untuk klasifikasi suatu dokumen. Teorema bayes berawal dari persamaan 2.1, yaitu: (2.1)

Lebih terperinci

Jurnal Coding, Sistem Komputer Untan Volume 04, No.1 (2016), hal ISSN : x

Jurnal Coding, Sistem Komputer Untan Volume 04, No.1 (2016), hal ISSN : x APLIKASI PENDETEKSI PLAGIAT TERHADAP KARYA TULIS BERBASIS WEB MENGGUNAKAN NATURAL LANGUAGE PROCESSING DAN ALGORITMA KNUTH-MORRIS-PRATT [1] Rio Alamanda, [2] Cucu Suhery, [3] Yulrio Brianorman [1][2][3]

Lebih terperinci

2 TINJAUAN PUSTAKA. 2.1 Peringkasan Teks

2 TINJAUAN PUSTAKA. 2.1 Peringkasan Teks 4 2 TINJAUAN PUSTAKA 2.1 Peringkasan Teks Peringkasan teks adalah proses pemampatan teks sumber ke dalam versi lebih pendek namun tetap mempertahankan informasi yang terkandung didalamnya (Barzilay & Elhadad

Lebih terperinci

PENENTUAN PENANGANAN KERUSAKAN MESIN PRODUKSI RESLETING DI PT. HERO TOP ZIP MENGGUNAKAN CASE BASED REASONING DAN SORENSEN COEFFICIENT

PENENTUAN PENANGANAN KERUSAKAN MESIN PRODUKSI RESLETING DI PT. HERO TOP ZIP MENGGUNAKAN CASE BASED REASONING DAN SORENSEN COEFFICIENT Penentuan Penanganan Kerusakan Mesin Produksi Resleting (Prakasa dkk.) PENENTUAN PENANGANAN KERUSAKAN MESIN PRODUKSI RESLETING DI PT. HERO TOP ZIP MENGGUNAKAN CASE BASED REASONING DAN SORENSEN COEFFICIENT

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Analisa Masalah Pemilihan dosen pembimbing Tugas Akhir pada jurusan Teknik Informatika Universitas Muhammadiyah Malang dilakukan mahasiswa secara mandiri, hal

Lebih terperinci

Rancang Bangun Aplikasi Deteksi Kemiripan Dokumen Teks Menggunakan Algoritma Ratcliff/Obershelp

Rancang Bangun Aplikasi Deteksi Kemiripan Dokumen Teks Menggunakan Algoritma Ratcliff/Obershelp Rancang Bangun Aplikasi Deteksi Kemiripan Dokumen Teks Menggunakan Algoritma Ratcliff/Obershelp Yudhy Lady Joane, Alicia Sinsuw, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi 120216101@student.unsrat.ac.id,

Lebih terperinci

APLIKASI PENDETEKSI KEMIRIPANPADA DOKUMEN MENGGUNAKAN ALGORITMA RABIN KARP

APLIKASI PENDETEKSI KEMIRIPANPADA DOKUMEN MENGGUNAKAN ALGORITMA RABIN KARP APLIKASI PENDETEKSI KEMIRIPANPADA DOKUMEN MENGGUNAKAN ALGORITMA RABIN KARP Inta Widiastuti 1, Cahya Rahmad 2, Yuri Ariyanto 3 1,2 Jurusan Elektro, Program Studi Teknik Informatika, Politeknik Negeri Malang

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

BAB I PENDAHULUAN. Perkembangan teknologi komputer yang semakin canggih, membuat para ahli

BAB I PENDAHULUAN. Perkembangan teknologi komputer yang semakin canggih, membuat para ahli BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi komputer yang semakin canggih, membuat para ahli komputer berkeinginan menciptakan komputer yang berkemampuan hampir sama dengan otak

Lebih terperinci

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI BAB III LANDASAN TEORI 3.1. Sistem Sistem adalah kumpulan obyek-obyek yang saling berinteraksi dan bekerja bersama-sama untuk mencapai tujuan tertentu dalam lingkungan yang komplek (Andoko, 2013). Maksud

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

Penerapan Algoritma Program Dinamis pada Penyejajaran Sekuens dengan Algoritma Smith Waterman

Penerapan Algoritma Program Dinamis pada Penyejajaran Sekuens dengan Algoritma Smith Waterman Penerapan Algoritma Program Dinamis pada Penyejajaran Sekuens dengan Algoritma Smith Waterman Afif Bambang Prasetia (13515058) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut

Lebih terperinci

BAB I PENDAHULUAN. Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan

BAB I PENDAHULUAN. Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan BAB I PENDAHULUAN 1.1 Latar Belakang Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan sebuah sistem penilaian atau evaluasi. Penilaian adalah suatu proses untuk mengambil keputusan dengan

Lebih terperinci

APLIKASI WEB PENGUJIAN KESERUPAAN XML DENGAN METODA EDIT DISTANCE

APLIKASI WEB PENGUJIAN KESERUPAAN XML DENGAN METODA EDIT DISTANCE APLIKASI WEB PENGUJIAN KESERUPAAN XML DENGAN METODA EDIT DISTANCE 1 Heni Novianti 2 Lintang Yuniar Banowosari. 1,2 Universitas Gunadarma Jl. Margonda Raya No. 100 Pondok Cina Depok Indonesia cowzy_heni@yahoo.com,

Lebih terperinci

PETUNJUK MANUAL SIAP HUKUM UNTUK SKPD

PETUNJUK MANUAL SIAP HUKUM UNTUK SKPD PETUNJUK MANUAL SIAP HUKUM UNTUK SKPD A. TAHAPAN PENGAJUAN KEPUTUSAN BUPATI BARU 1. Login aplikasi sesuai akun terdaftar. - Setelah membuka halaman siaphukum.indramayukab.go.id klik menu login. - Masukkan

Lebih terperinci

Penerapan Algoritma Pattern Matching untuk Mengidentifikasi Musik Monophonic

Penerapan Algoritma Pattern Matching untuk Mengidentifikasi Musik Monophonic Penerapan Algoritma Pattern Matching untuk Mengidentifikasi Musik Monophonic Fahziar Riesad Wutono (13512012) 1 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi

Lebih terperinci

Jurnal Informatika dan Komputer PENS

Jurnal Informatika dan Komputer PENS Jurnal Informatika dan Komputer PENS www.jurnalpa.eepis-its.edu Teknik Komputer Vol.2, No.2, 2015 Politeknik Elektronika Negeri Surabaya Aplikasi Pendeteksi Kemiripan Laporan Menggunakan Text Mining dan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kemajuan teknologi informasi dan komunikasi tidak hanya membawa dampak positif, tetapi juga membawa dampak negatif, salah satunya adalah tindakan plagiarisme (Kharisman,

Lebih terperinci

Penerapan String Suggestion dengan Algoritma Levenshtein Distance dan Alternatif Algoritma Lain dalam Aplikasi

Penerapan String Suggestion dengan Algoritma Levenshtein Distance dan Alternatif Algoritma Lain dalam Aplikasi Penerapan String Suggestion dengan Algoritma Levenshtein Distance dan Alternatif Algoritma Lain dalam Aplikasi Fatardhi Rizky Andhika 13508092 Program Studi Teknik Informatika Sekolah Teknik Elektro dan

Lebih terperinci

Algoritma Brute Force dalam Pattern Matching pada Aplikasi Pendeteksian Potongan Citra

Algoritma Brute Force dalam Pattern Matching pada Aplikasi Pendeteksian Potongan Citra Algoritma Brute Force dalam Pattern Matching pada Aplikasi Pendeteksian Potongan Citra Ananta Pandu Wicaksana 13510077 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi

Lebih terperinci

APLIKASI PENDETEKSI PLAGIARISME TUGAS DAN MAKALAH PADA SEKOLAH MENGGUNAKAN ALGORITMA RABIN KARP

APLIKASI PENDETEKSI PLAGIARISME TUGAS DAN MAKALAH PADA SEKOLAH MENGGUNAKAN ALGORITMA RABIN KARP Versi Online: https://journal.ubm.ac.id/index.php/alu Vol.I (No. 1 ) : 12-17. Th. 2018 ISSN: 2620-620X APLIKASI PENDETEKSI PLAGIARISME TUGAS DAN MAKALAH PADA SEKOLAH MENGGUNAKAN ALGORITMA RABIN KARP Plagiarisme

Lebih terperinci

1.5 Metode Penelitian

1.5 Metode Penelitian BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam perkembangan teknologi internet yang semakin maju ini kita dapat mengakses dokumen, buku dan majalah mulai dari bahasa asing sampai bahasa daerah yang

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

BAB 3 PENGENALAN WAJAH

BAB 3 PENGENALAN WAJAH 28 BAB 3 PENGENALAN WAJAH DENGAN PENGENALAN DIMENSION WAJAH BASED DENGAN FNLVQ DIMENSION BASED FNLVQ Bab ini menjelaskan tentang pemodelan data masukan yang diterapkan dalam sistem, algoritma FNLVQ secara

Lebih terperinci

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency PERSETUJUAI\ ARTIKEL ILMIAH Artikel ilmiah hasil penelitian mahasiswa: Nama NIM Mashar Eka Putra Dai 53 1409036 Program Studi S1-Sistem Informasi Jurusan Teknik Informatika Fakultas Teknik Judul Karya

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen

Lebih terperinci

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL Nur Rosyid M, Entin Martiana, Damitha Vidyastana, Politeknik Elektronika

Lebih terperinci

Analisis Sentimen Tentang Opini Film Pada Dokumen Twitter Berbahasa Indonesia Menggunakan Naive Bayes Dengan Perbaikan Kata Tidak Baku

Analisis Sentimen Tentang Opini Film Pada Dokumen Twitter Berbahasa Indonesia Menggunakan Naive Bayes Dengan Perbaikan Kata Tidak Baku Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 12, Desember 2017, hlm. 1733-1741 http://j-ptiik.ub.ac.id Analisis Sentimen Tentang Opini Film Pada Dokumen Twitter

Lebih terperinci

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

PEMBUATAN SPELLING- CHECKER UNTUK BAHASA INDONESIA DENGAN JAVA 2 STANDARD EDITION

PEMBUATAN SPELLING- CHECKER UNTUK BAHASA INDONESIA DENGAN JAVA 2 STANDARD EDITION PEMBUATAN SPELLING- CHECKER UNTUK BAHASA INDONESIA DENGAN JAVA 2 STANDARD EDITION Gede Esa Deva Atmajaya, 50404083 Mahasiswa Sarjana Strata Satu (S1) Teknik Informatika Universitas Gunadarma Jln. Margonda

Lebih terperinci

IV. RANCANG BANGUN SISTEM. Perangkat lunak bantu yang dibuat adalah perangkat lunak yang digunakan untuk

IV. RANCANG BANGUN SISTEM. Perangkat lunak bantu yang dibuat adalah perangkat lunak yang digunakan untuk IV. RANCANG BANGUN SISTEM 4.1 Analisis dan Spesifikasi Sistem Perangkat lunak bantu yang dibuat adalah perangkat lunak yang digunakan untuk menyisipkan label digital, mengekstraksi label digital, dan dapat

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)

Lebih terperinci

Pembuatan Program Aplikasi untuk Pendeteksian Kemiripan Dokumen Teks dengan Algoritma Smith-Waterman

Pembuatan Program Aplikasi untuk Pendeteksian Kemiripan Dokumen Teks dengan Algoritma Smith-Waterman Pembuatan Program Aplikasi untuk Pendeteksian Kemiripan Dokumen Teks dengan Algoritma Smith-Waterman Farid Thalib 1 dan Ratih Kusumawati 2 1 Laboratorium Sistem Komputer, Universitas Gunadarma, Depok -

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis

Lebih terperinci

Oleh: ARIF DARMAWAN NIM

Oleh: ARIF DARMAWAN NIM APLIKASI PENGKLASIFIKASIAN DOKUMEN INFO PADA TWITTER MENGGUNAKAN ALGORITMA NAIVE BAYES TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

Aplikasi String Matching Pada Fitur Auto-Correct dan Word-Suggestion

Aplikasi String Matching Pada Fitur Auto-Correct dan Word-Suggestion Aplikasi String Matching Pada Fitur Auto-Correct dan Word-Suggestion Johan - 13514206 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10

Lebih terperinci

BAB I PENDAHULUAN. berinovasi menciptakan suatu karya yang original. Dalam hal ini tindakan negatif

BAB I PENDAHULUAN. berinovasi menciptakan suatu karya yang original. Dalam hal ini tindakan negatif 1 BAB I PENDAHULUAN I.1 Latar Belakang Pada dasarnya manusia menginginkan kemudahan Dalam segala hal. Sifat tersebut akan memicu tindakan negatif apabila dilatarbelakangi oleh motivasi untuk berbuat curang

Lebih terperinci