BAB II TINJAUAN PUSTAKA. seolah-olah karya orang lain tersebut adalah karya kita dan mengakui hasil

dokumen-dokumen yang mirip
PENERAPAN ALGORITMA SMITH-WATERMAN DALAM SISTEM PENDETEKSI KESAMAAN DOKUMEN. Intisari

PENDETEKSIAN PLAGIARISME PADA DOKUMEN TEKS DENGAN MENGGUNAKAN ALGORITMA SMITH-WATERMAN SKRIPSI AUDI NOVANTA

BAB 1 PENDAHULUAN. Seiring dengan perkembangan teknologi yang begitu pesat, manusia semakin

Pembuatan Program Aplikasi untuk Pendeteksian Kemiripan Dokumen Teks dengan Algoritma Smith-Waterman

BAB I PENDAHULUAN. berinovasi menciptakan suatu karya yang original. Dalam hal ini tindakan negatif

BAB II TINJAUAN LITERATUR. Kata plagiarisme berasal dari kata latin yaitu plagiarius yang berarti

BAB I PENDAHULUAN. pendapat, dan sebagainya dari orang lain dan menjadikannya seolah karangan dan

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN. penjiplakan suatu tulisan. Neville (2010) dalam buku The Complete Guide to

BAB I PENDAHULUAN. Hadirnya teknologi informasi berdampak pada banyak sektor, termasuk

BAB I PENDAHULUAN. terjadi diberbagai kalangan. Dalam Kamus Besar Bahasa Indonesia, definisi

BAB 1 PENDAHULUAN. Universitas Kristen Maranatha

BAB IV HASIL DAN UJI COBA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Pemanfaatan teknologi pada era globalisasi telah menjadi satu hal yang

BAB I PENDAHULUAN 1.1. Latar Belakang

DYNAMMIC PROGRAMMING DALAM MENENTUKAN ARTI URUTAN UNTAIAN GEN

Penerapan Algoritma Program Dinamis pada Penyejajaran Sekuens dengan Algoritma Smith Waterman

Bab 1 Pendahuluan 1.1 Latar Belakang

BAB III ANALISA MASALAH DAN PERANCANGAN PROGRAM

PERBANDINGAN ALGORITMA WINNOWING DENGAN ALGORITMA RABIN KARP UNTUK MENDETEKSI PLAGIARISME PADA KEMIRIPAN TEKS JUDUL SKRIPSI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Jiménez-Peris, dkk dalam paper-nya yang berjudul New Technologies in

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Sistem Deteksi Kemiripan antar Dokumen Teks Menggunakan Model Bayesian pada Term Latent Semantic Analysis (LSA)

ANALISIS PENGUKURAN SELF PLAGIARISM MENGGUNAKAN ALGORITMA RABIN-KARP DAN JARO-WINKLER DISTANCE DENGAN STEMMING TALA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

OPTIMASI QUERY UNTUK PENCARIAN DATA MENGGUNAKAN PENGURAIAN KALIMAT DAN ALGORITME LEVENSHTEIN DISTANCE

IMPLEMENTASI ALGORITMA RABIN-KARP UNTUK MENDETEKSI DUGAAN PLAGIARISME BERDASARKAN TINGKAT KEMIRIPAN KATA PADA DOKUMEN TEKS

Bab 3 Metoda dan Perancangan Sistem

BAB III METODOLOGI. III.1 Acuan Pengembangan Program

APLIKASI STATISTIK PENDETEKSIAN PLAGIARISME DOKUMENT TEXT DENGAN ALGORITMA RABIN KARP

ARSITEKTUR UNTUK APLIKASI DETEKSI KESAMAAN DOKUMEN BAHASA INDONESIA

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

Deteksi Plagiarisme Gambar menggunakan Algoritma Pencocokan Pola Rabin-Karp

BUKU PANDUAN PENCEGAHAN DAN PENANGGULANGAN PLAGIARISME. Disusun Oleh : TIM LPPM

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

ETIKA DAN KODE ETIK PENULISAN ILMIAH. Oleh : Achmad Arifin, M.Eng [Editor JPTK]

Implementasi Algoritma Jaro-Winkler Distance Untuk Sistem Pendeteksi Plagiarisme Pada Dokumen Skripsi

BAB 3 METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. yang dikenal sebagai antarmuka pengguna grafis atau Graphical User Interface. yakni ucapan, untuk meningkatkan kemudahannya.

BAB I PENDAHULUAN. yang cepat sangat berpengaruh terhadap gaya hidup manusia. Pertukaran

BAB III ANALISA DAN PERANCANGAN

Bab 1 PENDAHULUAN Latar Belakang Masalah

PERANCANGAN SISTEM PENENTUAN SIMILARITY KODE PROGRAM PADA BAHASA C DAN PASCAL DENGAN MENGGUNAKAN ALGORITMA RABIN-KARP

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PANDUAN PENCEGAHAN PLAGIARISME UNIVERSITAS PENDIDIKAN INDONESIA

Implementasi Pencocokan String Tidak Eksak dengan Algoritma Program Dinamis

KATA PENGANTAR. Ungaran, Desember Ketua LPPM UNW. Sigit Ambar Widyawati, S.KM,M.Kes

UKDW. Bab 1 PENDAHULUAN

BAB 2 LANDASAN TEORI

PERANCANGAN APLIKASI PENCARIAN ISI FILE YANG SAMA PADA HARDISK DRIVE DENGAN ALGORITMA STRING MATCHING

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Tips 4: Ingat Syarat Buku Bermutu

BAB 2 LANDASAN TEORI. Istilah komputer (computer) berasal dari bahasa latin computere yang berarti

PERBANDINGAN PENDEKATAN DETEKSI PLAGIARISM DOKUMEN DALAM BAHASA INGGRIS. ABSTRAK

BAB I PENDAHULUAN I.1. Latar Belakang [1] [2] [3] [4] [5]

IV. RANCANG BANGUN SISTEM. Perangkat lunak bantu yang dibuat adalah perangkat lunak yang digunakan untuk

BAB 1 PENDAHULUAN Latar Belakang

SISTEM PENGUKUR KEMIRIPAN DOKUMEN MENGGGUNAKAN ALGORITMA JARO-WINKLER DISTANCE

BAB 2 LANDASAN TEORI. Istilah komputer ( computer ) berasal dari bahasa latin computere yang berarti

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV HASIL DAN PEMBAHASAN

BAB III ANALISIS DAN PERANCANGAN SISTEM. Analisis sistem bertujuan untuk mengidentifikasi permasalahan

Analisis Algoritma Knuth Morris Pratt dan Algoritma Boyer Moore dalam Proses Pencarian String

IMPLEMENTASI DETEKSI PENJIPLAKAN DENGAN ALGORITMA WINNOWING PADA DOKUMEN TERKELOMPOK

Tugas II IF211 Strategi Algoritma. Penyusunan Rencana Kuliah dengan Memanfaatkan DFS dan BFS

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang Masalah

Komputer & Software Semester Ganjil 2014 Fak. Teknik Jurusan Teknik Informatika.

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. orang lain. Tuntutan keamanan menjadi semakin kompleks, apalagi bila data itu dikirimkan, dan

BAB III METODOLOGI PENELITIAN

PERBANDINGAN FORMULA GUNNING FOG INDEKS DAN FLESCH LEVEL PADA UJI KETERBACAAN TEKS. Debyo Saptono 1 Tri Wahyu Retno Ningsih 2. Universitas Gunadarma

BAB 1 PENDAHULUAN Latar Belakang

BAB 2 LANDASAN TEORI

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 1, No. 2, Tahun

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. digunakan untuk mengamankan data ada bermacam-macam. Setiap metode

BAB V PENUTUP 5.1. KESIMPULAN. Praktik jurnalisme kloning kini menjadi kian populer dan banyak

Deteksi Otomatis Plagiarisme Source Code

Visual Basic 6.0 For Beginners

Standar Kompetensi Operator Komputer

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

APLIKASI PENDETEKSI PLAGIARISME TUGAS DAN MAKALAH PADA SEKOLAH MENGGUNAKAN ALGORITMA RABIN KARP

Implementasi Algoritma Gunning Fog Index Pada Uji Keterbacaan (Readability Test) Bahasa Indonesia Menggunakan Bahasa Pemrograman Python

Algoritma Pemrograman A

BAB II LANDASAN TEORI

Jurnal Coding, Sistem Komputer Untan Volume 04, No.1 (2016), hal ISSN : x

BAB I PENDAHULUAN Latar belakang

Transkripsi:

BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Plagiarisme Ada beberapa definisi menurut para ahli lainnya (dalam Novanta, 2009), yaitu : 1. Menurut Ir. Balza Achmad, M.Sc.E, plagiarisme adalah berbuat sesuatu seolah-olah karya orang lain tersebut adalah karya kita dan mengakui hasil karya tersebut adalah milik kita, 2. Menurut Brotowidjoyo, plagiarisme merupakan pembajakan berupa fakta, penjelasan, ungkapan, dan kalimat orang lain secara tidak sah. Di Indonesia perlindungan hak cipta diatur dalam Undang-Undang Republik Indonesia Nomor 19 Tahun 2002 Tentang Hak Cipta. Oleh karena itu kegiatan plagiarisme atau yang lebih dikenal dengan kata plagiat harus dihindari. Di Indonesia sendiri, pelanggaran hak cipta bisa terjadi dimana saja, mulai dari pelanggaran hak cipta lagu, hak cipta perangkat lunak (software), dan lain-lain. Dari salah satu berita yang diterbitkan kompas pada tanggal 11 Juli 2012 menyebutkan bahwa Indonesia berada di peringkat ke-11 Negara yang melakukan pembajakan software. Dari hal ini patutnya kita sebagai warga Negara Indonesia harus menyadari bahwa jangan sampai kita berada di peringkat tertinggi dalam pelanggaran hak cipta karya yang sebenarnya dimiliki oleh orang lain. 4

Menurut Novian, dkk. (2012), terdapat beberapa jenis plagiat yang dikenal selama ini, yaitu : 1. Word-of-word plagiarism : menyalin setiap kata secara langsung tanpa diubah sedikitpun. 2. Plagiarism of the form of a source : menyalin dan atau menulis ulang kodekode program tanpa mengubah struktur dan jalannya program. 3. Plagiarism of authorship : mengakui hasil karya orang lain sebagai hasil karya sendiri dengan mencantumkan nama sendiri menggantikan nama pengarang sebenarnya. Beberapa contoh praktik plagiat pada sebuah program yang dikemukakan oleh Novian, dkk. (2012), yaitu : 1. Leksikal : perubahan pada kode (source code) program, misalnya : 1. Komentar diubah (ditambah, dikurangi, atau diganti) 2. Format penulisan diubah 3. Nama variabel diubah 2. Struktural : perubahan struktur program 1. Perubahan urutan algoritma yang tidak mengubah jalannya program. 2. Prosedur diubah menjadi fungsi atau sebaliknya. 3. Pemanggilan prosedur diganti dengan isi prosedur itu sendiri. 5

2.1.1.1. Bentuk Plagiarisme Dalam (Novanta, 2009), bentuk-bentuk plagiarisme yang sering terjadi di dunia akademis berdasarkan artikel Clough adalah : 1. Plagiarisme kata per kata, merupakan penyalinan kalimat secara langsung dari sebuah dokumen teks tanpa adanya pengutipan atau perizinan. 2. Plagiarisme paraphrase, merupakan penulisan ulang dengan mengubah kata atau sintaksis, tetapi teks aslinya masih dapat dikenali. 3. Plagiarisme sumber sekunder, merupakan perbuatan mengutip kepada sumber asli yang didapat dari sumber sekunder dengan menghiraukan teks asli dari sumber yang sebenarnya. 4. Plagiarisme struktur sumber, merupakan penyalinan/penjiplakan struktur suatu argument dari sebuah sumber. 5. Plagiarisme ide, merupakan penggunaan ulang suatu gagasan/pemikiran asli dari sebuah sumber teks tanpa bergantung bentuk teks sumber. 6. Plagiarisme authorship, merupakan pembubuhan nama sendiri secara langsung pada hasil karya orang lain. 2.1.1.2. Identifikasi Plagiarisme Dalam (Novanta, 2009) Beberapa faktor yang dapat digunakan untuk mengidentifikasikan plagiarisme menurut Clough yaitu : 1. Penggunaan kosa kata. Menganalisis kosa kata yang digunakan dalam suatu tugas terhadap penggunaan kosa kata sebelumnya dapat membantu menentukan apakah mahasiswa benar-benar telah menulis teks tersebut. Dengan menemukan 6

suatu kosa kata baru dalam jumlah yang besar (terutama kosa kata lanjut) dapat menentukan apakah mahasiswa menulis teks tanpa melakukan plagiarisme. 2. Perubahan kosa kata Apabila penggunaan kosa kata berubah secara significant dalam suatu teks, hal ini dapat mengindikasikan plagiarisme dengan cara copy and paste. 3. Teks yang membingungkan. Apabila alur dari suatu teks tidak halus dan tidak konsisten, hal ini mengindikasikan penulis tidak menulis menggunakan pemikirannya sendiri atau beberapa bagian dari tulisannya bukanlah hasil karyanya. 4. Penggunaan tanda baca. Tidak wajar apabila dua orang penulis menggunakan tanda baca yang persis sama dalam membuat suatu karya tulis. 5. Jumlah kemiripan teks. Pasti ada beberapa kemiripan antara beberapa teks yang menulis dengan topik yang sama seperti nama-nama, istilah-istilah dan sebagainya. Bagaimanapun, tidak wajar bila beberapa teks yang berbeda memiliki kesamaan atau kemiripan teks dalam jumlah yang besar. 6. Kesalahan ejaan yang sama. Merupakan hal yang biasa terjadi bagi seseorang penulis dalam membuat suatu karya tulis. Menjadi tidak wajar bila beberapa teks yang berbeda memiliki kesalahan-kesalahan yang sama dalam pengejaan atau jumlah ejaan salah yang sama. 7

7. Distribusi kata-kata. Tidak wajar apabila distribusi penggunaan kata dalam teks yang berbeda memiliki kesamaan. Sebagai contoh, suatu teks memiliki parameter yang sama untuk suatu distribusi statistic yang digunakan untuk menjelaskan penggunaan istilah. 8. Struktur sintaksis teks. Hal ini menunjukkan plagiarisme mungkin saja telah terjadi jika dua teks secara jelas memiliki kesamaan struktur sintaksis. Hal yang wajar bila penggunaan struktur sintaksis yang digunakan oleh beberapa penulis akan berbeda. 9. Rangkaian-rangkaian panjang kata yang sama. Tidak wajar apabila suatu teks yang berbeda (bahkan yang menggunakan judul yang sama) memiliki rangkaian/urutan karakter yang sama. 10. Orde kemiripan antar teks. Hal ini bisa mengindikasikan plagiarisme apabila orde kecocokan kata atau frase antar dua teks sama. Meskipun diajarkan untuk menyajikan fakta-fakta dalam suatu aturan (contohnya pendahuluan, isi, kemudian kesimpulan), kurang wajar jika fakta-fakta yang sama dilaporkan dalam orde yang sama. 11. Ketergantungan pada kata atau frase tertentu. Seorang penulis mungkin memilih penggunaan suatu kata atau frase tertentu. Kekonsistenan penggunaan kata-kata tersebut dalam suatu teks yang ditulis oleh orang lain dengan menggunakan kata yang berbeda dapat mengindikasikan plagiarisme. 8

12. Frekuensi kata. Tidak wajar apabila kata-kata dari dua teks yang berbeda digunakan dengan frekuensi yang sama. 13. Keputusan untuk menggunakan kalimat panjang atau kalimat pendek. Tanpa sepengetahuan kita, para penulis tentu memiliki keputusan penggunaan panjang kalimat yang tidak biasa dikombinasikan dengan fitur-fitur lain. 14. Teks yang dapat dibaca. Penggunaan metrik/ukuran seperti index Gunning FOG, Flesch Reading Ease Formula atau SMOG dapat membantu menentukan suatu skor kemampuan. Tidak wajar apabila penulis yang berbeda akan memiliki skor yang sama. 15. Referensi yang tidak jelas. Apabila referensi yang muncul dalam suatu teks tetapi tidak terdapat pada daftar pustaka, hal ini dapat mengindikasikan plagiarisme cut and paste, dimana penulis tidak menyalin referensinya secara lengkap. 2.1.2. Algoritma Smith-Waterman Menurut artikel yang terdapat dalam situs Wikipedia.org, Algoritma Smith- Waterman merupakan algoritma klasik yang telah dikenal luas dalam bidang bioinformatika sebagai metode yang dapat mengidentifikasi local similarities (penyejajaran sekuens) yaitu proses penyusunan dua local sequences (rangkaian/susunan atau rentetan) nucleotide atau protein sequences sehingga kemiripan antara dua sequence tersebut akan terlihat. Berdasarkan fungsi proses penyejajaran sekuens tersebut, maka algoritma ini dapat dikonversikan ke dalam 9

pemrograman komputer untuk digunakan membantu proses pendeteksian dokumen teks yang dianggap cenderung plagiat dengan cara melihat kesamaan isi (local similarities) dari beberapa dokumen teks. Gambar 2.1. Optimal Alignment Dari Dua Substring Algoritma standar Smith-Waterman yang dipakai untuk penghitungan local alignment berdasarkan dokumen dari situs Baylor College of Medicine HGSC adalah (Novanta, 2009) : 1. Menambahkan sebuah nilai pada setiap perbandingan a. Menggunakan nilai positif, apabila memiliki kemiripan. b. Menggunakan nilai negatif, apabila memiliki perbedaan. 2. Inisialisasi awal matriks dengan nilai 0 (nol). 3. Semua nilai yang terdapat dalam matriks apabila lebih kecil dari 0 (nol), maka nilai dianggap 0 (nol). 4. Memulai traceback dari nilai yang tertinggi yang ditemukan dimanapun pada matriks. A b c b a d b c a A b b d b d a 5. Penghitungan dilanjutkan hingga skor bernilai 0 (nol). 10

Robert W. Irving dalam (Novanta, 2009) merumuskan skema pemrograman dinamis algoritma klasik Smith-Waterman kedalam dua bagian, yaitu : 1. Didefinisikan S ij menjadi nilai maksimun yang didapatkan dari proses perbandingan sebuah substring A pada posisi ke-i dengan sebuah substring B pada posisi ke-j. Hubungan rekurens standar untuk S ij, yaitu : - Jika A(i) = B(j) maka S ij = S i-1, j-1 +h, atau - Jika A(i) B(j) maka S ij = max(0,s i-1, j -d,s i, j-1 -d,s i-1, j-1 -r) - Dimana kondisi awal adalah S i,0 = S 0,j = 0 untuk semua i,j. 2. Digunakan ide traceback path untuk mengkonstruksikan sebuah local alignment yang optimal pada posisi ke-i substring A dan posisi ke-j substring B agar lebih jelas terlihat. Dengan diberikan sel (i,j) dapat didefinisikan sebuah sel parent sebagai berikut : - Jika S ij = 0, maka sel (i,j) tidak mempunyai parent - Jika A(i) = B(j), maka sel (i,j) mempunyai parent sel (i-1,j-1) - Sebagai tambahan, sel (i,j) mempunyai parent yaitu untuk sel (p,q) ϵ {(i- 1,j),(i,j-1)} sehingga S ij = S pq -d, dan/atau sel (i-1,j-1) jika S ij = S i-1,j-1 -r 2.2. Penelitian Terkait Sudah terdapat beberapa penelitian sebelumnya yang sama, yakni mengenai sebuah sistem pendeteksi kesamaan dokumen teks. Penelitian-penelitian tersebut menggunakan berbagai algoritma diantaranya algoritma Rabin-Karp, Smith- Waterman, Brute Force, dan Edit Distance. 11

Penelitian sebelumnya telah dilakukan oleh Novanta (2009) dengan judul Pendeteksian Plagiarisme Pada Dokumen Teks Dengan Menggunakan Algoritma Smith-Waterman. Dari penelitian ini disimpulkan bahwa Algoritma Smith- Waterman memiliki keakuratan yang lebih baik pada saat membandingkan dokumen yang mengandung perubahan struktur kalimat khususnya dalam paragraf ketimbang perubahan struktur kata di dalam kalimat. Akan tetapi sistem ini hanya dapat membaca dokumen dengan tipe file.txt, dan masih belum menggunakan penerapan Graphical User Interface (GUI) dalam antarmuka sistemnya. Penelitian lain mengenai sistem pendeteksi plagiarisme juga telah dilakukan oleh Novian, dkk. (2012), dengan menggunakan algoritma Rabin-Karp. Judul yang digunakan dalam penelitiannya yaitu Aplikasi Pendeteksian Plagiat Pada Karya Ilmiah Menggunakan Algoritma Rabin-Karp. Aplikasi yang dibuat menggunakan Microsoft Visual C++, dan modifikasi dari algoritma pencocokan string Rabin-Karp. Aplikasi yang dibuat mampu membandingkan dokumen dengan data yang besar dalam jumlah yang banyak dan juga menampilkan katakata yang sama dari kedua dokumen yang dibandingkan. Untuk pengembangan sistem yang lebih baik, penulis akan mengembangkan sistem yang menggunakan algoritma Smith-Waterman yang mampu melakukan perbandingan dokumen bukan hanya terbatas pada tipe data.txt, akan tetapi bisa digunakan untuk pembacaan dokumen bertipe.doc,.pdf, dan juga disertai kemampuan untuk menampilkan letak kesamaan dari kedua dokumen. 12