BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Hadirnya teknologi informasi berdampak pada banyak sektor, termasuk sektor pendidikan. Dalam dunia pendidikan, sangatlah diperlukan informasi untuk mendukung pembelajaran. Komputer dan internet bermanfaat sekali untuk pencarian informasi dan informasi yang dihasilkan sangat melimpah (overload). Selain adanya kemudahan dalam pencarian informasi, hadirnya teknologi informasi ternyata juga memiliki dampak negatif. Salah satu dampak negatif yang menghantui dunia pendidikan adalah plagiarism oleh civitas akademika. Plagiat bukan merupakan fenomena baru dalam dunia pendidikan. Sebelum hadirnya teknologi informasi, fenomena plagiat juga telah ada. Namun, hadirnya teknologi informasi secara nyata lebih mempermudah orang untuk melakukan plagiat. Penelitian yang dilakukan oleh (Suwarjo et al. 2012) dalam Ercegovac, Zorana dan Richardson, John V. Jr bahwa perilaku plagiat telah terjadi mulai dari institusi sekolah, perguruan tinggi sampai dengan masyarakat. Pada situasi pembelajaran di kelas, bentuk ketidakjujuran akademis seperti copy paste (menyalin dan menempel telah lazim dilakukan oleh para siswa. Contohnya Youth: Changing Beliefs and Behavour di Negara Amerika menemukan sejumlah 58,3% siswa membiarkan teman lain menyalin tugasnya pada tahun 1969 dan meningkat menjadi 97,5% pada tahun 1989. 1
2 Sebenarnya pemerintah sudah memberikan perhatian serius terkait permasalahan plagiat, seperti dalam (Peraturan Menteri Pendidikan Nasional Republik Indonesia Nomor 17 Tentang Pencegahan dan Penanggulangan Plagiat di Perguruan Tinggi 2010) dan (Undang-Undang Republik Indonesia Nomor 19 Tentang Hak Cipta 2002). Namun pada kenyataannya, tindakan plagiat masih banyak dilakukan di Indonesia dimana tidak hanya melibatkan siswa maupun mahasiswa. Juga melibatkan dosen bahkan mahasiswa yang bergelar doktor. Diungkapkan pada Kompas, 2013 dan Harian seputar Indonesia, 2012 dalam (Suwarjo et al. 2012) yang melaporkan bahwa MZ (salah satu alumni S3 ITB) telah melakukan plagiat terhadap karya Siyka Zlatanova untuk karya disertasinya. Hal ini mengakibatkan gelar doctor tersebut dicabut oleh universitas. Selain itu, Tiga dosen Universitas Pendidikan Indonesia (UPI) diduga melakukan praktik plagiat untuk mengajukan guru besar ke Direktorat Pendidikan Tinggi. Hal ini berdampak pada dosen UPI yang lain, dimana mereka tidak dapat mengajukan guru besar dan semua dosen tidak dapat naik pangkat selama satu tahun. Plagiat akan merusak moral civitas akademika dalam dunia pendidikan. Karena Teknologi Informasi yang seharusnya dapat membantu dalam pencarian informasi ternyata disalahgunakan dalam tindak kriminal (plagiat) berupa mencuri ide/karya orang lain tanpa mencantumkan kutipan. Definisi plagiat diungkapkan oleh Sutherland Smith dalam (Patak 2014) yaitu tindakan mencuri kekayaan intelektual pribadi penulis dan pelanggaran terhadap hak cetak penerbit. Telah banyak langkah yang ditempuh oleh dosen, institusi perguruan tinggi maupun pemerintah untuk meminimalisir tindak plagiat. Selain itu
3 diperlukan software pencegahan dalam meminimalisir tindak plagiat di kalangan masyarakat maupun akademisi dimana nantinya bisa diketahui tingkat kesamaan dokumen dengan tema yang sama. Oleh karena itulah, peneliti membuat aplikasi pendeteksi plagiat dengan menggunakan algoritma Jaro Winkler. Diungkapkan oleh (Kurniawati et al. 2010) bahwa Jaro-Winler merupakan varian Jaro distance metrik yang merupakan algoritma untuk mengukur kesamaan antara dua string, sering digunakan dalam pendeteksian metrik. Ditambahkan pula bahwa string metrik adalah kelas matriks berbasis tekstual yang dapat menghasilkan nilai kesamaan atau ketidaksamaan dari dua teks string untuk proses perbandingan dan penyamaan. Algoritma Jaro ini memiliki kelebihan dari segi waktu. Diungkapkan oleh (Kurniawati et al. 2010) bahwa Algoritma Jaro-Winkler distance memiliki kompleksitas waktu quadratic runtime complexity yang sangat efektif pada string pendek dan dapat bekerja lebih cepat dari algoritma edit distance. Selain itu, algoritma ini juga cocok untuk digunakan untuk perbandingan string singkat. Analisa menggunakan string metrik telah banyak digunakan untuk deteksi kecurangan, fingerprint, deteksi plagiat dan sebagainya. Telah diungkapkan sebelumnya bahwa telah banyak peraturan dan sanksi tentang tindakan plagiat. Namun masih sulit untuk memberikan efek jera karena memang sulit mengungkap pelakunya. Hadirnya teknologi informasi bisa dijadikan sarana untuk mendeteksi kecurangan terhadap karya orang lain. Oleh karena itulah, dalam penelitian ini, penulis membuat sistem mendeteksi kemiripan terhadap dokumen teks. Software ini nantinya diharapkan dapat bermanfaat bagi
4 lembaga informasi dan perpustakaan di lingkungan pendidikan untuk mendeteksi plagiat di kalangannya. 1.2. Rumusan Masalah Berdasarkan pemaparan latar belakang diatas, maka dirumuskan permasalahan penelitian adalah Bagaimanakah membuat sebuah aplikasi yang dapat mendeteksi kemiripan terhadap dokumen teks?. 1.3. Batasan Masalah Adapun batasan masalah yang akan dibahas dalam penelitian ini adalah sebagai berikut : 1. Data yang digunakan merupakan data artikel publikasi koran lokal dan nasional yang diduga melakukan plagiasi maupun tidak. 2. Data yang digunakan merupakan data abstrak tesis mahasiswa MIP UGM. 3. Data yang diolah memiliki format pdf. 4. Pembuatan sistem menerapkan deteksi kemiripan dokumen dengan menggunakan algoritma Jaro-Winkler. 5. Pada proses stemming, kamus yang digunakan adalah KBBI Luring CHM v1.0.
5 1.4. Keaslian Penelitian Penelitian-penelitian yang berkaitan dengan konsep deteksi plagiasi sudah pernah dilaksanakan oleh peneliti-peneliti sebelumnya, tetapi cangkupan dan spesifikasi yang berbeda-beda. Penelitian tersebut antara lain : 1. (Nugroho 2011) melaksanakan penelitian tentang perancangan sistem deteksi plagiasi dokumen teks dengan menggunakan algoritma rabinkarp. Penelitian tersebut melakukan pencocokan string/terms untuk melakukan deteksi plagiasi dokumen teks. 2. (M. Isa and Fuadi Abidin 2013) meneliti tingkat kesamaan paragraf menggunakan vector space model untuk mendeteksi plagiasi. Peneliti menentukan similaritas dokumen dilakukan dengan memecah dokumen menjadi paragraph-paragraf. Penelitian tersebut menggunakan query satu kata, dua kata dan tiga kata memperlihatkan bahwa pasangan paragraf dengan similaritas tinggi lebih banyak ditemukan dalam dokumen. 3. Penelitian penentuan tingkat plagiasi dokumen penelitian menggunakan centroid linkage hierarchical method (CLHM) dilakukan oleh (Irianto et al. 2014) dengan mengelompokkan dokumen berdasarkan kemiripan topik pada abstraksi dokumen penelitian. Pengelompokkan dokumen berdasarkan kemiripannya menggunakan hill climbing dan perhitungan prosentase kemiripan pada sistem menggunakan cosine similarity.
6 4. Perancangan sistem deteksi plagiasi dokumen teks menggunakan algoritma Damerau Levenshtein Distance diteliti oleh (Christian et al. 2014) sebagai algoritma string matching dengan pola word-for-word plagiasi. Peneliti membandingkan penggunaan string matching Damerau Levenshtein distance dan Levenshtein distance serta pengaruh stemming menggunakan algoritma confix stripping. 5. (Novanta 2008) melakukan penelitian mendeteksi plagiasi pada dokumen teks dengan menggunakan Algoritma Smith-Waterman. Penelitian ini membantu mendeteksi tindakan plagiat dengan memberikan sugesti kepada pengguna berupa bobot atau nilai kemiripan dan kesamaan sekuens dari dua dokumen yang dibandingkan. 1.5. Tujuan Penelitian Tujuan dari penelitian ini adalah untuk mengembangkan sebuah sistem untuk mendeteksi kemiripan dokumen teks. 1.6. Manfaat Penelitian Manfaat yang diharapkan dari penelitian ini adalah sebagai berikut: 1. Sistem ini diharapkan dapat membantu sebagai bahan pertimbangan dalam melakukan pendeteksian plagiasi. 2. Sistem ini diharapkan dapat memberikan penentuan presentase kemiripan antara dokumen yang diuji dengan dokumen aslinya.
7 1.7. Sistematika Penulisan BAB I PENDAHULUAN Bab ini merupakan gambaran umum tentang penelitian yang akan dilaksanakan. Bagian-bagian yang merupakan penjabaran dalam bab ini adalah latar belakang penelitian, perumusan masalah, keaslian penelitian, tujuan penelitian, manfaat penelitian serta sistematika penulisan. BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI Berisi tinjauan pustaka dan landasan teori. Dalam tinjauan pustaka memberikan gambaran tentang penelitian yang sejenis yang pernah dilakukan oleh penulis lain, serta sebagai referensi dalam membuat penelitian. Landasan teori sebagai dasar dalam melakukan penelitian dalam bidang plagiasi dan teori-teori tentang algoritma pendeteksi plagiasi. BAB III METODE PENELITIAN Bab ini menjelaskan metode yang dilaksanakan dalam penelitian. Metode penelitian yang digunakan yaitu pendekatan kualitatif deskriptif eksploratif. BAB IV ANALISIS DAN PERANCANGAN SISTEM Pada bab ini dijelaskan mengenai analisis deteksi plagiasi pada artikel publikasi koran menggunakan algoritma Jaro-Winkler. Sehingga didapat bentuk sistem yang akan dibangun dan kemudian merancang perangkat lunaknya.
8 BAB V IMPLEMENTASI SISTEM Pada bab ini dijelaskan mengenai implementasi perangkat lunak yang telah dibangun dalam bentuk kode-kode program. BAB VI HASIL DAN PEMBAHASAN Bab ini menjelaskan hasil dari analisis data artikel publikasi koran dengan menggunakan aplikasi yang telah dikembangkan. BAB VII PENUTUP Penutup memberikan penjelasan mengenai kesimpulan yang diperoleh peneliti selama melaksanakan penelitian dan menganalisis data. Kesimpulan merupakan hasil dari jawaban perumusan masalah yang dikaji dalam penelitian. Saran diberikan kepada penelitian yang telah dilaksanakan tetapi tidak bias menjawab perumusan masalah yang dikemukakan. Saran diberikan sebagai hasil rekomendasi terhadap penelitian yang akan dilaksanakan mendatang.