BAB III METODOLOGI PENELITIAN

dokumen-dokumen yang mirip
BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

SOURCE DETECTION PADA KASUS PLAGIARISME DOKUMEN BERDASARKAN WORDS PHRASING DENGAN MODEL RUANG VEKTOR TUGAS AKHIR. Diajukan Sebagai Salah Satu Syarat

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN

BAB III METODOLOGI PENELITIAN

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

Berikut langkah-langkah penelitian yang dilakukan: 1. Menentukan kebutuhan data yang akan digunakan.

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB V IMPLEMENTASI DAN PENGUJIAN

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN. Pengetahuan Alam dan Jurusan Budidaya Perairan Fakultas Pertanian Universitas

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN. dilakukan untuk mempermudah dalam melakukan penelitian. Dalam

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

Gambar 3.1 Desain Penelitian

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODE PENELITIAN

SOURCE DETECTION PADA KASUS PLAGIARISME DOKUMEN MENGGUNAKAN METODE BIWORD WINNOWING DAN RETRIEVAL BERBASIS OKAPI BM25 TUGAS AKHIR

I. ANALISIS DAN PERANCANGAN SISTEM. Penelitian ini dilakukan di Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu

BAB III METODOLOGI PENELITIAN

BAB 3 LANDASAN TEORI

BAB IV IMPLEMENTASI DAN EVALUASI

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB IV HASIL DAN UJI COBA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB IV ANALISA DAN PERANCANGAN

BAB III METODE PENELITIAN. Penelitian ini dilakukan di Laboratorium Skripsi dan Tugas Akhir Jurusan Ilmu

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB II LANDASDAN TEORI

BAB I PERSYARATAN PRODUK

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

3.3 Metode Pengumpulan Data Studi Pustaka ( Library Research Method Wawancara ( Interview

DAFTAR ISI. SKRIPSI... ii

BAB IV IMPLEMENTASI DAN PENGUJIAN

1 BAB III METODOLOGI PENELITIAN. collaborative filtering ini digambarkan pada gambar 3.1

BAB III METODE PENELITIAN. a. Menentukan kebutuhan data yang dibutuhkan. b. Mengumpulkan semua data yang dibutuhkan.

UKDW. Bab 1 PENDAHULUAN

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB II LANDASAN TEORI

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB III ANALISA KEBUTUHAN DAN PERANCANGAN SISTEM

BAB 3 ANALISIS DAN PERANCANGAN

BAB III METODE PENELITIAN. Penelitian ini dilakukan di Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu

BAB 1 PENDAHULUAN UKDW

BAB V IMPLEMENTASI SISTEM

BAB III METODOLOGI PENELITIAN

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB III METODE PENELITIAN. Penelitian ini dilakukan di Jurusan Ilmu Komputer, Fakultas Matematika dan

BAB IV HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah. Perkembangan teknologi yang semakin maju menjadi pemicu untuk

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

BAB III METODE PENELITIAN. penelitian adalah pada semester Genap Tahun Pelajaran

BAB IV HASIL DAN UJI COBA

BAB III ANALISA KEBUTUHAN DAN PERANCANGAN SISTEM

BAB III METODOLOGI PENELITIAN. Desain penelitian adalah tahapan-tahapan dalam penelitian. Berikut di bawah

@UKDW BAB 1 PENDAHULUAN

BAB III METODOLOGI PENELITIAN. menu makanan berbasis web pada konsumen restoran menggunakan metode

BAB I PENDAHULUAN. atau bagian yang terintregasikan melalui sistem yang dipakai untuk. pengolahan, penyusunan dan pelayanan koleksi yang mendukung

Text Pre-Processing. M. Ali Fauzi

DAFTAR ISI. ABSTRAK... vi. KATA PENGANTAR... vii. DAFTAR ISI... ix. DAFTAR GAMBAR... xiii. DAFTAR TABEL... xviii BAB I PENDAHULUAN...

BAB IV IMPLEMENTASI DAN EVALUASI

BAB III ANALISA DAN PERANCANGAN SISTEM 1.1 Alat dan Bahan Alat

BAB II ANALISIS DAN PERANCANGAN. pembuatan sebuah web. Langkah ini sebagai gambaran apa saja yang

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III ANALISA MASALAH DAN SISTEM

III. METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN. Pendekatan metode pengembangan sistem yang digunakan peneliti merupakan

BAB III ANALISIS DAN DESAIN SISTEM

BAB III METODOLOGI PENELITIAN

BAB IV IMPLEMENTASI DAN EVALUASI


PENGUNAAN METODE COSINESIMILARITY PADA SISTEM PENGELOMPOKAN KERJA PRAKTEK, TUGAS AKHIR DAN SKRIPSI

Transkripsi:

BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka Perancangan Analisa Hipotesa Implementasi Sistem Pengujian Kesimpulan & Saran Gambar 3.1. Tahapan Penelitian 3.1 Identifikasi Masalah Pada tahapan ini dilakukan identifikasi permsalahan bahwa sulitnya mendapatkan sumber referensi dari sebuah dokumen yang diduga melakukan plagiarisme terhadap dokumen lainnya serta terbatasnya melakukan pendeteksian plagiarisme dengan perbandingan 1:1. 3.2 Rumusan Masalah Dari tahapan identifikasi masalah, dapat dirumusakan Bagaimana mendeteksi sumber dari sebuah dokumen teks untuk melakukan pendeteksian plagiarisme terhadap banyak dokumen berdasarkan word phrasing menggunakan model ruang vektor.

3.3 Studi Pustaka Pada tahap ini dilakukan pengumpulan data dengan cara mencari referensi-referensi terkait yang dibutuhkan untuk penelitian. Referensi tersebut dapat berupa buku-buku, jurnal-jurnal, tulisan penelitian dan juga artikel-artikel dari internet yang memiliki kaitan dengan kasus yang sedang dilakukan dalam penelitian. 3.4 Hipotesa Metode ini dilakukan dengan memahami pembentukan query berdasarkan words phrasing dan Algoritma Stemming Nazief Adriani,sehingga diperoleh suatu hipotesa berupa pendekatan token berbentuk triword, quadword dan pentaword serta proses stemming dan non-stemming. Hipotesa awal, pendekatan token berbentuk triword dengan stemming dengan frekuensi tertinggi bekerja lebih baik dibanding token berbentuk quadword dan pentaword stemming maupun non-stemming dalam pembentukan query yang untuk menghasilkan dokumen relevan dan memiliki nilai jaccard coefficient yang tinggi. 3.5 Analisa Analisa adalah tahapan yang dilakukan setelah pengumpulan data dari penelitian tugas akhir ini. Analisa berarti metode khusus yang digunakan untuk menganalisis masalah pada pendeteksian sumber untuk melakukan pendeteksian plagiarisme terhadap banyak dokumen. Analisa ini dilakukan unutk mengetahui langkah-langkah apa saja yang akan dilakukan untuk mendapatkan hasil sesuai dengan hipotesa yang diberikan. III-2

Pembuatan Query Input Dokumen Dokumen Stemming Algorimt Nazief Adriani Non- Steming triword quadword pentaword triword quadword pentaword Query Filtering Query Plagiarism System IR System Preprocessing Corpus Preprocessing Fingerpring Algortima Biword Winnowing Database Indexing (Corpus) Hasil Deteksi Plagiarisme Similirity Jaccard Coeficien Hasil Rangking Pencarian (Dokumen) Model Ruang Vektor Query Processing Gambar 3.2 Analisa Kerangka Teoritis Penelitian Berdasarkan gambar 3.2 terdapat tiga proses utama yang akan dilakukan pada penelitian source detection ini, diantaranya: 1. Analisa pembentukan query dari dokumen yang dicurigai plagiat berdasarkan word phrasing. Adapun query yang akan dibentuk, dibedakan menjadi dua yaitu : a. Query dengan menggunakan stemming, pada tahap ini akan dilakukan : 1. Pembersihan teks dokumen. 2. Menghilangkan angka pada dokumen. III-3

3. Melakukan pemotongan teks dokumen kedalam token tunggal, serta melakukan pembuangan stopwords dan stemming, kemudian menyusun token menjadi triword, quadword dan pentaword 4. Melakukan perhitungan frekuensi kemunculan triword, quadword dan pentaword yang sama. 5. Membentuk masing-masing query berdasarkan rangking frekuensi yaitu 5 triword, quadword dan pentaword dengan frekuensi tertinggi, 5 frekuensi terendah dan 5 frekuensi tengah. b. Query dengan menggunakan tanpa stemming, pada tahap ini akan dilakukan : 1. Pembersihan teks dokumen. 2. Menghilangkan angka pada dokumen. 3. Melakukan pemotongan teks dokumen kedalam token tunggal, serta melakukan pembuangan stopwords kemudian menyusun token menjadi triword, quadword dan pentaword. 4. Melakukan perhitungan frekuensi kemunculan triword, quadword dan pentaword yang sama. 5. Membentuk masing-masing query berdasarkan rangking frekuensi yaitu 5 triword, quadword dan pentaword dengan frekuensi tertinggi, 5 frekuensi terendah dan 5 frekuensi tengah. 2. Analisa Information Retrieval System Secara garis besar, ada tiga tahapan yang ditangani oleh sistem ini, yaitu melakukan preprocessing terhadap dokumen, melakukan preprocessing terhadap query dan menerapkan metode tertentu dalam hal ini menggunakan model ruang vektor untuk menghitung kedekatan (relevansi / similirity) antara dokumen dan query hasil pembuatan di proses sebelumnya. Adapun tiga tahapan tersebut, yaitu: III-4

a. Preprocessing Melakukan analisa terhadap tahapan preprocessing untuk koleksi dokumen (korpus) untuk Pembangunan index untuk diterapkan pada model ruang vektor. Adapun tahapan pembangunan index sebagai berikut. 1. Mengumpulkan dokumen yang akan di-index 2. Penghapusan format khusus dan markup dari dalam dokumen 3. Pemisahan rangkaian kata (tokenization) 4. Linguistic Preprocessing : Penghapusan stop words 5. indexing b. Preprocessing Query Melakukan preprocessing terhadap query yang bertujuan untuk membersihkan query hingga pembobotan, adapun proses yang akan dilakukan pada tahap ini adalah sebagai berikut: 1. Menghilangkan tanda baca pada dokumen 2. Mengubah dokumen kebentuk huruf kecil 3. Menerapkan stopword removal 4. Menerapkan stemming ( mengembalikan kata ke kata dasar ) 5. Pembobotan setiap istilah query Pembobotan pada query ini mengacu dari hasil indexing pada preprocessing dokumen. c. Penerapan Model Ruang Vektor Melakukan analisa terhadap persamaan model ruang vektor untuk menghitung nilai kerelevanan dokumen terhadap query yang dibentuk dari dokumen inputan sehingga dokumen yang di rangkingkan berdasarkan nilai kerelevanan yang diperoleh. 3. Analisa Deteksi kemiripan dokumen ( plagiarism system) dengan Algoritma biword winnowing a. Pembentukan fingerprint dokumen dengan algoritma biword winnowing. Pada tahap ini akan dilakukan: 1. Melakukan pembersihan teks. III-5

2. Melakukan pemotongan teks kedalam bentuk biword kemudian dienkripsi menggunakan MD5 3. Menghitung nilai hash 4. Membentuk window dengan ukuran w 5. Mendapatkan nilai fingerprint b. Menghitung tingkat kemiripan ( similirity) dokumen dengan menggunakan persamaan jaccard coefficient 3.6 Perancangan Perangkat Lunak Pada tahap ini akan dilakukan perancangan aplikasi, adapun Tahapan yang dilakukan adalah: a. Merancang use case diagram untuk menentukan pengguna ( actor) yang terlibat dan proses apa saja yang bisa dilakukan ( scenario) terhadap sistem. b. Merancang Deksripsi Fungsional pada sistem diantaranya Context Diagram (CD), Data Flow Diagram (DFD) dan Entity Relationship Diagram (ERD) c. Perancangan Struktur Menu Merancang menu-menu pada aplikasi yang memiliki fungsi masingmasing sesuai tujuan yang akan dicapai. d. Perancangan interface aplikasi. Merancang atau mendesain tampilan antar muka aplikasi dengan pengguna. Interface yang akan dibangun adalah interface input dan output. Dengan demikian akan terlihat interface dari sistem dan dapat memberikan gambaran terhadap sistem yang akan dibangun. 3.7 Implementasi pengujian Setelah dilakukan perancangan aplikasi, maka akan dilakukan tahap implementasi. Implementasi merupakan tahap dimana aplikasi siap untuk di operasikan sesuai dari hasil analisis dan perancangan yang telah dilakukan, sehingga akan diketahui apakah aplikasi yang dirancang benar-benar dapat menghasilkan tujuan yang ingin dicapai. III-6

Implementasi pengembangan aplikasi deteksi plagiarisme dokumen ini akan dibangun pada spesifikasi hardware dan software sebagai berikut: 1. Perangkat keras Processor : Intel Core i3-2328-m CPU 2.20Ghz Memori (RAM) : 2,00 GB Harddisk : 500 GB 2. Perangkat Lunak Sistem operasi : Windows 8 Enterprise 32-bit OS Bahasa pemrograman : Hypertext Preprocessor (PHP) DBMS : mysql Tool : Notepad++ 3.8 Pengujian Sistem Tahapan pengujian yang akan dilakukan pada sistem pendeteksian sumber plagiarisme dokumen yang dibangun bertujuan untuk mengetahui kesalahan dan kemudian memperbaikinya. Pengujian yang akan dilakukan sebagai berikut: 1. Pengujian konfigurasi pembuatan query yaitu proses stemming, pembentukan frasa kata serta pemilihan hasil frekuensi frasa kata. Hal ini bertujuan untuk mendapatkan konfigurasi terbaik yang menghasilkan dokumen yang relevan dengan dokumen yang di-input serta mendapatkan dokumen dengan similarity jaccard coefficient yang tinggi. 2. Pengujian Kemiripan dokumen input terhadap dokumen yang ada pada corpus sesuai dengan konfigurasi yang direkomendasikan pada pengujian pertama. Hal ini dilakukan untuk mengetahui lebih jelas tingkat akurasi aplikasi source detection dalam mencari sumber dokumen dan kemiripan terhadap dokumen. 3.9 Kesimpulan dan Saran Pada tahapan ini berisi tentang kesimpulan yang dapat ditarik dari penelitian yang telah penulis lakukan, yang dimulai dari tahapan analisa hingga tahapan pengujian aplikasi. Selanjutnya pada bagian saran berisi saran-saran yang yang penulis berikan untuk mengembangkan aplikasi yang penulis bangun dalam III-7

penelitian tugas akhir ini sehingga ke depannya dapat diteruskan dan menjadi lebih baik. III-8