Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 4, No. 1, Tahun
|
|
- Utami Tan
- 7 tahun lalu
- Tontonan:
Transkripsi
1 Vol. 4, No. 1, Tahun Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Website : pustaka@pcr.ac.id Sistem Pendeteksi Kemiripan Proyek Akhir Berdasarkan Abstrak Dengan Representasi Vector Fenny Changriana 1, Syefrida Yulina 2 dan Kartina Diah Kesuma Wardhani 3 1 Program Studi Sistem Informasi, Politeknik Caltex Riau, fenny11si@mahasiswa.pcr.ac.id 2 Program Studi Teknik Informatika, Politeknik Caltex Riau, syefrida@pcr.ac.id 3 Program Studi Teknik Informatika, Politeknik Caltex Riau, diah@pcr.ac.id Abstrak Karya ilmiah merupakan hasil dari pemikiran peneliti. Akan tetapi, suatu karya ilmiah yang bukan merupakan ide asli dari pemikiran peneliti dianggap plagiarisme, yaitu tindakan yang menjiplak karya seseorang dimana karya tersebut diakui sebagai karya sendiri. Oleh karena itu, perlu adanya pembangunan suatu sistem yang dapat mendeteksi kemiripan pada Proyek Akhir (PA), khususnya abstrak yang merupakan uraian ringkas, cermat, dan menyeluruh dari isi suatu karangan ilmiah. Penelitian ini menggunakan Vector Space Model dengan algoritma Term Frequency Inverse Document Frequency (TF-IDF) untuk pembobotan kata dan cosine similarity untuk melakukan perhitungan kemiripan antar dokumen abstrak jurnal yang dibandingkan. Hasil pengujian menunjukkan Vector Space Model dengan representasi cosine similarity dapat digunakan untuk mendeteksi kemiripan abstrak jurnal PA dengan fungsionalitas sistem pada aplikasi yang dapat dipenuhi sebesar 100%, hasil pengujian keluaran sistem dengan manual mendapatkan nilai akurasi sebesar 86,76%, dapat mengambil abstrak jurnal dengan nilai akurasi 68%, dan preprocessing menggunakan Porter Stemmer mendapatkan nilai akurasi sebesar 96,55%. Kata kunci: Abstrak PA, Vector Space Model, TF-IDF, Cosine Similarity Abstract A scientific paper is the result from researcher thoughts. However, a scientific paper which isn t an original idea from researcher thoughts is considered plagiarism, i.e. the act of plagiarizing the work of a person where the work is recognized as the work itself. Therefore, we need to develop a system that can detect a resemblance of a Final Project (PA) at the Polytechnic Caltex Riau (PCR), especially abstract which is a brief, careful, and thorough description of the contents in a scientific essay. This study uses a Vector Space Model with Term Frequency Inverse Document Frequency (TF-IDF) algorithm for word weighting and cosine similarity to perform a similarity calculation between the compared documents of journal abstracts. The test results shows that the PA abstract similarity checking system using Vector Space Model with
2 Vol. 4, No. 1, Tahun TF-IDF and cosine similarity algorithms can be used to detect similarities of PA abstract journal with system functionality in application that can be fulfilled by 100% and the system is able to check the similarities in abstract so it can minimize the possibility of PA plagiarism with an accuracy of 93.33%. Keywords: PA Abstract, Vector Space Model, TF-IDF, Cosine Similarity 1. Pendahuluan Menulis suatu karya ilmiah merupakan bagian yang tidak dapat dipisahkan dari kehidupan akademik seorang mahasiswa [9]. Menurut Soeparno, karya ilmiah adalah sebuah tulisan yang berisi suatu permasalahan yang diungkapkan dengan metode ilmiah [5]. Dalam karya ilmiah, kita tentunya sudah tidak asing lagi mendengar kata abstrak. Surachman berpendapat bahwa abstrak adalah pemadatan dari sebuah karya seperti laporan penelitian, artikel majalah atau jurnal, prosiding, dan lain-lain. Abstrak biasanya dikumpulkan sesuai dengan subjek atau kekhususan informasinya dan disusun menurut abjad [7]. Dengan berkembangnya teknologi yang digunakan saat ini, perolehan informasi menjadi sangat mudah sehingga menyebabkan banyak mahasiswa yang mengambil jalan pintas dalam membuat karya ilmiah dengan cara menyalin sebagian atau keseluruhan karya ilmiah dari orang lain tanpa mencantumkan sumbernya. Hal ini disebut plagiarisme. Menurut kamus Merriam-Webster, kata plagiarisme berasal dari kata kerja transitif yaitu to plagiarize yang berarti to steal and pass off (the ideas or words of another) as one s own; use (another s production) without crediting the source [4]. Studi mengatakan bahwa 70% mahasiswa melakukan pekerjaannya menggunakan plagiarisme dan 40% mahasiswa hanya melakukan copy paste pekerjaan yang diberikan [3]. Hal ini menyebabkan mahasiswa menjadi lebih nyaman dalam melakukan plagiarisme. Sehubungan dengan masalah tersebut, maka diperlukan sebuah sistem untuk melakukan pemeriksaan terhadap karya ilmiah, khususnya pada abstrak. Oleh karena itu, dibangunlah sebuah web yang mengimplementasikan algoritma TF-IDF dan Vector Space Model untuk mendeteksi kemiripan abstrak PA. 2. Landasan Teori 2.1 Proyek akhir Proyek Akhir merupakan kristalisasi ide atau buah pikiran yang dilakukan dengan menerapkan pengetahuan yang telah dipelajari selama di politeknik sehingga terbangun identitas dan kepercayaan diri yang profesional di bidangnya. 2.2 Document Preprocessing Koleksi dokumen diproses terlebih dahulu sebelum digunakan dalam program. Proses ini disebut document preprocessing. Document preprocessing bertujuan untuk mengurangi volume kosakata, menyeragamkan kata dan menghilangkan noise [1]. Proses document preprocessing terdiri dari: 1. Case Folding adalah pengubahan semua huruf dalam dokumen menjadi huruf kecil. Karakter selain huruf dihilangkan dan dianggap delimiter [10]. 2. Tokenizing Tokenizing adalah pemisahan teks menjadi kalimat dan kata-kata. Dokumen dapat dipecah menjadi per bab, per bagian, per paragraf, per kalimat, per kata, dan bahkan per suku kata [10]. 3. Filtering Filtering adalah pengambilan katakata penting dari hasil tokenizing. Pada tahapan filtering akan dilakukan penghapusan stopwords.
3 Vol. 4, No. 1, Tahun Stopwords dapat berupa kata depan, kata penghubung, dan kata pengganti [1]. 4. Stemming Stemming merupakan suatu proses yang mentransformasi kata-kata yang terdapat dalam suatu dokumen ke kata-kata dasarnya dengan menggunakan aturan-aturan tertentu [10]. Stemming ini menggunakan Porter Stemmer for Bahasa Indonesia dikembangkan oleh Fadillah Z. Tala yang didasarkan pada English Porter Stemmer yang dikembangkan oleh W.B. Frakes [8]. 2.3 Vector Space Model Vector Space Model (VSM) adalah suatu metode untuk melihat tingkat kedekatan yang kemiripan (similarity) term dengan cara melakukan pembobotan term. Yates menyatakan bahwa dokumen dan kata kunci dipandang sebagai sebuah vektor yang memiliki jarak dan arah. Relevansi sebuah dokumen ke sebuah query didasarkan pada similaritas diantara vektor dokumen dan vektor query. Pada Vector Space Model, setiap dokumen dan kata kunci dari pengguna direpresentasikan sebagai ruang vektor berdimensi n. Kata kunci dan dokumen dianggap sebagai vektor-vektor pada ruang n-dimensi. Selanjutnya akan dihitung nilai cosinus sudut dari dua vektor, yaitu W (bobot) dari tiap dokumen dan W0 dari kata kunci. Penentuan relevansi dokumen dengan kata kunci dipandang sebagai pengukuran kesamaan (similarity measure) antara vektor dokumen dengan vektor kata kunci. Semakin mirip suatu vektor dokumen dengan vektor kata kunci maka dokumen dapat dilihat sangat relevan dengan kata kunci [1]. 2.4 TF-IDF (Term Frequency Inversed Document Frequency) TF-IDF adalah suatu algoritma yang menggambarkan seberapa pentingnya kata (term) dalam sebuah dokumen dan corpus. Proses ini digunakan untuk menilai bobot relevansi term dari sebuah dokumen terhadap seluruh dokumen dalam corpus [6]. Formula yang digunakan untuk menghitung bobot (w) masing-masing dokumen terhadap kata kunci adalah [2]: Rumus : (1) Ket : d = dokumen ke-d t = kata ke-t dari kata kunci w = bobot dokumen ke-d terhadap kata ke-t Rumus mencari nilai IDF : (2) Setelah bobot (w) masing-masing dokumen diketahui, maka dilakukan proses sorting atau pengurutan dimana semakin besar nilai w, maka besar tingkat similaritas dokumen tersebut terhadap kata yang dicari, demikian sebaliknya [2]. 2.5 Cosine Similarity Cosine Similarity adalah metode similaritas yang digunakan untuk menghitung similaritas dua buah dokumen. Berikut rumus metode perhitungan cosine similarity [2]: (3) Ket : A = bobot TF-IDF dari kata kunci B = bobot TF-IDF dari dokumen = penjumlahan TF-IDF dari kata kunci = penjumlahan TF-IDF dari dokumen
4 Vol. 4, No. 1, Tahun Berdasarkan rumus di atas, rumus cosine similarity dapat diuraikan menjadi sebagai berikut: 1. Rumus perhitungan panjang vektor: 2. Rumus dot product: (4) (5) 3. Metodologi Penelitian 3.1 Use Case Diagram Berikut ini perancangan use case diagram pada sistem ini: Gambar 2 Halaman beranda 2. Halaman data jurnal Halaman ini merupakan halaman yang digunakan untuk menambah data jurnal terdahulu. Gambar 1 Use Case Diagram 4. Hasil dan Pembasan 4.1 Hasil Implementasi Berikut ini adalah hasil implementasi antar muka sistem yang ada pada aplikasi yang telah dibuat: 1. Halaman beranda Halaman ini merupakan halaman beranda utama pada web. Halaman ini memiliki beberapa menu, seperti Beranda, Pendeteksi Kemiripan, Data Jurnal, dan Tentang Kami. Gambar 3 Halaman tambah data jurnal 3. Halaman pendeteksi kemiripan Halaman ini adalah halaman dimana user dapat memasukkan jurnal yang diinginkan untuk dicari persentase kemiripannya dengan jurnal terdahulu.
5 Vol. 4, No. 1, Tahun Gambar 4 Halaman pendeteksi kemiripan 4. Halaman tentang kami Halaman ini berisi tentang profil pembuat aplikasi. jurnal yang dimasukkan bukan format jurnal PCR, menambah jurnal yang sama, dan berhasil menambah jurnal. Pada lihat persentase kemiripan abstrak PA, ada 5 kondisi yang diuji, yaitu data masukan tidak lengkap, data yang dimasukkan bukan berformat.pdf, jurnal yang dimasukkan bukan format jurnal PCR, mencari nilai kemiripan, dan simpan jurnal yang telah dideteksi di database. Pada simpan abstrak jurnal ke database, ada 3 kondisi yang diuji, yaitu berhasil menyimpan abstrak di database, tidak memasukkan abstrak di database, dan abstrak jurnal yang dideteksi sudah ada di database. Dari 13 kondisi dengan 4 fungsionalitas yang diuji dapat dilihat bahwa hasil pengujian berhasil dilakukan dengan persentase 100% Pengujian Perhitungan Keluaran Sistem dengan Perhitungan Manual Pengujian ini dilakukan untuk melihat apakah perhitungan algoritma pada sistem sudah sesuai dengan perhitungan algoritma manual. Pengujian ini dilakukan dengan cara membandingkan 10 jurnal uji tahun 2012, 10 jurnal uji tahun 2013, dan 10 jurnal uji 55 tahun 2014 dengan 70 jurnal yang telah di-preprocessing pada database. Gambar 5 Halaman tentang kami 4.2 Pengujian sistem Pengujian Black Box Testing Pengujian black box testing dilakukan pada 4 fungsionalitas use case, yaitu tambah data jurnal terdahulu, lihat persentase kemiripan abstrak PA, simpan abstrak jurnal ke database, dan melihat halaman tentang kami. Pada tambah data jurnal terdahulu, ada 5 kondisi yang diuji, yaitu data masukan tidak lengkap, data yang dimasukkan bukan berformat.pdf, Proses pengujian ini dilakukan dengan melakukan preprocessing pada 30 jurnal uji dan 70 jurnal yang ada di database sistem secara manual. Kemudian, hasil preprocessing dari 30 jurnal uji dan 70 jurnal yang ada di database tersebut dihitung dengan algoritma TF-IDF untuk pencarian bobot. Setelah bobot diketahui, bobot tersebut akan dihitung panjang vektor, dihitung dot product-nya, dan dihitung kemiripannya dengan cosine similarity dan diurutkan 3 yang paling besar kemiripannya. Setelah dihitung secara manual, kita akan membandingkan hasil perhitungan manual dengan sistem untuk dilihat statusnya apakah Benar atau Salah. Jika berstatus Benar, maka hasil manual dengan hasil sistem sama. Jika berstatus
6 Vol. 4, No. 1, Tahun Salah, maka hasil manual dengan hasil sistem berbeda Pengujian Pengambilan Abstrak Jurnal Pada penelitian ini dari 147 file.pdf yang diuji didapatkan 100 file.pdf yang berhasil, sedangkan 47 file lainnya gagal diidentifikasi. Untuk menentukan nilai akurasi, akurasi dihitung dengan jumlah data yang benar dibagi jumlah seluruh data dikali dengan 100%. Oleh karena itu, nilai akurasi yang didapat adalah: persentase kemiripan abstrak PA, simp-an abstrak jurnal ke database, dan melihat halaman tentang kami sesuai dengan yang tertera pada use case diagram. Dari test case yang telah diuji, maka black box testing dapat dikatakan berhasil karena dari 4 test case yang diuji tidak ada test case yang tidak berhasil dilakukan sehingga memiiki persentase 100% Analisis Perhitungan Keluaran Sistem dengan Perhitungan Manual Pengujian Preprocessing pada Proses Stemming Pengujian ini dilakukan untuk melihat apakah proses stemming pada sistem dan manual berjalan dengan benar. Proses stemming yang digunakan adalah Porter Stemmer untuk Bahasa Indonesia. Pengujian ini dilakukan dengan membandingkan hasil stemming manual dengan hasil stemming sistem. Pengujian ini dilakukan pada 1 jurnal yang telah diambil abstraknya. Hasil manual dihitung berdasarkan aturan Porter Stemmer untuk Bahasa Indonesia. Setelah itu, hasil manual akan dibandingkan dengan hasil sistem untuk ditentukan statusnya apakah Sesuai atau Tidak. Jika berstatus Sesuai, maka hasil manual dengan hasil sistem sama. Jika berstatus Tidak Sesuai, maka hasil manual dengan hasil sistem berbeda. Pada pengujian ini terdapat 1 kondisi dari 5 aturan stemming yang salah. Nilai akurasi yang didapat adalah 97,37% dari kata yang diuji. 4.3 Analisis Sistem Analisis Black Box Testing Pengujian black box testing dilakukan dengan menguji 4 test case yang tersedia. Test case tersebut ada 4, yaitu tambah data jurnal terdahulu, lihat hasil Dari hasil pengujian didapatkan nilai akurasi sebesar 93,33% dan dari 30 data yang diuji terdapat 2 data yang memiliki hasil perhitungan yang berbeda antara hasil keluaran sistem dengan manual. Penyebab 2 data tersebut mempunyai hasil yang berbeda karena adanya error pada kata-kata yang terdapat di jurnal yang diuji, seperti kesalahan dalam penulisan kata dan ada kata yang tergabung. Penulisan kata dalam abstrak jurnal yang asli berpengaruh pada perhitungan nilai TF-IDF karena kata yang seharusnya berjumlah dua menjadi satu di tabel term. Meskipun demikian, sistem yang dibuat ini hanyalah berupa decision support untuk memberikan informasi kepada user berupa persentase kemiripan. Keputusan terakhir tetap user yang menentukan Analisis Pengambilan Abstrak dari Jurnal Berdasarkan pengujian pengambilan abstrak dapat kita lihat bahwa sistem berhasil mengambil abstrak jurnal pada Gambar 4.5 dengan benar. Dari 147 file.pdf yang diuji, didapatkan 100 file.pdf yang berhasil dan 47 file lainnya gagal diidentifikasi dan nilai akurasi yang didapat sebesar 68%. Penyebab 47 file tersebut gagal teridentifikasi karena penulisan yang salah pada kata Abstrak, tidak ada tulisan Abstrak yang ditemui, format jurnal bukan format jurnal Politeknik Caltex Riau, penulisan kata Abstrak dan Abstract yang memakai huruf capital semua, abstrak yang tidak mempunyai kata kunci, abstrak
7 Vol. 4, No. 1, Tahun yang tidak mempunyai kata kunci dan kata Abstract, dan penulisan yang salah pada kata Kata kunci. Penulisan kata Abstrak, Kata kunci, dan Abstract yang benar mempengaruhi pengambilan abstrak karena bagian abstrak yang diambil adalah bagian setelah kata Abstrak dan sebelum kata Kata atau Abstract Analisis Preprocessing pada Proses Stemming Pada pengujian preprocessing dapat dilihat bahwa nilai akurasi yang didapat adalah 97,37% dari kata yang diuji berdasarkan aturan dari Porter Stemmer terdapat 1 kondisi yang berbeda antara hasil yang diharapkan dan hasil aktual. Penyebab 1 kondisi tersebut berbeda hasil karena adanya ambiguitas dalam aturan morfologi Bahasa Indonesia dan algoritma ini berbasis aturan sehingga dapat mempengaruhi akurasi hasil akhir. 3. Penulisan kata yang baik dapat mempengaruhi hasil TF-IDF dan cosine similarity. 4. Porter Stemmer untuk Bahasa Indonesia dapat menghasilkan kata yang ambigu dan tidak sesuai dengan aturan morfologi Bahasa Indonesia. 5.2 Saran Untuk pengembangan aplikasi ini, maka beberapa hal yang dapat penulis sarankan adalah: 1. Pengembangan integrasi dengan sistem informasi proyek akhir yang ada. 2. Pengembangan pendeteksian seluruh jurnal dengan format berbeda, seperti jurnal AES, ABEC, dan lain-lain. 5. Kesimpulan dan Saran 5.1 Kesimpulan Setelah dilakukan pengujian beserta analisa pada penelitian ini, maka dapat diambil kesimpulan yaitu: 1. Sistem pengecekan kemiripan abstrak PA yang menggunakan Vector Space Model dengan algoritma TF-IDF untuk pembobotan kata dan cosine similarity untuk pengecekan kemiripan dapat digunakan untuk mendeteksi kemiripan abstrak jurnal PA dengan fungsionalitas sistem pada aplikasi yang dapat dipenuhi sebesar 100%. 2. Berdasarkan pengujian hasil keluaran sistem dan manual, sistem dapat melakukan pengecekan kemiripan pada abstrak sehingga dapat memperkecil kemungkinan Daftar Pustaka [1] Annisa, N, Implementasi Algoritma Vector Space Model pada Pencarian E-book, Sistem Informasi, Politeknik Caltex Riau, Rumbai, [2] Damanik, R. M. U., Pembangunan Aplikasi Pencarian Dokumen Menggunakan Text Mining Berbasis Web, Teknik Informatika, Universitas Atma Jaya Yogyakarta, Yogyakarta, [3] Hariharan, S., Automatic Plagiarism Detection Using Similarity Analysis. The International Arab Journal of Information Technology, , [4] Herqutanto, Plagiarisme, Runtuhnya Tembok Kejujuran Akademik, ejurnal Kedokteran Indonesia, 1-3, [5] Mukhlish, Pedoman Penulisan Karya Ilmiah (Laporan Penelitian), terjadinya plagiarisme PA.
8 Vol. 4, No. 1, Tahun Dinas Pendidikan, Pemuda, dan Olahraga, [6] Saadah, M. N., Sistem Temu Kembali Dokumen Teks Dengan Pembobotan TF-IDF dan LCS, JUTI, 17-20, [7] Surachman, A., Penelusuran Informasi: sebuah pengenalan, UPU Perpustakaan UGM s.com/2012/09/penelusuran_informas i.docx, (2015, Februari 3). [8] Tala, F. Z., A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia, Institute for Logic, Language and Computation Universiteit Van Amsterdam, Amsterdam, [9] Universitas Pendidikan Indonesia, Pedoman Penulisan Karya Ilmiah Universitas Pendidikan Indonesia Tahun 2014, Universitas Pendidikan Indonesia, [10] Yuliana, Sistem Pengelolaan Proyek Akhir Menggunakan Text Mining pada Politeknik Caltex Riau, Sistem Informasi, Politeknik Caltex Riau, Rumbai, 2014.
Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 1, No. 2, Tahun
Vol. 1, No. 2, Tahun 2012 15 Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Website : http://jurnal.pcr.ac.id/index.php/jakt/about/index Email : pustaka@pcr.ac.id Aplikasi Pendeteksi Plagiat dengan
Lebih terperinciBAB I PENDAHULUAN I.1. Latar Belakang Masalah
BAB I PENDAHULUAN I.1. Latar Belakang Masalah Dalam era teknologi seperti saat ini, informasi berupa teks sudah tidak lagi selalu tersimpan dalam media cetak seperti kertas. Orang sudah mulai cenderung
Lebih terperinciTEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK
F.13 TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK Bania Amburika 1*,Yulison Herry Chrisnanto 1, Wisnu Uriawan 2 1 Jurusan Informatika, Fakultas MIPA, Universitas
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan
Lebih terperinciINFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER
INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,
Lebih terperinciIMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB
IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB Abdul Rokhim 1), Achmad ainul yaqin 2) 1) Program Studi/Prodi
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan
Lebih terperinciJurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017
TEXT MINING DALAM PENENTUAN KLASIFIKASI DOKUMEN SKRIPSI DI PRODI TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER BERBASIS WEB Teuku Muhammad Johan dan Riyadhul Fajri Program Studi Teknik Informatika Fakultas
Lebih terperinciJurnal Politeknik Caltex Riau
1 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id IMPLEMENTASI TEXT MINING DALAM KLASIFIKASI JUDUL BUKU PERPUSTAKAAN MENGGUNAKAN METODE NAIVE BAYES Siti Amelia Apriyanti 1), Kartina Diah Kesuma Wardhani
Lebih terperinciJurnal Coding, Sistem Komputer Untan Volume 04, No.1 (2016), hal ISSN : x
APLIKASI PENDETEKSI PLAGIAT TERHADAP KARYA TULIS BERBASIS WEB MENGGUNAKAN NATURAL LANGUAGE PROCESSING DAN ALGORITMA KNUTH-MORRIS-PRATT [1] Rio Alamanda, [2] Cucu Suhery, [3] Yulrio Brianorman [1][2][3]
Lebih terperinciImplementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas
Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan
Lebih terperinci1.5 Metode Penelitian
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam perkembangan teknologi internet yang semakin maju ini kita dapat mengakses dokumen, buku dan majalah mulai dari bahasa asing sampai bahasa daerah yang
Lebih terperinciSTUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR
STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR Erik Hardiyanto 1), Faisal Rahutomo 1) 1 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,
Lebih terperinciABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha
ABSTRAK Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian atau penemuan kembali informasi yang relevan terhadap kebutuhan pengguna. Kebutuhan pengguna, diekspresikan
Lebih terperinciPERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL
PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL (Studi Kasus Perpustakaan Universitas Udayana) LEMBAR JUDUL KOMPETENSI RPL SKRIPSI NI MADE
Lebih terperinciSistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Lebih terperinciPERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY
Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik
Lebih terperinciPERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA
PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA Sigit Prasetyo Karisma Utomo 1, Ema Utami 2, Andi Sunyoto 3 1,2,3 Magister Teknik Informatika STMIK AmikomYogyakarta e-mail: 1 aku@sigitt.com,
Lebih terperinciRANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan
RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal
Lebih terperinciSKRIPSI. Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata Satu Program Studi Informatika
HALAMAN JUDU L PENGUKURAN TINGKAT KEMIRIPAN DOKUMEN MENGGUNAKAN ALGORITMA JARO-WINKLER DAN ENHANCED CONFIX STRIPPING STEMMER SKRIPSI Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciSistem Deteksi Plagiarisme Dokumen Bahasa Indonesia Menggunakan Metode Vector Space Model
392 Sistem Deteksi Plagiarisme Dokumen Bahasa Indonesia Menggunakan Metode Vector Space Model Tudesman* 1, Enny Oktalina 2, Tinaliah 3, Yoannita 4 1-4 STMIK Global Informatika MDP Jl. Rajawali No. 14 Palembang
Lebih terperinciPemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi
Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciIMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA
IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,
Lebih terperinciBAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
Lebih terperinciBAB II TINJAUAN PUSTAKA
digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua
BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen
Lebih terperinciPERANCANGAN CLIENT DENGAN PENGKLASIFIKASIAN MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI MOSES CHRISTIAN
PERANCANGAN EMAIL CLIENT DENGAN PENGKLASIFIKASIAN EMAIL MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI MOSES CHRISTIAN 081402050 PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI
Lebih terperinciABSTRAK. Kata kunci : Informasi, Information Retreival, Ant Colony Optimization, Graph, Fitur dokumen. vii
ABSTRAK Untuk mendapatkan sebuah informasi pada saat ini sangatlah mudah. Dengan adanya internet orang dengan mudah untuk berbagi informasi. Informasi yang dibagikan biasanya dalam bentuk dokumen, artikel,
Lebih terperinciKLASIFIKASI DOKUMEN NASKAH DINAS MENGGUNAKAN ALGORITMA TERM FREQUENCY INVERSED DOCUMENT FREQUENCY DAN VECTOR SPACE MODEL
KLASIFIKASI DOKUMEN NASKAH DINAS MENGGUNAKAN ALGORITMA TERM FREQUENCY INVERSED DOCUMENT FREQUENCY DAN VECTOR SPACE MODEL MANUSCRIPT DOCUMENT CLASSIFICATION ALGORITHM USING THE OFFICE OF TERM FREQUENCY
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks
Lebih terperinciPenerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF pada Sistem Klasifikasi Dokumen Skripsi
Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF pada Sistem Klasifikasi Dokumen Skripsi Rizki Tri Wahyuni 1, Dhidik Prastiyanto 2, dan Eko Supraptono 3 Jurusan Teknik Elektro, Fakultas Teknik,
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Information Retrieval System Sistem temu kembali informasi ( information retrieval system) merupakan sistem yang dapat digunakan untuk menemukan informasi yang relevan dengan
Lebih terperinciIdentifikasi Plagiasi Karya Ilmiah berbasis Temu Kembali Informasi Menggunakan Algoritam Edit Distance Melalui Peringkasan Teks Otomatis
Identifikasi Plagiasi Karya Ilmiah berbasis Temu Kembali Informasi Menggunakan Algoritam Edit Distance Melalui Peringkasan Teks Otomatis Iyan Mulyana 1, Andi Chairunnas 2, Aries Maesya 3 1) 2) 3) Program
Lebih terperinciInera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
IMPLEMENTASI MODEL RUANG VEKTOR SEBAGAI PENERJEMAH QUERY PADA CROSS-LANGUAGE INFORMATION RETRIEVAL SISTEM IMPLEMENTATION OF VECTOR SPACE MODEL AS QUERY TRANSLATION FOR CROSS-LANGUAGE INFORMATION RETRIEVAL
Lebih terperinciIMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN
Seminar Nasional Informatika 205 IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN Dedi Leman, Khusaeri Andesa 2 Teknik Informasi, Magister Komputer, Universitas
Lebih terperinciIdentifikasi Plagiasi Karya Ilmiah berbasis Temu Kembali Informasi Menggunakan Algoritam Edit Distance Melalui Peringkasan Teks Otomatis
IJCCS, Vol.x, No.x, July xxxx, pp. 1~5 ISSN: 1978-1520 1 Identifikasi Plagiasi Karya Ilmiah berbasis Temu Kembali Informasi Menggunakan Algoritam Edit Distance Melalui Peringkasan Teks Otomatis Iyan Mulyana*
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA Pada bab ini, akan dibahas landasan teori mengenai pendeteksian kemiripan dokumen teks yang mengkhususkan pada pengertian dari keaslian dokumen, plagiarisme, kemiripan dokumen, dan
Lebih terperinciBAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciKLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO
F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan
Lebih terperinciPENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA
PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA Suprianto 1), Sunardi 2), Abdul Fadlil 3) 1 Sistem Informasi STMIK PPKIA Tarakanita Rahmawati 2,3 Magister Teknik Informatika Universitas
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk
Lebih terperinciPERINGKASAN TEKS OTOMATIS DOKUMEN BAHASA INDONESIA DENGAN ALGORITMA GENETIKA LEMBAR JUDUL KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI
PERINGKASAN TEKS OTOMATIS DOKUMEN BAHASA INDONESIA DENGAN ALGORITMA GENETIKA LEMBAR JUDUL KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI LUH GEDE PUTRI SUARDANI NIM. 1208605018 PROGRAM STUDI TEKNIK INFORMATIKA
Lebih terperinciPENILAIAN UJIAN BERTIPE URAIAN (ESSAY) MENGGUNAKAN METODE KEMIRIPAN TEKS (TEXT SIMILARITY) SKRIPSI
PENILAIAN UJIAN BERTIPE URAIAN (ESSAY) MENGGUNAKAN METODE KEMIRIPAN TEKS (TEXT SIMILARITY) SKRIPSI Disusun Oleh : ADAM ASSHIDIQ M0509001 JURUSAN INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciANALISIS PENGUKURAN SELF PLAGIARISM MENGGUNAKAN ALGORITMA RABIN-KARP DAN JARO-WINKLER DISTANCE DENGAN STEMMING TALA
ANALISIS PENGUKURAN SELF PLAGIARISM MENGGUNAKAN ALGORITMA RABIN-KARP DAN JARO-WINKLER DISTANCE DENGAN STEMMING TALA Jayanta 1), Halim Mahfud 2), Titin Pramiyati 3) 1), 3) Fakultas Ilmu Komputer UPN Veteran
Lebih terperinciAnalisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem
Lebih terperincicommit to user BAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Cosine Similarity Secara umum, fungsi similarity adalah fungsi yang menerima dua buah objek dan mengembalikan nilai kemiripan (similarity) antara kedua objek
Lebih terperinciAPLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL
APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka
Lebih terperinciImplementasi Stemmer Tala pada Aplikasi Berbasis Web
Mardi Siswo Utomo Program Studi Teknik Informatika, Universitas Stikubank email : mardiutomo@gmail.com Abstrak Stemming adalah proses untuk mencari kata dasar pada suatu kata. Pada analisa temu kembali
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas seiring dengan sumber informasi yang banyak merupakan suatu bukti konkret bahwa informasi sangat dibutuhkan
Lebih terperinciImplementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita
Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita Yoseph Samuel, Rosa Delima, Antonius Rachmat 1) Program Studi Teknik Informatika Universitas Kristen Duta Wacana,
Lebih terperinciPerbandingan Penggunaan Algoritma Cosinus dan Wu Palmer untuk Mencari Kemiripan Kata dalam Plagiarism Checker
Perbandingan Penggunaan Algoritma Cosinus dan Wu Palmer untuk Mencari Kemiripan Kata dalam Plagiarism Checker 1 Aslihatul Millah, 2 Siti Nurazizah 1,2 Program Studi Sistem Informasi, Fakultas Sains dan
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini sudah banyak sistem klasifikasi yang diciptakan dalam rangka membantu pengguna dalam melakukan pengklasifikasian dokumen, baik dokumen yang berbentuk
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciFatkhul Amin Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang
45 Dinamika Teknik Januari IMPLEMENTASI SEARCH ENGINE (MESIN PENCARI) MENGGUNAKAN METODE VECTOR SPACE MODEL Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang Abstract Growth of Machine
Lebih terperinciPENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL
Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,
Lebih terperinciBAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Di era globalisasi seperti sekarang ini, perkembangan teknologi komputer berpengaruh besar pada tingkat kebutuhan manusia di berbagai bidang seperti bidang
Lebih terperinciBAB I. Pendahuluan. 1. Latar Belakang Masalah
BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan
Lebih terperinciBAB I PENDAHULUAN. Pada umumnya pembaca ingin mendapatkan rangkuman suatu artikel dengan cepat
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam media internet artikel merupakan suatu kebutuhan dan pengetahuan. Pada umumnya pembaca ingin mendapatkan rangkuman suatu artikel dengan cepat tanpa membaca
Lebih terperinciAPLIKASI DETEKSI KEMIRIPAN TUGAS PAPER
APLIKASI DETEKSI KEMIRIPAN TUGAS PAPER Anthony Anggrawan 1, Azhari 2, 1 Tenaga Pengajar Teknik Informatika STMIK Bumigora Mataram 2 Mahasiswa Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki,
Lebih terperinciStemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic
Lebih terperinciEKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN
EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik
Lebih terperinciINFORMATION RETRIEVAL DOKUMEN TESIS UNTUK MENGETAHUI KEMIRIPANNYA DENGAN PENELITIAN YANG TELAH ADA
INFORMATION RETRIEVAL DOKUMEN TESIS UNTUK MENGETAHUI KEMIRIPANNYA DENGAN PENELITIAN YANG TELAH ADA Monica Mayeni 1, Wing Wahyu Winarno 2, Andi Sunyoto 3 1 Mahasiswa Pascasarjana MTI STMIK AMIKOM Yogyakarta
Lebih terperinciPEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN
PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi
Lebih terperinciSTMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011
STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 PENERAPAN METODE CLUSTERING HIRARKI AGGLOMERATIVE UNTUK KATEGORISASI DOKUMEN PADA WEBSITE SMA NEGERI
Lebih terperinciAPLIKASI PENDETEKSI PLAGIARISME TUGAS DAN MAKALAH PADA SEKOLAH MENGGUNAKAN ALGORITMA RABIN KARP
Versi Online: https://journal.ubm.ac.id/index.php/alu Vol.I (No. 1 ) : 12-17. Th. 2018 ISSN: 2620-620X APLIKASI PENDETEKSI PLAGIARISME TUGAS DAN MAKALAH PADA SEKOLAH MENGGUNAKAN ALGORITMA RABIN KARP Plagiarisme
Lebih terperinciROCCHIO CLASSIFICATION
DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi
Lebih terperinciKLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR
KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR Persyaratan Guna Meraih Gelar Sarjana Strata I Teknik Informatika Universitas Muhammadiyah Malang Nama : Ayu
Lebih terperinciIMPLEMENTASI METODE K-NEAREST NEIGHBOR DENGAN DECISION RULE UNTUK KLASIFIKASI SUBTOPIK BERITA
IMPLEMENTASI METODE K-NEAREST NEIGHBOR DENGAN DECISION RULE UNTUK KLASIFIKASI SUBTOPIK BERITA Abstract This research is about document classification using K-Nearest Neighbor method. We will develop a
Lebih terperinciIMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI
IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik
Lebih terperinciIMPLEMENTASI ALGORITMA VECTOR SPACE MODEL DALAM PENCARIAN E-BOOK
IMPLEMENTASI ALGORITMA VECTOR SPACE MODEL DALAM PENCARIAN E-BOOK Nurul Annisa 1),Warnia Nengsih, S.Kom., M.Kom. 2) & Ananda. S.kom., M.T. 3) Program Studi Sistem Informasi 12), Teknik Informatika Multimedia
Lebih terperinciPengujian Kerelevanan Sistem Temu Kembali Informasi
Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem
Lebih terperinciPenerapan Algoritma Jaro-Winkler Distance untuk Sistem Pendeteksi Plagiarisme pada Dokumen Teks Berbahasa Indonesia
62 Penerapan Algoritma Jaro-Winkler Distance untuk Sistem Pendeteksi Plagiarisme pada Dokumen Teks Berbahasa Indonesia Ahmad Kornain* 1, Ferry Yansen 2, Tinaliah 3 1,2,3 STMIK Global Informatika MDP Jl.
Lebih terperinciBAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
Lebih terperinciBAB 3 ANALISIS MASALAH DAN PERANCANGAN
BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk
Lebih terperinciSISTEM PENILAIAN OTOMATIS JAWABAN ESAI PADA ELEARNING BELAJARDISINI.COM
Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) p-issn: 2355-7699 Vol. 3, No. 4, Desember 2016, hlm. 248-252 e-issn: 2528-6579 SISTEM PENILAIAN OTOMATIS JAWABAN ESAI PADA ELEARNING BELAJARDISINI.COM
Lebih terperinciUKDW. Bab 1 PENDAHULUAN
Bab 1 PENDAHULUAN 1.1. Latar Belakang Masalah Pada dasarnya manusia menginginkan kemudahan dalam segala hal. Sifat tersebut akan memicu tindakan negatif apabila dilatar belakangi oleh motivasi untuk berbuat
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Kata Pengertian kata secara sederhana adalah sekumpulan huruf yang mempunyai arti. Dalam kamus besar bahasa indonesia (KBBI) pengertian kata adalah unsur bahasa yang diucapkan
Lebih terperinciSISTEM TEMU KEMBALI INFORMASI
SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik
Lebih terperinciSistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient
Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Berdasarkan data dari Kementerian Komunikasi dan Informasi Indonesia yang diperoleh dari Lembaga Riset Pasar E-Marketer, populasi pengguna internet tanah air pada tahun
Lebih terperinciPENGUKUR SEMANTIC SIMILARITY PADA ARTIKEL WEB DALAM UPAYA PENCEGAHAN PLAGIARISME
PENGUKUR SEMANTIC SIMILARITY PADA ARTIKEL WEB DALAM UPAYA PENCEGAHAN PLAGIARISME Anacostia Kowanda 1 Ika Pretty Siregar 2 Junior Lie 3 Nur Farida Irmawati 4 Detty Purnamasari 5 1,2,3,4 JurusanTeknik Informatika,
Lebih terperinciBAB I PERSYARATAN PRODUK
BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama
Lebih terperinciBAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang
BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang
Lebih terperinciBAB II LANDASAN TEORI. karya rekam secara profesional dengan sistem yang baku guna memenuhi
BAB II LANDASAN TEORI 2.1 Perpustakaan Perpustakaan adalah institusi pengelola karya tulis, karya cetak, atau karya rekam secara profesional dengan sistem yang baku guna memenuhi kebutuhan pendidikan,
Lebih terperinciSISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL
SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu
Lebih terperinciUKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
Lebih terperinciRANCANG BANGUN SISTEM PENCARIAN DOKUMEN JURNAL MENGGUNAKAN METODE BM25+
RANCANG BANGUN SISTEM PENCARIAN DOKUMEN JURNAL MENGGUNAKAN METODE BM25+ LEMBAR JUDUL SKRIPSI DENI SUPRIAWAN NIM. 1108605001 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN
Lebih terperinci