PENGUJIAN ALGORITMA LEVENSHTEIN DISTANCE DAN ALGORITMA TERM FREQUENCY INVERSE DOCUMENT FREQUNECY (TF-IDF) UNTUK PENILAIAN JAWABAN ESAI

Ukuran: px
Mulai penontonan dengan halaman:

Download "PENGUJIAN ALGORITMA LEVENSHTEIN DISTANCE DAN ALGORITMA TERM FREQUENCY INVERSE DOCUMENT FREQUNECY (TF-IDF) UNTUK PENILAIAN JAWABAN ESAI"

Transkripsi

1

2 PENGUJIAN ALGORITMA LEVENSHTEIN DISTANCE DAN ALGORITMA TERM FREQUENCY INVERSE DOCUMENT FREQUNECY (TF-IDF) UNTUK PENILAIAN JAWABAN ESAI Supandi Nangili 1, Abd.Aziz Bouty 2 Tajuddin Abdillah 3 1 Mahasiswa Fakultas Teknik, Universitas Negeri Gorontalo nangili911@gmail.com 2 Dosen Fakultas Teknik, Universitas Negeri Gorontalo abd.azizbouty@ung.ac.id 3 Dosen Fakultas Teknik, Universitas Negeri Gorontalo tajuddin@ung.ac.id ABSTRAK Algoritma Levenshtein Distance dan algoritma TF-IDF adalah algoritma yang gunakan untuk penilaian jawaban esai. Namun,kedua algoritma ini belum dilakukan pengujian dalam penerapannya.tujuan penelitian adalah melakukan pengujian terhadap algoritma Levenshtein Distance dan algoritma TF-IDF dalam menentukan nilai jawaban esai.metode penelitian yang digunakan pada penelitian ini yaitu metode penelitian eksperimen dengan empat tahapan penelitian yaitu: pengumpulan data, desain sistem, implementasi dan analisis pengujian.aplikasi yang dibuat dalam melakukan penilaian jawaban esai dapat menampilkan hasil pengujian setiap algoritma penilaian. Analisis pengujian yaitu menghitung persentase nilai error perhitungan algoritma Levenshtein Distance dan algoritma TF-IDF dengan perhitungan paling sedikit mempunyai nilai persentase error. Dari hasil analisis algoritma TF-IDF menghasilkan nilai persentase error paling sedikit yaitu 30,7418% dibandingkan dengan nilai persentase error algoritma Levenshtein Distance yaitu 65,76693%. Hasil ini menggunakan uji sampel terhadap 10 mahasiswa dengan memberikan empat contoh soal. Kata Kunci: Penilaian Esai, Algoritma Levenshtein Distance, Algoritma TF- IDF ABSTRACT Levenshtein DistanceAlgorithmand TF-IDF algorithmare algorithms are used to essay test assessment. However, those algorithms are not yet tested in their implementation. The research aimed at testing the Levenshtein Distance algorithm and TF-IDF algorithm in determining the score of the answer of essay test. The research applied experimental method with fourstagesof the research:data collection, system design, implementationandtestinganalysis. The application that has been made in assessing the answer of essay test can display the test result of each algorithm assessment. Testing analysis was by measuring the percentage of error score of Levenshtein Distance algorithm and TF-IDF algorithm measurement. The result shows that TF-IDF algorithm has the lowest score of error percentage which is 30,741% if it is compared with error percentage score percentage score of Levenshtein Distance Algorithm as 65,7669%. The result is gained through samples test to 10 students by giving four examples of test. Keywords: Assessment of Essay Test, Levenshtein Distance Algorithm, TF-IDF Algorithm

3 1. PENDAHULUAN Pemanfaatan teknologi dan komputasi dalam bidang pendidikan sudah tidak menjadi hal yang baru lagi. Berbagai macam sistem yang dibuat untuk membantu kinerja para pengguna sehingga lebih mudah untuk melakukan pekerjaan. Salah satu bantuan sistem yang dipergunakan adalah penilai jawaban otomatis. Dengan adanya sistem ini dapat membantu dalam menilai kemampuan seseorang untuk menjawab soal yang telah disediakan. Algoritma yang digunakan dalam melakukan penilaian terhadap jawaban esai yaitu algoritma Levenshtein Distance menggunakan perhitungan editdistance kemudian mencari nilai similarity, seperti pada penelitian yang dilakukan oleh Nafik (2012). Selain Algoritma Levenstein Distance, ada pula algoritma Term Frequency Inverse document Frequency (TF-IDF) yang digunakan untuk melakukan penilaian jawaban esai seperti dilakukan oleh Adam Asshidiq (2014) Penilaian Ujian Bertipe Uraian (essay) Menggunakan Metode Kemiripan Teks (Text Similarity) dalam penelitiannya yaitu menggunakan Algoritma TF-IDF. Algoritma Levenshtein Distance dan TF-IDF ini dianggap dapat memberikan nilai terhadap jawaban esai. Namun, apakah hasil uji Algoritma LevenshteinDistance memperoleh persentase error yang sama atau berbeda dibandingkan dengan Algoritma TF-IDF?. Berdasarkan penjelasan tersebut maka, dapat dirumuskan permasalahan yakni bagaimana hasil pengujian algoritma Levenshtein Distance dan algoritma TF- IDF dalam penilaian jawaban esai?. Setelah dirumuskan permasalah ini selanjutnya tujuan penelitian yaitu melakukan pengujian terhadap algoritma Levenshtein Distance dan algoritma TF-IDF dalam penerapannya untuk menentukan nilai jawaban esai. Sehingga manfaat yang dari penelitian adalah memberikan pengetahuan dan wawasan terhadap penggunaan algoritma Levenshtein Distance dan TF- IDF dalam penilaian jawaban esai, dan juga memberikan referensi terhadap penelitian lain dalam pembuatan sistem penilaian jawaban esai. 2. TINJAUAN PUSTAKA 2.1 Temu Kembali Informasi Temu kembali informasi (Information Retrieval) informasi merupakan proses pencarian informasi yang didasarkan pada suatu query yang diharapkan dapat memenuhi keinginan user dari kumpulan dokumen yang ada. Sebuah query merupakan suatu keywords dan dokumen yang mengandung keywords merupakan dokumen yang dicari dalam Sistem Temu Kembali Informasi (Infromation Retrieval System - IRS). Seperti yang dijelaskan oleh Mandala (dalam Zafikri, 2008), sistem temu kembali informasi ( Infromation Retrieval System) digunakan untuk menemukan kembali (retrieve) informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi. 2.2 Term Frequency/ Inverse document Frequency (TF/IDF) Algoritma TF/IDF merupakan suatu cara untuk memberikan bobot hubungan suatu kata ( Term) terhadap dokumen. Frekuensi kemunculan kata di dalam dokumen yang diberikan menunjukan seberapa penting kata tersebut di dalam dokumen. Sehingga bobot hubungan antara sebuah kata dan sebuah dokumen akan tinggi apabila frekuensi kata tinggi di dalam dan frekuensi keseluruhan dokumen yang mengandung kata tersebut akan rendah pada kumpulan dokumen (Fakhreza, 2011). Rumus umum untuk Tf-Idf : Wij= tƒij * Idƒ Wij = tƒij * log(n/n). (1) Keterangan : W ij = bobot kata/term t j terhadap dokumen d i tf ij = jumlah kemunculan kata/term t j di dalam d i N= jumlah semua dokumen yang ada dalam database

4 n= jumlah dokumen yang mengandung kata/term t j Berdasarkan rumus diatas, berapapun besarnya nilaiu tfij, apabila N = n maka akan didapatkan hasil 0 (nol) untuk perhitungan Idf. Untuk itu dapat ditambahkan nilai 1 (satu) pada sisi Idf, sehingga perhitungan bobotnya menjadi sebagai berikut : Wij = tƒij * (log(n/n)+1) (2) 2.3 Algoritma Levenshtein Distance Levenshtein Distance merupakan algoritma untuk menghitung kemiripan antar string berdasarkan total biaya terkecil dari transformasi salah satu string menjadi kata lain dengan menggunakan edit-rules, yaitu penambahan karakter insertion, penggantian karakter subtituion, dan penghapusan karakter deletion (Deddy Winarsono, 2009). Untuk lebih jelasnya perhatikan matrik ilustrasi pencarian Levenshtein Distance antara dua string berikut yaitu penjara dan jarak. Jika kita melihat sekilas, kedua string penjara dan jarak memiliki jarak 4 (empat). Berarti untuk mengubah string jarak menjadi penjara diperlukan 4 operasi yaitu : 1. Menyisipkan karakter p jarak = pjarak 2. Menyisipkan karakter e pjarak = pejarak 3. Menyisipkan karakter n pejarak = penjarak 4. Menghapus kerakter k penjarak = penjara Tabel 1Tabel Matrik Levenshtein Distance p e n j a r a j a r a k Dari proses pencarian nilai distancenya, didapat bahwa jumlah modifikasi minimum yang dilakukan untuk mengubah string jarak menjadi string penjara adalah sebanyak 4 operasi. Setelah mendapatkan biaya edit distancenya maka untuk menghitung Levenshtein Distance berikut : dengan rumus string similarity Nilai kemiripan (similarity score) diasumsikan pada rentang 0 (nol) hinggal 1 (satu), yang artinya nilai 1 adalah nilai maksimum yang menunjukan bahwa dua kata adalah sama identik. Pendekatan yang digunakan oleh peneliti mampu mengukur nilai kemiripan antar dua string berdasarkan pada susunan karakter. 3. METODE PENELITIAN Pada penelitian ini, objek yang menjadi sasaran peniliti adalah soal-soal dan jawaban dari mata kuliah sistem temu kembali informasi. Metode yang digunakan pada penelitian ini adalah metode penelitian eksperimen. Menurut Wiersma (2013) eksperimen sebagai suatu situasi penelitian yang sekurang-kurangnya satu variable bebas, yang disebut sebagai variable eksperimental, sengaja dimanipulasi oleh peneliti. Adapun tahapan penelitian dapat dilihat pada gambar 3.1 : Mulai Pengumpulan Data Desain Sistem Implementasi Analisi Pengujian Selesai Gambar 1Tahapan Penelitian 4. HASIL DAN PEMBAHASAN 1. Hasil a. Pengumpulan Data Peneliti melakukan perhitungan penilaian terhadap salah satu soal dan jawaban esai kemudian menghitung nilai kesamaan jawaban esai menggunakan sistem penilain Algoritma Levenshtein Distance dan TF-IDF. Sebelum melakukan

5 proses penilian jawaban dengan kedua algoritma tersebut terlebih dahulu melakukan preprocessing. Setelah melakukan preprocessing selajutnya melakukan proses penilaian dengan algoritma Levenshtein Distance dan algoritma TF-IDF. Adapun contoh soal yang digunakan sebagai berikut dengan bobot soal Soal :Jelaskan pengertian temu kembali informasi! - Kunci : Temu kembali informasi adalah sebuah media layanan bagi pengguna untuk memperoleh informasi atau sumber informasi yang dibutuhkan oleh pengguna - Mahasiswa: Temu kembali informasi adalah sistem penyedia layanan untuk mencari dan mendapatkan informasi. A. PreprocessingAlgoritma untuk kunci jawaban dan jawaban mahasiswa Gambar 2 Tahapan Preprocessing Berikut hasil Preprosesing : Tabel 1 Hasil Casefolding Teks Casefolding Kunci temu kembali informasi adalah sebuah media layanan bagi pengguna untuk memperoleh informasi atau sumber informasi yang dibutuhkan oleh pengguna. temu kembali informasi adalah sistem penyedia layanan untuk mencari dan mendapatkan informasi. Tabel 2 Hasil Tokenizing dan Filtering Teks Tokenizing temu;kembali;informasi;adalah ;sebuah;media;layanan;bagi;pe Kunci ngguna;untuk;memperoleh;inf ormasi;atau;sumber;informasi; yang;dibutuhkan;oleh;penggun a. temu;kembali;informasi;adalah ;sistem;penyedia;layanan;untu Teks Kunci k;mencari;dan;mendapatkan;in formasi. Filtering temu;kembali;informasi;seb uah;media;layanan;bagi;pen gguna;memperoleh;informa si;sumber;informasi;dibutuh kan;oleh;pengguna. temu;kembali;informasi;sist em;penyedia;layanan;menca ri;mendapatkan;informasi. Tabel 3Hasil Stemming Teks Stemming Kunci temu;kembali;informasi;buah; media;layan;bagi;guna;oleh;in formasi;sumber;informasi;but uh;oleh;guna. temu;kembali;informasi;siste m;sedia;layan;cari;dapat;infor masi. B. Perhitungan Algoritma Levenshtein Setelah melakukan Preprosesing tahap selanjutnya yaitu pencocokan string antara jawaban mahasiswa dengan kunci jawaban menggunakan algoritma Levenshtein Distance. Berikut flowchart ilustrasi pencocokan string menggunakan algoritma Levenshtein Distance.

6 Gambar 3 Flowchart Levenhstein Distance Proses penilaian menggunakan rumus Levenshtein Distance yaitu untuk mencari nilai similarity antara kedua string. Mencari nilai similarity yaitu dengan mengumpulkan informasi-informasi nilai yang menjadi rumus perhitungan nilai jawaban dan kunci jawaban. Berikut tabel informasi nilai. Tabel 4Informasi Nilai String String1 String2 Nilai = {1 42} * Jadi total nilai akhir perhitungan antara jawaban dan kunci jawaban menggunakan algoritma Levenshtein Distance dengan Bobot soal (80) adalah Kunci Dosen Hasil Preprosesing temukembaliinform asibuahmedialayan bagigunaolehinfor masisumberinforma sibutuholehguna temukembaliinform asisistemsedialayan caridapatinformasi Frekuensi dosen Frekuensi Mahasiswa Mahasiswa Term Panjan g String C. Perhitungan Algoritma TF-IDF Dalam melakukan proses penilaian terhadap jawaban, algoritma TF-IDF melakuan beberapa proses sebelum akhirnya menemukan nilai terhadap jawaban. Adapun langkah-langkah yang dilakukan yaitu : a. Menghitung Term jawaban dan kunci jawaban Tabel 5 Perhitungan tem TF TF Mahasis Dosen wa temu 1 temu 1 temu 1 1 kembali 1 kembali 1 kembali 1 1 informasi 3 informasi 2 informasi 3 2 buah 1 sistem 1 sistem 0 1 media 1 sedia 1 sedia 0 1 layan 1 layan 1 layan 1 1 bagi 1 cari 1 cari 0 1 guna 2 dapat 1 dapat 0 1 oleh 2 buah 1 0 sumber 1 media 1 0 butuh 1 bagi 1 0 guna 2 0 oleh 2 0 sumber 1 0 butuh 1 0 b. Menghitung bobot term Setelah melakukan perhitungan term frequency (tf), maka tahap selanjtunya adalah perhitungan bobot pada masingmasing term.rumus idf adalah idf ) dimana N adalah jumlah dokumen sedangkan df adalah banyaknya dokumen yang mengandung suatu term tertentu. perhitungan bobot menggunakan persamaan rumus tf-idf yang seperti ini : Rumus ini digunakan apabila N df, sedangkan apabila N = df akan menyebabkan nilai idf menjadi nol (0) maka harus di tambah (+) dengan 1. Sehingga menjadi : Tabel 6Perhitungan Bobot antara term Term Frekuensi Dosen Frekuensi Mahasiswa df idf Bobot Dosen Bobot Mahsiswa Bobot Nilai temu kembali informasi sistem sedia layan cari dapat buah media bagi guna oleh sumber butuh c. Konversi data kedalam vector Setelah menghitung bobot antar term, langkah berikutnya adalah mengkonversi data tersebut ke dalam suatu bentuk model ruang vector (vector space model). Salah satu bentuk konversi ini adalah dengan menghitung panjang vector untuk masing masing dokumen. Berikut adalah tabel hasil perhitungan panjang vector untuk masingmasing term dalam dokumen kunci jawaban dan jawaban.

7 Tabel 7 Perhitungan panjang vector term Bobot Bobot Pj. Vektor Pj. Vektor Bobot Term Mahasisw Nilai Dosen Dosen Mahasiswa a temu kembali informasi sistem sedia layan cari dapat buah media bagi guna oleh sumber butuh SUM SQRT Langkah terakhir adalah menghitung kemiripan dokumen ( matching documents). Matching document adalah tahap dimana akan dilakukan perhitungan tingkat kemiripan ( similarity) antara dokumen kunci jawaban dan dokumen jawaban. Perhitungannya menggunakan metode Cosine Similarity. Rumus yang digunakan adalah sebagai berikut : Untuk nilai akhir mahasiswa didapat dari hasil perkalian nilai similarity dengan bobot soal yaitu Nilai akhir = CosineSimilarity * Bobot nilai = * 80= Sehingga, penilaian jawaban menggunakan algoritma TF-IDF memperoleh nilai dengan bobot soal 80. Hasil pengumpulan data menunjukkan bahwa nilai algoritma Levenhstein Distanceyaitu dan algoritma TF-IDF yaitu dengan menghitung salah satu contoh soal dan jawabannya serta memberikan bobot nilai dari perhitungan ini yaitu 80. b. Desain Sistem a. Diagram Konteks Berkut ini adalah Gambaran diagram konteks. Gambar 4 Diagram Konteks d. Penilaian Berdasarkan rumus diatas, maka jumlah nilai bobot yaitu 4, sedangkan = akar dari jumlah panjag vector kunci sebesar = dan adalah = = akar dari jumlah panjang vector jawaban sebesar sehingga nilai similarity-nya adalah =

8 c. Implementasi Dalam implementasi ini akan dilihat hasil rancangan yang dibuat berdasarkan coding aplikasi yang dapat dilihat dalam hasil interface berikut ini : 1. Tampilan Login Pada form login ini dapat digunakan oleh 3 pengguna, Admin, dosen dan mahasiswa serta login masing-masing sesuai akun yang diperoleh oleh pengguna. Gambar 11Tampilan menu dosen soal 4. Tampilan Menu Ujian Mahasiswa Pada tampilan menu ujian ini mahasiswa dapat menjawab soal apabila sesuai dengan waktu yang telah ditentukan. Jika setelah menjawab soal klik tombol krim jawaban. Berikut tampilan menu ujian mahasiswa : Gambar 12 Menu Ujian Mahasiswa Gambar 9 Tampilan menu login 5. Tampilan Hasil Ujian Pada tampilan menu hasil ujian, mahasiswa dapat melihat nilai hasil ujian. Hasil ujian ini menampilkan hasil perhitungan Algoritma. Gambar 13 Hasil Ujian 2. Tampilan Menu Dosen Ujian Ini adalah tampilan untuk membuat Ujian. Ujian dibuat berdasarkan jadwal yang diinginkan. Gambar 10Tampilan menu dosen 3. Tampilan dosen Soal Pada tampilan dosen dapat menginputkan soal yang akan dibuat pada ujian. Oleh karena ujian telah dibuat maka selanjutnya pembuatan soal. d. Analisis Pengujian Pada tahap analisis pengujian ini, setiap algoritma Levenshtein Distance dan algoritma TF-IDF akan dilakukan pengujian berdasarkan persentase error algoritma.untuk dapat menghitung persentase error maka skenario yang digunakan yaitu dengan menggunakan sampel 10 mahasiswa dan memberikan 4 contoh soal yang harus dijawab. Penilaian jawaban tanpa menggunakan algoritma diperoleh dari penilaian dosen yang bersangkutan dalam hal ini mata kuliah yang menjadi objek penelitian Rumus yang digunakan untuk mencari persentase error dengan cara ; nilai maksimal jawaban dikurangi hasil bagi antara nilai algoritma dengan nilai tanpa algoritma kemudian dikalikan 100%. Berikut adalah rumus persentase error:

9 NA NTA No = Nilai Algoritma = Nilai Tanpa Algoritma Nilai Persentase error adalah 0-100%. Apabila perhitungan persentase error diatas dari 100% maka persentase error tersebut dianggap bernilai 100%. Namum apabila nilai tanpa algoritma bernilai 0, maka untuk memperoleh persentase error bernilai 0, nilai algoritma juga harus bernilai 0. Jika persentase error tidak bernilai 0, maka persentase error dianggap bernilai 100%. Berikut hasil penilaian tanpa menggunakan algoritma Tabel 8 Hasil Penilaian Tanpa Algoritma No Nama Mahasiswa Nilai Tanpa Algoritma Berdasarkan Soal Mahasiswa Mahasiswa Mahasiswa Mahasiswa Mahasiswa Mahasiswa Mahasiswa Mahasiswa Mahasiswa Mahasiswa Hasil analisis pengujian algoritma Levenshtein Distance Hasil persentase error algoritma dapat dilihat pada table berikut. Tabel 9Persentase Error Penilaian Algoritma Levenshtein Distance Nilai Tanpa Algoritma Nilai Lev. Distanc. Soal Ke - Presentase Error % Total Eror % ,18 8,861 10, ,7 65, , ,59 4,81 12,727 6,522 82,05 51,9 57,58 73,91 66, ,44 8,608 8,5 9,273 70,37 56, , ,35 7,848 17,727 9,13 63,25 60,76 40,91 63,48 57, ,034 5,57 8, ,04 59,83 72,15 13,64 56,52 50, ,838 6,329 8,6364 6,522 65,81 68,35 71, , ,615 11,9 10,455 6,522 76,92 40,51 65,15 73,91 64, ,148 4,557 8,571 9,167 59,26 77,22 65,71 69,44 67, ,402 9,873 9, ,74 52,99 50,63 61, , ,641 5,316 5,9091 9,565 71,79 73,42 76, ,39406 Rerata Error Algoritma Levensgtein Distance % = 65,76693 Berdasarkan hasil analisis pengujian untuk perhitungan persentase nilai error algoritma Levenshtein Distancememperoleh nilai error rata-rata 65,76693%. Hasil ini menunjukkan bahwa setiap penilaian jawaban esai menggunakan algoritma Levenshtein Distancememperolehnilai yang rata-rata rendah dengan nilai tanpa menggunakan algoritma. 2. Hasil analisis pengujian algoritma TF-IDF Hasil persentase error algoritma TF- IDF dapat dilihat pada table berikut : Tabel 10Persentase Error Penilaian Algoritma TF-IDF No Nilai Tanpa Algoritma Nilai TF-IDF Soal Ke - Presentase Error % Total Eror % ,7 18,598 25,157 24, ,012 16, , ,6 16,407 24,833 23,831 22,2 0 17,22 4,677 11, ,008 12,586 18, ,96 49, , ,12 17,921 28,108 16,165 14,38 10,39 6,305 35,34 16, ,04 18,402 22,995 24,476 9,824 7, ,41 9, ,33 17,893 22,55 14,095 28,37 10,54 24, , ,69 19,136 24,833 18,825 36,53 4,318 17,22 24,7 20, ,52 15,542 23,824 17,415 12,4 22,29 4,706 41,95 20, ,02 19,151 17,789 22,031 9,924 4,245 28, , ,49 17,472 23,971 23,723 17,57 12,64 4, ,58016 Rerata Error Algoritma TF-IDF % = 30,7418 Berdasarkan hasil analisis pengujian untuk perhitungan persentase nilai error algoritma TF-IDFmemperoleh nilai error rata-rata %. Hasil ini menunjukkan bahwa setiap penilaian jawaban esai menggunakan algoritma TF- IDF memperolehnilai yang rata-rata sama dengan nilai tanpa menggunakan algoritma. 2. Pembahasan Berdasarkan hasil penelitian yang dilakukan, algoritma Levenshtein Distance dan TF-IDF dapat diterapkan pada sistem penilaian jawaban esai. Ini dibuktikan dengan hasil yang diperoleh berdasarkan perhitungan masing-masing algoritma dengan terlebih dahulu melakukan preprosesing terhadap jawaban dan kunci jawaban. Hasil yang diperoleh masingmasing algoritma berbeda karena cara kerja algoritma itu sendiri. Algoritma TF-IDF mendapatkan nilai yang lebih tinggi yaitu karena melakukan perhitungan atau penilaian berdasarkan jumlah kemunculan kata. Semakin banyak kata yang muncul dalam dokumen, maka tinggkat kemiripan semakin tinggi. Berbeda

10 dengan algoritma Levenshtein Distance. Algoritma ini mendapatkan nilai yaitu dengan melakukan perhitungan atau penilaian berdasarkan keterbedaan huruf antara jawaban dan kunci jawaban. Semakin banyak perubahan atau perbedaan huruf antar dokumen maka tingkat kemiripan semakin rendah. Sebaliknya, apabila semakin sedikit perubahan atau perbedaan huruf antar dokumen maka tingkat kemiripan semakin tinggi. Setelah mendapatkan hasil dari setiap algoritma, selanjutnya melakukan pengujian setiap algoritma berdasarkan persetanse error dari setiap algoritma. Pada hasil analisis pengujian menunjukkan bahwa nilai persentase error algoritma TF- IDF lebih sedikit yaitu 30,7418% dan persentase error algoritma Levenshtein Distance yakni 65,76693%. Tabel 11 Hasil pengujian persentase error algoritma Error Algoritma No Algoritma % 1 Levenshtein Distance 65, TF-IDF 30,7418 Berdasarkan data pada tabel diatas dapat diketahui bahwa algoritma TF-IDF setelah dilakukan pengujian berdasarkan persentase error memperoleh nilai yaitu 30,7418%. Untuk algoritma Levenhstein Distance setelah dilakukan pengujian berdasarkan persentase error memperoleh nilai 65,76693% yang diujicobakan pada penilaian jawaban esai dengan sampel 10 mahasiswa, serta menggunakan 4 contoh soal (Nangili, 2014). 5. KESIMPULAN DAN SARAN 1. Kesimpulan Berdasarkan hasil penelitian perbandingan algoritma Levenshtein dan TF-IDF untuk penilaian jawaban esai, maka dapat disimpulkan : a. Algoritma Lenveshtein Distance dan TF- IDF dapat digunakan untuk melakukan penilaian jawaban esai. b. Hasil yang diperoleh dari perhitungan contoh soal dan jawaban esai sebelum diimplementasi dalam program sama hasilnya setelah diimplementasikan dalam program yaitu algoritma TF-IDF mendapatkan nilai dari bobot soal 80 dan algoritma Levenshtein Distance dengan bobot yang sama pada tahap pengumpulan data. c. Hasil analisis pengujian algoritma TF- IDF memperoleh nilai persentase error dengan jumlah 30,7418% dari 10 sampel mahasiswa dengan 4 contoh soal yang membuktikan bahwa algoritma ini baik untuk diterapkan dalam penilaian jawaban esai karena memperoleh nilai perhitungan algoritma rata-rata sama dengan nilai tanpa menggunakan algoritma. d. Hasil analisis pengujian algoritma Levenshtein Distance memperoleh persentase error dengan jumlah 65,76693% dari 10 sampel mahasiswa dengan 4 contoh soal. Algoritma ini juga bias diterapakan pada penilaian jawaban esai akan tetapi rata-rata nilai perhitungan algoritma yang diperoleh lebih rendah dengan nilai tanpa algoritma. e. Algoritma TF-IDF dapat menghitung similarity tanpa melihat struktur ataupun susunan dari beberapa kata, sementara algoritma Levenshtein Distance dapat menghitung similarity berdasarkan urutan huruf atau karakter dalam sebuah string. f. Kata-kata di dalam kunci jawaban sangat berpengaruh terhadap pemilihan kata yang dianggap sebagai keyword, sehingga mempengaruhi penilaian sistem. 2. Saran Pada penelitian ini masih terdapat kekurangan oleh karena itu peneliti mengharapkan agar hasil penelitian ini dapat dikembangkan lebih lanjut, adapun saran yang dapat diberikan untuk penelitian lebih selanjutnya antara lain: a. Dalam penelitian ini, teks kunci jawaban diusahakan menggunakan katakata yang relevan dan tidak mengandung kata-kata bias yang dianggap sebagai jawaban benar agar kata-kata tersebut menjadi kata kunci yang baik.

11 b. Penelitian ini dapat dikembangkan dengan membuat persamaan untuk katakata yang memiliki makna sama, menambahkan autocorrect untuk kesalahan penulisan jawaban, membedakan kalimat baik aktif maupun pasif, serta mengitung persamaan kata berdasarkan strukur kalimat. c. Lebih lanjut, aplikasi yang telah dibuat agar supaya ditambahkan sebuah bank soal yang memungkinkan untuk penyimpanan berbagai macam soal dan jawaban agar pembuat soal tidak lagi mencari-cari soal yang akan dibuat. Zafikri, A Implementasi Metode Term Frequency Inverse Document Frequency (TF -IDF) pada Sistem Temu Kembali Informasi, Medan : Universitas Sumatra Utara. REFERENSI Adam S Penilaian Ujian Bertipe Uraian ( essay) menggunakan Metode Kemiripan Teks ( Text Similarity). [Skripsi] diterbitkan. Surakarta : Universitas Sebelas Maret. Deddy W Sistem Penilaian Otomatis Kemiripan Kalimat Menggunakan Syntactic-Semantic Similarity Pada Sistem E-Learning, Jurnal Ilmiah Kursor,(Online),Vol.5,No.2,( kursor.trunojoyo.ac.id/wpcontent/u ploads/2012/02/vol5_no2_p1.pd f, diakses 20 Maret 2014). Emzir Metodologi Penelitian Kuantitatif dan Kualitatif (Edisi Revisi). Jakarta : Rajawali Pers. Muhamad Z. N Sistem Penilaian Otomatis Esai Menggunakan Algortima Levenshtein Distance, Jurnal Komputer. (Online),( download/article/file/dr , diakses 14 Februari 2014) Nangii S Pengujian Algoritma Levenshtein Distance dan Algoritma Term Frequency Inverse Document Frequency (TF-IDF) untuk Peniaian Esai. [Skripsi] tidak diterbitkan. Gorontalo : Universitas Negeri Gorontalo.

SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak

SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF Muh. Alfarisi Ali¹, Moh. Hidayat Koniyo², Abd. Aziz Bouty³ ¹Mahasiswa Teknik Informatika Universitas

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

PENILAIAN UJIAN BERTIPE URAIAN (ESSAY) MENGGUNAKAN METODE KEMIRIPAN TEKS (TEXT SIMILARITY) SKRIPSI

PENILAIAN UJIAN BERTIPE URAIAN (ESSAY) MENGGUNAKAN METODE KEMIRIPAN TEKS (TEXT SIMILARITY) SKRIPSI PENILAIAN UJIAN BERTIPE URAIAN (ESSAY) MENGGUNAKAN METODE KEMIRIPAN TEKS (TEXT SIMILARITY) SKRIPSI Disusun Oleh : ADAM ASSHIDIQ M0509001 JURUSAN INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tes Secara harfiah kata tes berasal dari kata bahasa prancis kuno: testum yang berarti piring untuk menyisihkan logam-logam mulia, dalam bahasa Indonesia diterjemahkan dengan

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &

Lebih terperinci

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB Abdul Rokhim 1), Achmad ainul yaqin 2) 1) Program Studi/Prodi

Lebih terperinci

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK F.13 TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK Bania Amburika 1*,Yulison Herry Chrisnanto 1, Wisnu Uriawan 2 1 Jurusan Informatika, Fakultas MIPA, Universitas

Lebih terperinci

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency PERSETUJUAI\ ARTIKEL ILMIAH Artikel ilmiah hasil penelitian mahasiswa: Nama NIM Mashar Eka Putra Dai 53 1409036 Program Studi S1-Sistem Informasi Jurusan Teknik Informatika Fakultas Teknik Judul Karya

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha ABSTRAK Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian atau penemuan kembali informasi yang relevan terhadap kebutuhan pengguna. Kebutuhan pengguna, diekspresikan

Lebih terperinci

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen

Lebih terperinci

SISTEM TEMU KEMBALI INFORMASI

SISTEM TEMU KEMBALI INFORMASI SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik

Lebih terperinci

KLASIFIKASI DOKUMEN NASKAH DINAS MENGGUNAKAN ALGORITMA TERM FREQUENCY INVERSED DOCUMENT FREQUENCY DAN VECTOR SPACE MODEL

KLASIFIKASI DOKUMEN NASKAH DINAS MENGGUNAKAN ALGORITMA TERM FREQUENCY INVERSED DOCUMENT FREQUENCY DAN VECTOR SPACE MODEL KLASIFIKASI DOKUMEN NASKAH DINAS MENGGUNAKAN ALGORITMA TERM FREQUENCY INVERSED DOCUMENT FREQUENCY DAN VECTOR SPACE MODEL MANUSCRIPT DOCUMENT CLASSIFICATION ALGORITHM USING THE OFFICE OF TERM FREQUENCY

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen

Lebih terperinci

MENENTUKAN NILAI TES ESAI ONLINE MENGGUNAKAN ALGORITMA LATENT SEMANTIC ANALYSIS (LSA) DENGAN PEMBOBOTAN TERM FREQUENCY/ INVERSE DOCUMENT FREQUENCY

MENENTUKAN NILAI TES ESAI ONLINE MENGGUNAKAN ALGORITMA LATENT SEMANTIC ANALYSIS (LSA) DENGAN PEMBOBOTAN TERM FREQUENCY/ INVERSE DOCUMENT FREQUENCY MENENTUKAN NILAI TES ESAI ONLINE MENGGUNAKAN ALGORITMA LATENT SEMANTIC ANALYSIS (LSA) DENGAN PEMBOBOTAN TERM FREQUENCY/ INVERSE DOCUMENT FREQUENCY SKRIPSI FAKHREZA AKBAR 071401014 PROGRAM STUDI S1 ILMU

Lebih terperinci

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami

Lebih terperinci

PERANCANGAN CLIENT DENGAN PENGKLASIFIKASIAN MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI MOSES CHRISTIAN

PERANCANGAN  CLIENT DENGAN PENGKLASIFIKASIAN  MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI MOSES CHRISTIAN PERANCANGAN EMAIL CLIENT DENGAN PENGKLASIFIKASIAN EMAIL MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI MOSES CHRISTIAN 081402050 PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI

Lebih terperinci

APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA

APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA Adhit Herwansyah Jurusan Sistem Informasi, Fakultas

Lebih terperinci

BAB II LANDASDAN TEORI

BAB II LANDASDAN TEORI DAFTAR ISI HALAMAN SAMPUL... HALAMAN JUDUL... i LEMBAR PERSETUJUAN... ii LEMBAR PENGESAHAN... iii MOTTO DAN PERSEMBAHAN... iv LEMBAR KEASLIAN... v HALAMAN PERNYATAAN PUBLIKASI... vi ABSTAKSI... vii ABSTRACT...

Lebih terperinci

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB I PENDAHULUAN I.1. Latar Belakang Masalah BAB I PENDAHULUAN I.1. Latar Belakang Masalah Dalam era teknologi seperti saat ini, informasi berupa teks sudah tidak lagi selalu tersimpan dalam media cetak seperti kertas. Orang sudah mulai cenderung

Lebih terperinci

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 1, No. 2, Tahun

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 1, No. 2, Tahun Vol. 1, No. 2, Tahun 2012 15 Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Website : http://jurnal.pcr.ac.id/index.php/jakt/about/index Email : pustaka@pcr.ac.id Aplikasi Pendeteksi Plagiat dengan

Lebih terperinci

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL (Studi Kasus Perpustakaan Universitas Udayana) LEMBAR JUDUL KOMPETENSI RPL SKRIPSI NI MADE

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks

Lebih terperinci

Implementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan

Implementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan Scientific Journal of Informatics Vol. 2, No. 2, November 2015 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Implementasi Vector Space Model dalam Pembangkitan Frequently

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan

Lebih terperinci

ROCCHIO CLASSIFICATION

ROCCHIO CLASSIFICATION DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi

Lebih terperinci

ABSTRAK. Kata kunci : Informasi, Information Retreival, Ant Colony Optimization, Graph, Fitur dokumen. vii

ABSTRAK. Kata kunci : Informasi, Information Retreival, Ant Colony Optimization, Graph, Fitur dokumen. vii ABSTRAK Untuk mendapatkan sebuah informasi pada saat ini sangatlah mudah. Dengan adanya internet orang dengan mudah untuk berbagi informasi. Informasi yang dibagikan biasanya dalam bentuk dokumen, artikel,

Lebih terperinci

PENGUNAAN METODE COSINESIMILARITY PADA SISTEM PENGELOMPOKAN KERJA PRAKTEK, TUGAS AKHIR DAN SKRIPSI

PENGUNAAN METODE COSINESIMILARITY PADA SISTEM PENGELOMPOKAN KERJA PRAKTEK, TUGAS AKHIR DAN SKRIPSI ISSN : 338-418 PENGUNAAN METODE COSINESIMILARITY PADA SISTEM PENGELOMPOKAN KERJA PRAKTEK, TUGAS AKHIR DAN SKRIPSI Randy Agung Wibowo (agung.wbowo9@gmail.com) Didik Nugroho (masdidiknugroho@gmail.com) Bebas

Lebih terperinci

BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer

BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Di era globalisasi seperti sekarang ini, perkembangan teknologi komputer berpengaruh besar pada tingkat kebutuhan manusia di berbagai bidang seperti bidang

Lebih terperinci

PERBANDINGAN METODE COSINE SIMILARITY DENGAN METODE JACCARD SIMILARITY PADA APLIKASI PENCARIAN TERJEMAH AL-QUR AN DALAM BAHASA INDONESIA

PERBANDINGAN METODE COSINE SIMILARITY DENGAN METODE JACCARD SIMILARITY PADA APLIKASI PENCARIAN TERJEMAH AL-QUR AN DALAM BAHASA INDONESIA PERBANDINGAN METODE COSINE SIMILARITY DENGAN METODE JACCARD SIMILARITY PADA APLIKASI PENCARIAN TERJEMAH AL-QUR AN DALAM BAHASA INDONESIA Ogie Nurdiana 1, Jumadi 2, Dian Nursantika 3 1,2,3 Jurusan Teknik

Lebih terperinci

Jurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017

Jurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017 TEXT MINING DALAM PENENTUAN KLASIFIKASI DOKUMEN SKRIPSI DI PRODI TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER BERBASIS WEB Teuku Muhammad Johan dan Riyadhul Fajri Program Studi Teknik Informatika Fakultas

Lebih terperinci

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada bab ini dijelaskan tentang langkah-langkah yang digunakan untuk membahas permasalahan pada penelitian ini. Gambar berikut ini menjelaskan tahapan yang dilakukan dalam

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan

Lebih terperinci

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Komang Rinartha

Lebih terperinci

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Text Mining Text mining merupakan suatu teknologi untuk menemukan suatu pengetahuan yang berguna dalam suatu koleksi dokumen teks sehingga diperoleh tren, pola, atau kemiripan

Lebih terperinci

DAFTAR ISI. SKRIPSI... ii

DAFTAR ISI. SKRIPSI... ii DAFTAR ISI SKRIPSI... i SKRIPSI... ii HALAMAN PENGESAHAN... ii PERNYATAAN... iii HALAMAN MOTO DAN PERSEMBAHAN... iv PRAKATA... v DAFTAR ISI... vii DAFTAR GAMBAR... x DAFTAR TABEL... xiii INTISARI... xiv

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Information Retrieval System Sistem temu kembali informasi ( information retrieval system) merupakan sistem yang dapat digunakan untuk menemukan informasi yang relevan dengan

Lebih terperinci

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 4, No. 1, Tahun

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 4, No. 1, Tahun Vol. 4, No. 1, Tahun 2015 61 Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Website : https://jurnal.pcr.ac.id/index.php/jakt/about Email : pustaka@pcr.ac.id Sistem Pendeteksi Kemiripan Proyek Akhir

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

JURNAL ITSMART Vol 4. No 2. Desember 2015 ISSN :

JURNAL ITSMART Vol 4. No 2. Desember 2015 ISSN : Analisis Perbandingan Metode Vector Space Model dan Weighted Tree Similarity dengan Cosine Similarity pada kasus Pencarian Informasi Pedoman Pengobatan Dasar di Puskesmas Viko Basmalah Wicaksono Jurusan

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kemajuan teknologi informasi dan komunikasi tidak hanya membawa dampak positif, tetapi juga membawa dampak negatif, salah satunya adalah tindakan plagiarisme (Kharisman,

Lebih terperinci

APLIKASI PENILAIAN UJIAN ESSAY OTOMATIS MENGGUNAKAN METODE COSINE SIMILARITY. Rahimi Fitri 1, Arifin Noor Asyikin 2

APLIKASI PENILAIAN UJIAN ESSAY OTOMATIS MENGGUNAKAN METODE COSINE SIMILARITY. Rahimi Fitri 1, Arifin Noor Asyikin 2 APLIKASI PENILAIAN UJIAN ESSAY OTOMATIS MENGGUNAKAN METODE COSINE SIMILARITY Rahimi Fitri 1, Arifin Noor Asyikin 2 mahaluddin@yahoo.com (1) Staf Pengajar Jurusan Teknik Elektro Politeknik Negeri Banjarmasin

Lebih terperinci

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Wahyudi,MT Laboratorium Sistem Informasi Fakultas Sains dan Teknologi UINSUSKA RIAU Jl.HR.Subrantas KM.15

Lebih terperinci

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

1.5 Metode Penelitian

1.5 Metode Penelitian BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam perkembangan teknologi internet yang semakin maju ini kita dapat mengakses dokumen, buku dan majalah mulai dari bahasa asing sampai bahasa daerah yang

Lebih terperinci

PERINGKASAN TEKS OTOMATIS DOKUMEN BAHASA INDONESIA DENGAN ALGORITMA GENETIKA LEMBAR JUDUL KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI

PERINGKASAN TEKS OTOMATIS DOKUMEN BAHASA INDONESIA DENGAN ALGORITMA GENETIKA LEMBAR JUDUL KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI PERINGKASAN TEKS OTOMATIS DOKUMEN BAHASA INDONESIA DENGAN ALGORITMA GENETIKA LEMBAR JUDUL KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI LUH GEDE PUTRI SUARDANI NIM. 1208605018 PROGRAM STUDI TEKNIK INFORMATIKA

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

PERINGKASAN TEKS BERITA SECARA OTOMATIS MENGGUNAKAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) SKRIPSI DANDUNG TRI SETIAWAN

PERINGKASAN TEKS BERITA SECARA OTOMATIS MENGGUNAKAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) SKRIPSI DANDUNG TRI SETIAWAN PERINGKASAN TEKS BERITA SECARA OTOMATIS MENGGUNAKAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) SKRIPSI DANDUNG TRI SETIAWAN 071402054 PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN

Lebih terperinci

Pemanfaatan Aljabar Vektor Pada Mesin Pencari

Pemanfaatan Aljabar Vektor Pada Mesin Pencari Pemanfaatan Aljabar Vektor Pada Mesin Pencari Anwar Ramadha 13514013 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Indonesia

Lebih terperinci

IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN

IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN Seminar Nasional Informatika 205 IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN Dedi Leman, Khusaeri Andesa 2 Teknik Informasi, Magister Komputer, Universitas

Lebih terperinci

Jurnal Coding, Sistem Komputer Untan Volume 04, No.1 (2016), hal ISSN : x

Jurnal Coding, Sistem Komputer Untan Volume 04, No.1 (2016), hal ISSN : x APLIKASI PENDETEKSI PLAGIAT TERHADAP KARYA TULIS BERBASIS WEB MENGGUNAKAN NATURAL LANGUAGE PROCESSING DAN ALGORITMA KNUTH-MORRIS-PRATT [1] Rio Alamanda, [2] Cucu Suhery, [3] Yulrio Brianorman [1][2][3]

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB III ANALISIS DAN PERANCANGAN SISTEM BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1. Analisis Masalah Setiap tahunnya, DPP Infokom selaku panitia Pelatihan Aplikasi Teknologi dan Informasi (PATI) Universitas Muhammadiyah Malang menerima ribuan

Lebih terperinci

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Dewasa ini, untuk mengukur pemahaman seseorang terhadap suatu materi yang diberikan sebelumnya, berbagai tes untuk mengukur pemahaman tersebut telah banyak

Lebih terperinci

PROGRAM BANTU PEMILIHAN LAGU PUJIAN BERDASARKAN TEMA KEBAKTIAN DENGAN MENGGUNAKAN METODE COSINUS SIMILARITY Studi Kasus: GKI Ngupasan

PROGRAM BANTU PEMILIHAN LAGU PUJIAN BERDASARKAN TEMA KEBAKTIAN DENGAN MENGGUNAKAN METODE COSINUS SIMILARITY Studi Kasus: GKI Ngupasan PROGRAM BANTU PEMILIHAN LAGU PUJIAN BERDASARKAN TEMA KEBAKTIAN DENGAN MENGGUNAKAN METODE COSINUS SIMILARITY Studi Kasus: GKI Ngupasan Hanto Harianto Kristanto Abstrak Pertimbangan untuk menentukan lagu

Lebih terperinci

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi

Lebih terperinci

Perbandingan Penggunaan Algoritma Cosinus dan Wu Palmer untuk Mencari Kemiripan Kata dalam Plagiarism Checker

Perbandingan Penggunaan Algoritma Cosinus dan Wu Palmer untuk Mencari Kemiripan Kata dalam Plagiarism Checker Perbandingan Penggunaan Algoritma Cosinus dan Wu Palmer untuk Mencari Kemiripan Kata dalam Plagiarism Checker 1 Aslihatul Millah, 2 Siti Nurazizah 1,2 Program Studi Sistem Informasi, Fakultas Sains dan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Kata Pengertian kata secara sederhana adalah sekumpulan huruf yang mempunyai arti. Dalam kamus besar bahasa indonesia (KBBI) pengertian kata adalah unsur bahasa yang diucapkan

Lebih terperinci

Implementasi Algoritma Levenshtein Pada Sistem Pencarian Judul Skripsi/Tugas Akhir

Implementasi Algoritma Levenshtein Pada Sistem Pencarian Judul Skripsi/Tugas Akhir 46 JURNAL SISTEM DAN INFORMATIKA Implementasi Algoritma Levenshtein Pada Sistem Pencarian Judul Skripsi/Tugas Akhir Ida Bagus Ketut Surya Arnawa STIKOM Bali Jl.Raya Puputan No. 86 Renon, Denpasar-Bali

Lebih terperinci

APLIKASI DETEKSI KEMIRIPAN TUGAS PAPER

APLIKASI DETEKSI KEMIRIPAN TUGAS PAPER APLIKASI DETEKSI KEMIRIPAN TUGAS PAPER Anthony Anggrawan 1, Azhari 2, 1 Tenaga Pengajar Teknik Informatika STMIK Bumigora Mataram 2 Mahasiswa Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

INFORMATION RETRIEVAL TUGAS AKHIR DAN PERHITUNGAN KEMIRIPAN DOKUMEN MENGACU PADA ABSTRAK MENGGUNAKAN VECTOR SPACE MODEL

INFORMATION RETRIEVAL TUGAS AKHIR DAN PERHITUNGAN KEMIRIPAN DOKUMEN MENGACU PADA ABSTRAK MENGGUNAKAN VECTOR SPACE MODEL INFORMATION RETRIEVAL TUGAS AKHIR DAN PERHITUNGAN KEMIRIPAN DOKUMEN MENGACU PADA ABSTRAK MENGGUNAKAN VECTOR SPACE MODEL Putri Elfa Mas`udia Jurusan Teknik Elektro, Program Studi Teknik Telekomunikasi Politeknik

Lebih terperinci

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 PENERAPAN METODE CLUSTERING HIRARKI AGGLOMERATIVE UNTUK KATEGORISASI DOKUMEN PADA WEBSITE SMA NEGERI

Lebih terperinci

ANALISIS DAN IMPLEMENTASI REGULAR EXPRESSION UNTUK PENGUMPULAN DATA DAN LEVENSHTEIN DISTANCE DALAM MEMBANDINGKAN DATA HALAMAN WEB

ANALISIS DAN IMPLEMENTASI REGULAR EXPRESSION UNTUK PENGUMPULAN DATA DAN LEVENSHTEIN DISTANCE DALAM MEMBANDINGKAN DATA HALAMAN WEB ANALISIS DAN IMPLEMENTASI REGULAR EXPRESSION UNTUK PENGUMPULAN DATA DAN LEVENSHTEIN DISTANCE DALAM MEMBANDINGKAN DATA HALAMAN WEB KOMPETENSI JARINGAN KOMPUTER [SKRIPSI] I WAYAN ADI SAPTANA NIM. 0708605089

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada era ini perkembangan teknologi informasi sangat pesat. Hal ini ditandai dengan semakin populernya penggunaan internet dan perangkat lunak komputer sebagai

Lebih terperinci

Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita

Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita Yoseph Samuel, Rosa Delima, Antonius Rachmat 1) Program Studi Teknik Informatika Universitas Kristen Duta Wacana,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

DETEKSI SIMILARITAS DOKUMEN ABSTRAK TUGAS AKHIR MENGGUNAKAN METODE LEVENSHTEIN DISTANCE

DETEKSI SIMILARITAS DOKUMEN ABSTRAK TUGAS AKHIR MENGGUNAKAN METODE LEVENSHTEIN DISTANCE DETEKSI SIMILARITAS DOKUMEN ABSTRAK TUGAS AKHIR MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Abdul Najib 1), Karyo Budi Utomo 2) 1), 2) Jurusan Teknologi Informasi, Politeknik Negeri Samarinda Email: abdulnajib@polnes.ac.id

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN Pada bab ini akan dibahas mengenai analisa proses information retrieval dengan menggunakan cosine similarity dan analisa proses rekomendasi buku dengan menggunakan jaccard

Lebih terperinci

PERANCANGAN DAN IMPLEMENTASI SISTEM PENILAIAN JAWABAN ESAI OTOMATIS MENGGUNAKAN ALGORITMA RABIN-KARP KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI

PERANCANGAN DAN IMPLEMENTASI SISTEM PENILAIAN JAWABAN ESAI OTOMATIS MENGGUNAKAN ALGORITMA RABIN-KARP KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI PERANCANGAN DAN IMPLEMENTASI SISTEM PENILAIAN JAWABAN ESAI OTOMATIS MENGGUNAKAN ALGORITMA RABIN-KARP KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI I PUTU DHARMA ADE RAHARJA NIM. 1108605037 PROGRAM STUDI

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

TEMU BALIK INFORMASI PADA DOKUMEN TEKS BERBAHASA INDONESIA DENGAN METODE VECTOR SPACE RETRIEVAL MODEL

TEMU BALIK INFORMASI PADA DOKUMEN TEKS BERBAHASA INDONESIA DENGAN METODE VECTOR SPACE RETRIEVAL MODEL TEMU BALIK INFORMASI PADA DOKUMEN TEKS BERBAHASA INDONESIA DENGAN METODE VECTOR SPACE RETRIEVAL MODEL Giat Karyono 1, Fandy Setyo Utomo 2 1 Program Studi Teknik Informatika, STMIK AMIKOM Purwokerto E-mail

Lebih terperinci

SISTEM PENILAIAN OTOMATIS JAWABAN ESSAY MENGGUNAKAN METODE COSINE MEASURE PADA SISTEM E-LEARNING ABSTRAK

SISTEM PENILAIAN OTOMATIS JAWABAN ESSAY MENGGUNAKAN METODE COSINE MEASURE PADA SISTEM E-LEARNING ABSTRAK Judul : Sistem Penilaian Otomatis Jawaban Essay Menggunakan Metode Cosine Measure Pada Sistem E-Learning Oleh : Lukman Hakim NIM : 1010651098 Fakultas : Teknik Jurusan : Teknik Informatika SISTEM PENILAIAN

Lebih terperinci

IMPLEMENTASI METODE K-NEAREST NEIGHBOR DENGAN DECISION RULE UNTUK KLASIFIKASI SUBTOPIK BERITA

IMPLEMENTASI METODE K-NEAREST NEIGHBOR DENGAN DECISION RULE UNTUK KLASIFIKASI SUBTOPIK BERITA IMPLEMENTASI METODE K-NEAREST NEIGHBOR DENGAN DECISION RULE UNTUK KLASIFIKASI SUBTOPIK BERITA Abstract This research is about document classification using K-Nearest Neighbor method. We will develop a

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Sumber informasi atau referensi sudah merupakan hal yang tidak asing lagi bagi seorang peneliti, terutamanya bagi para mahasiswa yang sedang melakukan penelitian untuk

Lebih terperinci

Identifikasi Kesalahan Penulisan Kata (Typographical Error) pada Dokumen Berbahasa Indonesia Menggunakan Metode N-gram dan Levenshtein Distance

Identifikasi Kesalahan Penulisan Kata (Typographical Error) pada Dokumen Berbahasa Indonesia Menggunakan Metode N-gram dan Levenshtein Distance Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No., Januari 208, hlm. 53-62 http://j-ptiik.ub.ac.id Identifikasi Kesalahan Penulisan Kata (Typographical Error) pada

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN IV.1. Hasil Dalam menyajikan hasil dan uji coba pada bab ini, penulis akan menyajikan beberapa tampilan dari aplikasi yang telah dibangun. Tampilan halaman aplikasi ini dibuat

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

BAB 3 ANALISIS DAN PERANCANGAN SISTEM BAB 3 ANALISIS DAN PERANCANGAN SISTEM Perancangan sistem dapat dibagi menjadi lima bagian, yaitu perancangan directory server, perancangan soal dan jawaban tes esai, perancangan algoritma penilaian tes

Lebih terperinci

BAB I PENDAHULUAN. Menurut Peraturan Menteri Pendidikan dan Kebudayaan (Permendikbud) Nomor 103

BAB I PENDAHULUAN. Menurut Peraturan Menteri Pendidikan dan Kebudayaan (Permendikbud) Nomor 103 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Kebutuhan informasi dibidang pendidikan dinilai cenderung meningkat. Menurut Peraturan Menteri Pendidikan dan Kebudayaan (Permendikbud) Nomor 103 Tahun 2014

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

BAB IV HASIL DAN UJI COBA

BAB IV HASIL DAN UJI COBA BAB IV HASIL DAN UJI COBA IV.1. Tampilan Hasil Hasil dari penerapan Metode Fuzzy TSukamoto dalam Pendukung Keputusan Penilaian Kinerja Karyawan pada PT. Taspen (Persero) Medan yang dibangun dapat dilihat

Lebih terperinci