SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak
|
|
- Iwan Kusumo
- 7 tahun lalu
- Tontonan:
Transkripsi
1
2 SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF Muh. Alfarisi Ali¹, Moh. Hidayat Koniyo², Abd. Aziz Bouty³ ¹Mahasiswa Teknik Informatika Universitas Negeri Gorontalo alfarisi.ayi@gmail.com ²Dosen Teknik Informatika Universitas Negeri Gorontalo hidayat.ung.ac.id ³Dosen Teknik Informatika Universitas Negeri Gorontalo abd.azizbouty@ung.ac.id Abstrak Melakukan sosialisasi hukum pidana di Indonesia tidaklah mudah, banyaknya pasal didalam KUHP membuat orang malas untuk membacanya. Oleh karena itu diperlukan sebuah sistem pencarian pasal untuk mengatasi masalah ini. Tujuan dari penelitian ini adalah mengembangkan sebuah sistem pencarian pasal-pasal pada KUHP dengan menggunakan metode TF-IDF. Proses pencarian dilakukan dengan cara memasukan kata kunci yang berhubungan dengan pasal yang ingin dicari pada KUHP, maka sistem akan menampilkan pasal yang berhubungan dengan kata kunci tersebut berdasarkan rangking dari perolehan bobot TF-IDF pada masing-masing pasal. Nilai TF-IDF sebuah pasal didapat dari hasil perkalian frekuensi kemunculan suatu kata pada pasal tersebut (TF), dengan logaritma dari hasil pembagian jumlah keseluruhan pasal dengan jumlah pasal yang mengandung kata tersebut (IDF). Tahapan yang dilakukan dalam penelitian ini yaitu tokenizing, stopword, dan term weighting. Hasil dari penelitian ini adalah sebuah aplikasi pencarian pasal yang dapat dijalankan pada platform android sehingga bisa digunakan secara mobile. Adapun kekurangan dalam penelitian ini yaitu tidak adanya proses stemming sehingga sistem tidak bisa melakukan pencarian dengan imbuhan yang berbeda-beda. Kata Kunci : Sistem pencarian, TF-IDF, KUHP
3 PENDAHULUAN Melakukan sosialisasi atau pemasyarakatan hukum pidana di Indonesia tidaklah mudah, bahkan dengan membagi-bagikan kitab undangundang kepada setiap warga Negara pun belum tentu bisa berjalan efektif. Mengingat banyaknya pasal yang terdapat pada undang-undang hukum pidana sehingga membuat orang malas untuk membaca apalagi memahaminya. Proses pencarian pasalnya pun terbilang rumit karena hanya untuk satu kasus saja, ada beberapa pasal yang menjelaskan kasus tersebut. Sehingga untuk dapat menemukan pasal yang ingin dicari pun sangat membutuhkan ketelitian. Maka dari itu, di perlukan sebuah wadah untuk memudahkan masyarakat dalam mempelajari undangundang hukum pidana di Indonesia dengan memudahkan dan mempercepat proses pencarian pasal tersebut. Pada tahun 2010 sudah dilakukan penelitian yang menghasilkan sebuah sistem pencarian pasal-pasal tindak pidana pelanggaran berdasarkan KUHP dengan menggunakan metode string matching boyer-moore (Sutawijaya, 2010). Dari hasil uji coba pencarian pasal yang telah dilakukan pada penelitian ini cukup memberikan hasil yang efisien. Hal ini dibuktikan dengan proses pencarian yang begitu cepat dengan mencocokan setiap karakter kata pada database berdasarkan query yang dimasukan oleh pengguna. Kelemahan yang ditemukan dalam sistem ini yaitu tidak adanya proses pembobotan pada setiap dokumen sehingga sistem tidak bisa menentukan dokumen yang paling relevan di antara dokumen-dokumen yang mengandung query. Hal ini membuat pengguna sistem masih tetap melakukan pencarian pasal di antara pasal-pasal yang ditampilkan oleh sistem. Berdasarkan permasalahan yang telah ada sebelumnya, maka penulis akan mengembangkan sebuah sistem pencarian pasal-pasal pada Kitab Undang-undang Hukum Pidana (KUHP) dengan menggunakan metode term frekuensi invers dokumen frekuensi (TF- IDF) untuk lebih mendukung proses temu kembali informasi pada sistem ini dengan memperhitungkan bobot pada setiap dokumen dalam hal ini pasal berdasarkan query yang dimasukan oleh pengguna sistem. Pada implementasinya sistem ini akan dijalankan pada platform android, sehingga nantinya sistem pencarian KUHP ini bisa digunakan secara mobile. TINJAUAN PUSTAKA 1. KUHP (Kitab Undang -undang Hukum Pidana) KUHP adalah sebuah kitab pedoman pelaksanaan hukum pidana pada sebuah negara, segala masalah mengenai tindak pidana terkandung di dalamnya. Menurut Teguh Prasetyo (dalam Fiandy, 2012), tindak pidana adalah perbuatan yang oleh aturan hukum dilarang dan diancam dengan pidana. Pengertian perbuatan di sini selain perbuatan yang bersifat aktif (melakukan sesuatu yang sebenarnya dilarang oleh hukum) dan perbuatan yang bersifat pasif (tidak berbuat sesuatu yang sebenarnya diharuskan oleh hukum). Sedangkan menurut Jonkers (dalam Fiandy, 2012), merumuskan bahwa Tindak pidana sebagai perisitiwa pidana yang diartikannya sebagai suatu perbuatan yang melawan hukum (wederrechttelijk) yang berhubungan dengan kesengajaan atau kesalahan yang dilakukan oleh orang yang dapat dipertanggung jawabkan. 2. Temu Kembali Informasi
4 Temu kembali informasi merupakan proses pencarian dokumen berdasarkan query yang dimasukan dengan mengukur tingkat kerelevanan dari suatu dokumen terhadap query tersebut. Menurut Saltea (dalam Kusumawardani, 2013) menjelaskan bahwa secara sederhana temu kembali informasi merupakan suatu sistem yang menyimpan informasi dan menemukan kembali informasi tersebut. Sedangkan menurut Mandala (dalam Zafikri, 2008), Sistem temu kembali informasi (information retrieval system) digunakan untuk menemukan kembali (retrieve) informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. 3. Metode TF-IDF Pada penelitian ini penulis akan menggunakan metode TF-IDF untuk membantu proses perhitungan bobot dalam setiap dokumen maupun istilah query. Metode TF-IDF ( Term Frequncy Inverse Document Frequency) merupakan suatu cara untuk memberikan bobot hubungan suatu kata (term) terhadap dokumen, Robertson (dalam Karmayasa, 2012). Metode pembobotan ini digunakan untuk mengurangi dominasi kata yang sering muncul pada setiap dokumen yang ada dalam database. Karena setiap kata yang sering muncul dalam pada setiap dokumen ini pada umumnya adalah kata yang tidak begitu penting, sebaliknya kata yang hanya muncul pada sedikit dokumen bahkan hanya terdapat pada satu dokumen saja akan mendapatkan bobot yang lebih besar pada perhitungan TF-IDF ini. Seperti yang dikemukakan oleh Mandala dan Setiawan (dalam Karmayasa, 2012), menjelaskan bahwa Faktor lain yang diperhatikan dalam pemberian bobot adalah kejarangmunculan kata ( term scarcity) dalam koleksi. Kata yang muncul pada sedikit dokumen harus dipandang sebagai kata yang lebih penting (uncommon tems) daripada kata yang muncul pada banyak dokumen. Pembobotan akan memperhitungkan faktor kebalikan frekuensi dokumen yang mengandung suatu kata ( inverse document frequency). Berikut adalah rumus perhitungan bobot pada algoritma TF-IDF (Zafikri, 2008) : W = tf * log ( d/df) Keterangan : W : Nilai bobot yang diperoleh oleh sebuah dokumen Tf : Jumlah kemunculan term (kata) D dalam sebuah dokumen : Jumlah semua dokumen dalam database Df : Jumlah dokumen yang mengandung term TAHAPAN PENELITIAN 1. Pengumpulan data Pada tahap ini, peneliti mengumpulkan data yaitu mengenai pasal-pasal yang diambil pada kitab undang-undang hukum pidana (KUHP). Selain pasal-pasal pada KUHP, kumpulan stopword juga akan menjadi acuan dalam pengumpulan data ini. 2. Preprocessing Dalam preprocessing ini akan dilakukan pengindeksan dokumen untuk menghasilkan sebuah index database. Pengindeksan ini dilakukan dengan melalui beberapa proses yaitu : a. Tokenizing (pemisahan kata) Pada proses ini setiap elemen teks (string) pada dokumen dipisahkan dengan menggunakan fungsi split dimana pemisahan string dilakukan berdasarkan white space (spasi dan tab) untuk kemudian diletakkan pada array. Tahapan ini juga menghilangkan karakter-karakter tertentu seperti tanda baca dan mengubah semua huruf ke bentuk huruf kecil (lower case). b. Stopword Stopword merupakan proses pembuangan kata-kata yang dianggap
5 tidak mempunyai makna seperti kata sambung. Pada proses ini digunakan daftar stopword yang disimpan dalam suatu tabel basis data, yang nantinya digunakan sebagai acuan penghilangan kata. c. Term weighting (TF-IDF) Setiap term (kata) diberikan bobot pada masing-masing dokumen sesuai dengan skema pembobotan kombinasi berupa perkalian bobot term frequency dan inverse document frequency (TF- IDF). Proses ini memperhitungkan frekuensi kemunculan kata serta mempertimbangkan dominasi kata pada semua dokumen. Kejarang munculan kata pada setiap dokumen akan mempengaruhi perhitungan bobot pada setiap kata dalam dokumen. Bobot dari setiap kata pada masing-masing dokumen ini kemudian akan disimpan ke dalam index database yang nantinya akan digunakan pada proses perangkingan nanti. d. Index database Pada tahap ini semua kata yang sudah diekstrak dengan melalui beberapa tahapan sebelumnya, ditata sebagai sebuah index. Index ini merupakan konversi dari dokumen asli ke dalam daftar kata yang terhubung dengan dokumen terkait dimana katakata tersebut muncul. Inilah yang disebut dengan index database. 3. Desain dan Implementasi Setelah dilakukan analisis sistem maka proses pencarian akan lebih mudah dilakukan. Karena yang dicari oleh sistem bukan lagi dokumen aslinya melainkan sebuah index database. Dalam proses pencarian ini terdapat beberapa tahapan yang dilakukan oleh sistem yaitu : a. Input query Input query merupakan sebuah tempat yang disediakan untuk pengguna sistem dalam memasukkan query. Query tersebut dirumuskan sendiri oleh pengguna berdasarkan apa yang ingin dicari dan melalui query inilah sistem melakukan proses penelusuran. b. Tokenizing Di dalam proses pencarian ini juga dilakukan Tokenizing untuk memisahkan setiap kata dalam query apabila pengguna memasukan query lebih dari satu kata. c. Stopword Proses stopword juga akan dilakukan untuk mengantisipasi jika pengguna memasukan kata yang tidak penting dalam query. 4. Uji coba Hasil implementasi dari penelitian dalam hal ini sistem pencarian pasal KUHP dengan metode TF-IDF akan dilakukan pengujian apakah sistem ini bisa membantu dalam mencari pasal yang sesuai/relevan dengan query. Dalam uji coba ini terdiri atas : a. Pencocokan string query pada index database Setiap string yang terdapat pada query yang dimasukan oleh user dan telah melewati proses tokenizing dan stopword akan dicocokan dengan string pada setiap term yang ada dalam index database. b. Perangkingan Setiap term pada index database yang memiliki kecocokan string dengan query akan digunakan setiap bobotnya pada masing-masing dokumen yang diperoleh dari perhitungan TF-IDF sebelumnya untuk melakukan pemanggilan dokumen dan diurutkan dari bobot yang tertinggi hingga yang terendah. c. Output Setelah melalui beberapa proses sebelumnya, maka akan ditampilkan hasil dari pencarian yang dilakukan yaitu berupa dokumen-dokumen dalam hal ini pasal-pasal KUHP yang dianggap relevan dengan query.
6 Preprocessing Tokenizing stopword Term weighting (TF-IDF) Index database Uji Coba Pencocokan string query pada index database Desain Dan Implementasi Input query Tokenizing stopword yaitu tokenizing, stopword, dan perhitungan bobot (TF -IDF). Setelah didapatkan bobot pada setiap kata maupun dokumen, maka pencarian pasal ini lebih mudah dilakukan karena perhitungan bobotnya sudah dilakukan terlebih dahulu pada preprocessing. Kelemahan yang ditemukan dalam sistem pencarian pasal ini yakni user diharuskan untuk lebih memperhatikan penggunaan imbuhan kata dalam memasukan kata kunci ( query). Karena jika imbuhan katanya tidak sesuai dengan yang ada di dalam database, maka sistem tidak bisa menemukan kata tersebut. a. Tokenizing Pada tokenizing ini yang pertama dilakukan adalah case folding, yaitu mengubah semua huruf yang ada pada tabel KUHP menjadi huruf kecil. Perangkingan Output Gambar 1 Langkah-langkah eksperimen HASIL DAN PEMBAHASAN Hasil dari penelitian ini adalah sebuah sistem pencarian pasal-pasal pada Kitab Undang-undang Hukum Pidana (KUHP). Dengan menerapkan metode TF-IDF, sistem dapat menentukan dokumen yang paling relevan terhadap query dengan memperhitungkan bobot setiap kata maupun dokumen. Sehingga pengguna sistem lebih terbantu dalam melakukan pencarian pasal. Dengan hanya memasukan kata kunci maka sistem akan menampilkan pasal-pasal yang berkaitan dengan kata kunci tersebut. Sistem ini diawali dengan melakukan preprocessing dengan beberapa tahapan Gambar 2 Sebelum proses case folding pada pasal 1 Gambar 3 Setelah proses case folding pada pasal 1
7 Proses selanjutnya yaitu pembersihan karakter-karakter tertentu seperti tanda baca (filter tanda baca). Gambar 4 Hasil filter tanda baca pada pasal 1 Proses terakhir pada tokenizing ini yaitu parsing kata, dimana setiap elemen teks ( string) pada tabel KUHP dipisahkan dengan menggunakan fungsi split. Pemisahan string dilakukan berdasarkan white space (spasi dan tab) untuk kemudian diletakkan pada array. Gambar 6 Tabel kata b. Stopword Pada proses ini digunakan daftar stopword yang disimpan pada table stopword untuk mengeliminasi kata-kata yang tidak terlalu penting pada tabel kata (contoh : atau, kemudian, akan, dan lain sebagainya). Gambar 5 Hasil parsing kata pada pasal 1 Hasil dari proses tokenizing ini kemudian disimpan pada tabel kata dalam database. Gambar 7 Proses stopword c. Term weighting Setiap term (kata) diberikan bobot pada masing-masing dokumen sesuai dengan skema pembobotan kombinasi berupa perkalian bobot term frequency dan inverse document frequency (TF- IDF). Proses ini diawali dengan menghitung nilai TF ( term frequency)
8 dari setiap kata yang terdapat pada tabel kata. Nilai TF ini dihitung berdasarkan frekuensi kemunculan setiap kata pada masing-masing dokumen. Gambar 8 Hasil perhitungan TF pada kata ahli Nilai TF pada masing-masing kata kemudian disimpan pada tabel NTF. Gambar 10 Hasil perhitungan IDF pada kata ahli Hasil perhitungan IDF pada setiap kata kemudian disimpan pada tabel IDF. Gambar 9 Tabel NTF Setelah ditemukan nilai TF maka dihitung nilai IDF masing-masing kata tersebut. Pada proses ini nilai IDF dari setiap kata didapat dari hasil pembagian jumlah semua pasal dalam database dengan jumlah pasal yang mengandung kata tersebut, kemudian dihitung logaritmanya. Gambar 11 Tabel IDF Setelah ditemukan nilai TF dan IDF pada masing-masing kata maupun dokumen, maka kedua nilai ini dikalikan untuk menghasilkan nilai TF-IDF.
9 e. Input query Input query merupakan sebuah tempat yang disediakan untuk pengguna sistem dalam memasukkan query. Query tersebut dirumuskan sendiri oleh pengguna berdasarkan apa yang ingin dicari dan melalui query inilah sistem melakukan proses penelusuran. Gambar 12 Hasil perhitungan TF-IDF pada kata ahli Pada gambar diatas dijelaskan bahwa J merupakan urutan dari idpasal yang mengandung kata ahli tersebut yang urutannya disini dimulai dari angka 0. Sehingga untuk posisi J=0 adalah idpasal 257. Frekuensi kemunculan kata ahli pada idpasal 257 kemudian dikalikan dengan nilai DIDF sehingga menghasilkan nilai TF- IDF. Jadi nilai TF-IDF untuk kata ahli pada idpasal 275 adalah 5, d. Index database Hasil dari preprocessing ini kemudian disimpan sebagai sebuah index database yang nantinya akan digunakan pada sistem pencarian pasal. Semua hasil preprocessing mulai dari tokenizing hingga perhitungan bobot TF- IDF tersimpan pada index database ini. Gambar 14 Tampilan input query Setelah memasukan query pada tempat yang disediakan, maka selanjutnya menekan tombol search. f. Pencocokan string String dalam index query akan dicocokan dengan string dalam tabel kata pada index database, jika ditemukan ada kecocokan maka dipanggil nilai TF-IDF kata yang ditemukan pada index database tersebut. Jika dalam satu dokumen pada index database ditemukan kecocokan lebih dari satu kata, maka nilai TF-IDF pada setiap kata tersebut akan dijumlahkan. Gambar 13 Index database Gambar 15 Hasil nilai TF-IDF untuk kata pencurian
10 g. Perangkingan Dari hasil penjumlahan nilai TF- IDF pada setiap dokumen, ditentukan rangking dokumen berdasarkan perolehan bobot pada masing-masing dokumen tersebut. Gambar 16 Hasil perangkingan pasal h. Output Setelah melalui beberapa proses sebelumnya, maka ditampilkan hasil dari pencarian yang dilakukan yaitu berupa dokumen-dokumen dalam hal ini pasal-pasal KUHP yang dianggap relevan dengan query. Gambar 17 Tampilan hasil pencarian KESIMPULAN DAN SARAN Kesimpulan dari hasil penelitian tentang Sistem pencarian pasal-pasal pada KUHP dengan menggunakan metode TF-IDF, yakni : 1. Proses pencarian pasal-pasal pada KUHP yang terdiri dari 569 pasal dapat dengan mudah dilakukan pada sistem ini, karena dengan hanya memasukan kata kunci (query), sistem dapat menampilkan pasal-pasal yang relevan dengan query. 2. Penggunaan metode TD-IDF dapat membantu sistem dalam menentukan pasal mana yang paling relevan terhadap query dengan menghitung dan menentukan bobot pada masingmasing kata maupun dokumen setelah melalui beberapa tahapan proses preprocessing. 3. Sistem ini dijalankan pada platform android serta dapat dijalankan secara offline. Saran yang diberikan peneliti untuk pengembangan sistem ini pada penelitian selanjutnya yaitu : 1. Penggunaan stemming (menghilangkan imbuhan) sangat diharapkan pada penelitian selanjutnya, untuk mempermudah sistem mencocokan kata dalam query dengan kata dalam index database walaupun dengan imbuhan yang berbeda-beda. 2. Sistem ini diharapkan bisa dikembangkan menjadi sistem yang bersifat online dan dinamis, sehingga bisa mengantisipasi jika adanya perubahan pasal pada KUHP dengan ditambahkan peran admin untuk mengatur perubahan tersebut. 3. Untuk lebih melengkapi data dalam sistem ini, diharapkan adanya
11 penambahan pasal-pasal untuk hukum perdata. REFERENSI Fiandy, Nur Ikhsan Tinjauan Yuridis Terhadap Tindak Pidana Penipuan (Studi Kasus Putusan No.337/Pid.B/2011/PN. Mks). [Skripsi]. Fakultas Hukum, Universitas Hasanuddin Makassar. Karmayasa, Oka dan Mahendra, Ida Bagus Implementasi Vector Space Model Dan Beberapa Notasi Metode Term Frequency Inverse Document Frequency (TF - IDF) Pada Sistem Temu Kembali Informasi. [Jurnal]. Program Studi Teknik Informatika, Jurusan Ilmu Komputer, Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Udayana. Informatika Fakultas Teknologi Industri Universitas Pembangunan Nasional Veteran Jawa Timur Surabaya. Zafikri, Atika Implementasi Metode Term Frequency Inverse Document Frequency (TF -IDF) Pada Sistem Temu Kembali Informasi. [skripsi]. Program studi s-1 Ilmu Komputer Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Sumatera Utara Medan. Kusumawardani, Devita Temu Kembali Informasi dengan keyword (Studi deskrip tif tentang sistem temu kembali informasi dengan controlled vocabulary pada field judul, subyek, dan pengarang di Perpustakaan Universitas Airlangga).[Jurnal]. Universitas Airlangga, PDF/jurnal%20Devita%20K. pdf Sutawijaya, Ikhwanul Dawam Sistem Pencarian Pasal- Pasal Tindak Pidana Pelanggaran Berdasarkan Kuhp Dengan Metode String Matching Boyer-Moore. [SKRIPSI]. Jurusan Teknik
PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency
PERSETUJUAI\ ARTIKEL ILMIAH Artikel ilmiah hasil penelitian mahasiswa: Nama NIM Mashar Eka Putra Dai 53 1409036 Program Studi S1-Sistem Informasi Jurusan Teknik Informatika Fakultas Teknik Judul Karya
Lebih terperinciSistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciIMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI
IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik
Lebih terperinciTEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK
F.13 TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK Bania Amburika 1*,Yulison Herry Chrisnanto 1, Wisnu Uriawan 2 1 Jurusan Informatika, Fakultas MIPA, Universitas
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan
Lebih terperinciBAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan
Lebih terperinciImplementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas
Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih
Lebih terperinciINFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER
INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,
Lebih terperinciPERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY
Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik
Lebih terperinciIMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB
IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB Abdul Rokhim 1), Achmad ainul yaqin 2) 1) Program Studi/Prodi
Lebih terperinciRANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan
RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Information Retrieval System Sistem temu kembali informasi ( information retrieval system) merupakan sistem yang dapat digunakan untuk menemukan informasi yang relevan dengan
Lebih terperinciKLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO
F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan
Lebih terperinciBAB I. Pendahuluan. 1. Latar Belakang Masalah
BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada era ini perkembangan teknologi informasi sangat pesat. Hal ini ditandai dengan semakin populernya penggunaan internet dan perangkat lunak komputer sebagai
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang Permasalahan
BAB 1 PENDAHULUAN 1.1 Latar Belakang Permasalahan Teknik Struktur Data dan Data Mining merupakan salah satu ilmu komputer yang penting dan menarik perhatian teori informatika. Saat ini teknik ini sudah
Lebih terperinciPemanfaatan Aljabar Vektor Pada Mesin Pencari
Pemanfaatan Aljabar Vektor Pada Mesin Pencari Anwar Ramadha 13514013 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Indonesia
Lebih terperinciPENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI
18 PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI Karter D. Putung, Arie Lumenta, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi Manado, Indonesia. karterputung@gmail.com,
Lebih terperinciIMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN
Seminar Nasional Informatika 205 IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN Dedi Leman, Khusaeri Andesa 2 Teknik Informasi, Magister Komputer, Universitas
Lebih terperincicommit to user BAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Cosine Similarity Secara umum, fungsi similarity adalah fungsi yang menerima dua buah objek dan mengembalikan nilai kemiripan (similarity) antara kedua objek
Lebih terperinciPeningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25
54 Widiasri, M., dkk.: Peningkatan Kinerja Pencarian Dokumen Tugas Akhir Menggunakan Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi
Lebih terperinciBAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Di era globalisasi seperti sekarang ini, perkembangan teknologi komputer berpengaruh besar pada tingkat kebutuhan manusia di berbagai bidang seperti bidang
Lebih terperinciPemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi
Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami
Lebih terperinciSistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)
Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Wahyudi,MT Laboratorium Sistem Informasi Fakultas Sains dan Teknologi UINSUSKA RIAU Jl.HR.Subrantas KM.15
Lebih terperinciStemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic
Lebih terperinciROCCHIO CLASSIFICATION
DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua
BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen
Lebih terperinciPEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN
PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi
Lebih terperinciPENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL
Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,
Lebih terperinciAnalisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem
Lebih terperinciBAB V EKSPERIMEN TEXT CLASSIFICATION
BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan
Lebih terperinciINDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
Lebih terperinciIMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM
IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM Laporan Tugas Akhir Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata
Lebih terperinciBAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
Lebih terperinciPengujian Kerelevanan Sistem Temu Kembali Informasi
Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem
Lebih terperinciIMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA
IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,
Lebih terperinciSistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient
Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,
Lebih terperinciBAB I PERSYARATAN PRODUK
BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama
Lebih terperinciJurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017
TEXT MINING DALAM PENENTUAN KLASIFIKASI DOKUMEN SKRIPSI DI PRODI TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER BERBASIS WEB Teuku Muhammad Johan dan Riyadhul Fajri Program Studi Teknik Informatika Fakultas
Lebih terperinciAPLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA
APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA Adhit Herwansyah Jurusan Sistem Informasi, Fakultas
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Kata Pengertian kata secara sederhana adalah sekumpulan huruf yang mempunyai arti. Dalam kamus besar bahasa indonesia (KBBI) pengertian kata adalah unsur bahasa yang diucapkan
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.
Lebih terperinciSISTEM TEMU KEMBALI INFORMASI
SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem
Lebih terperinciSISTEM PENCARIAN PASAL-PASAL TINDAK PIDANA PELANGGARAN BERDASARKAN KUHP DENGAN METODE STRING MATCHING BOYER-MOORE SKRIPSI
SISTEM PENCARIAN PASAL-PASAL TINDAK PIDANA PELANGGARAN BERDASARKAN KUHP DENGAN METODE STRING MATCHING BOYER-MOORE SKRIPSI Diajukan Untuk Memenuhi Sebagai Persyaratan Dalam Memperoleh Gelar Sarjana Komputer
Lebih terperincibeberapa tag-tag lain yang lebih spesifik di dalamnya.
metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk
Lebih terperinciContoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor
Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor Persoalan 1: Ada 4 dokumen (D1 s.d D4): D1: dolar naik harga naik penghasilan turun D2: harga naik harusnya gaji juga naik D3: Premium tidak
Lebih terperinciBAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
Lebih terperinciPENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA
PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA Suprianto 1), Sunardi 2), Abdul Fadlil 3) 1 Sistem Informasi STMIK PPKIA Tarakanita Rahmawati 2,3 Magister Teknik Informatika Universitas
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN Bab ini akan membahas tentang analisa dan perancangan aplikasi source detection pada kasus plagiarisme dokumen menggunakan biword winnowing dan retrieval berbasis Okapi BM25.
Lebih terperinciJurnal Coding, Sistem Komputer Untan Volume 04, No.1 (2016), hal ISSN : x
APLIKASI PENDETEKSI PLAGIAT TERHADAP KARYA TULIS BERBASIS WEB MENGGUNAKAN NATURAL LANGUAGE PROCESSING DAN ALGORITMA KNUTH-MORRIS-PRATT [1] Rio Alamanda, [2] Cucu Suhery, [3] Yulrio Brianorman [1][2][3]
Lebih terperinciAnalisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak
Lebih terperinciJurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 2, Februari 2018, hlm. 838-847 http://j-ptiik.ub.ac.id Sistem Temu Kembali Informasi Pasal-Pasal KUHP (Kitab Undang-
Lebih terperinciBAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada zaman seperti sekarang ini, jurnal atau berita elektronik merupakan suatu bentuk hasil karya dari seseorang yang sudah familiar. Di dalam karyakarya tersebut
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN Pada bab ini akan dibahas mengenai analisa proses information retrieval dengan menggunakan cosine similarity dan analisa proses rekomendasi buku dengan menggunakan jaccard
Lebih terperinci2BAB 2 LANDASAN TEORI
2BAB 2 LANDASAN TEORI 2.1. Peringkasan Teks Otomatis Sering kali kita membutuhkan ringkasan dari sebuah bacaan untuk mendapatkan secara ringkas dan cepat isi dari bacaan. Konsep sederhana dari ringkasan
Lebih terperincicommit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari
Lebih terperinciImplementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan
Scientific Journal of Informatics Vol. 2, No. 2, November 2015 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Implementasi Vector Space Model dalam Pembangkitan Frequently
Lebih terperinciBAB II TINJAUAN PUSTAKA
7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Sumber informasi atau referensi sudah merupakan hal yang tidak asing lagi bagi seorang peneliti, terutamanya bagi para mahasiswa yang sedang melakukan penelitian untuk
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian
Lebih terperinciBAB III PERANCANGAN APLIKASI & MEKANISME PEMBOBOTAN SICBI
BAB III PERANCANGAN APLIKASI & MEKANISME PEMBOBOTAN SICBI 3.1. KONSEP APLIKASI SIMPLE-O adalah aplikasi penilaian esai otomatis berbasis web yang dikembangkan di Indonesia, tepatnya di Departemen Teknik
Lebih terperinciIndexing dan Bahasa Penelusuran
LOGO Indexing dan Bahasa Penelusuran Sugeng Priyanto Indexing Definisi : sebuah proses untuk melakukan pengindeksan terhadap kumpulan dokumen yang akan disediakan sebagai informasi kepada pemakai. Proses
Lebih terperinciJURNAL ITSMART Vol 4. No 2. Desember 2015 ISSN :
Analisis Perbandingan Metode Vector Space Model dan Weighted Tree Similarity dengan Cosine Similarity pada kasus Pencarian Informasi Pedoman Pengobatan Dasar di Puskesmas Viko Basmalah Wicaksono Jurusan
Lebih terperinciPENCARIAN ALAMAT FASILITAS UMUM MENGGUNAKAN METODE VECTOR SPACE MODEL ( STUDI KASUS KOTA PEKANBARU ) TUGAS AKHIR
PENCARIAN ALAMAT FASILITAS UMUM MENGGUNAKAN METODE VECTOR SPACE MODEL ( STUDI KASUS KOTA PEKANBARU ) TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Pada Jurusan Teknik
Lebih terperinciSTMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011
STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 PENERAPAN METODE CLUSTERING HIRARKI AGGLOMERATIVE UNTUK KATEGORISASI DOKUMEN PADA WEBSITE SMA NEGERI
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN SISTEM
BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1. Analisis Masalah Setiap tahunnya, DPP Infokom selaku panitia Pelatihan Aplikasi Teknologi dan Informasi (PATI) Universitas Muhammadiyah Malang menerima ribuan
Lebih terperinciFatkhul Amin Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang
45 Dinamika Teknik Januari IMPLEMENTASI SEARCH ENGINE (MESIN PENCARI) MENGGUNAKAN METODE VECTOR SPACE MODEL Dosen Fakultas Teknologi Informasi Universitas Stikubank Semarang Abstract Growth of Machine
Lebih terperinciUKDW BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan pengetahuan dan kehidupan manusia sungguh dipercepat dengan kemudahan akses terhadap begitu banyak informasi. Pada beberapa waktu yang lalu akses terhadap
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Text Mining Text mining merupakan suatu teknologi untuk menemukan suatu pengetahuan yang berguna dalam suatu koleksi dokumen teks sehingga diperoleh tren, pola, atau kemiripan
Lebih terperincidimana P(A B) artinya peluang A jika diketahui keadaan B. Kemudian dari persamaan 2.1 didapatkan persamaan 2.2.
1.1 Naive Bayes Classifier Naive bayes classifier merupakan salah satu metode machine learning yang dapat digunakan untuk klasifikasi suatu dokumen. Teorema bayes berawal dari persamaan 2.1, yaitu: (2.1)
Lebih terperinciUKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN
BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI Pada bab ini akan dibahas mengenai beberapa landasan teori yang digunakan untuk perancangan dan pembuatan aplikasi rekomendasi informasi yang bisa dijadikan sebagai acuan. 3.1 Media
Lebih terperinciPERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL
PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL (Studi Kasus Perpustakaan Universitas Udayana) LEMBAR JUDUL KOMPETENSI RPL SKRIPSI NI MADE
Lebih terperinciKLASIFIKASI DOKUMEN NASKAH DINAS MENGGUNAKAN ALGORITMA TERM FREQUENCY INVERSED DOCUMENT FREQUENCY DAN VECTOR SPACE MODEL
KLASIFIKASI DOKUMEN NASKAH DINAS MENGGUNAKAN ALGORITMA TERM FREQUENCY INVERSED DOCUMENT FREQUENCY DAN VECTOR SPACE MODEL MANUSCRIPT DOCUMENT CLASSIFICATION ALGORITHM USING THE OFFICE OF TERM FREQUENCY
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat
Lebih terperinciIntegrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction
Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Sistem Temu Kembali Informasi Sistem temu kembali informasi (information retrieval system) digunakan untuk menemukan kembali (retrieve) informasi-informasi yang relevan terhadap
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Sistem Temu Kembali Informasi Sistem Temu Kembali Informasi atau Information Retrieval (IR) adalah kegiatan untuk menemukan suatu material (dokumen) dari data yang tidak terstruktur
Lebih terperinciTEMU BALIK INFORMASI PADA DOKUMEN TEKS BERBAHASA INDONESIA DENGAN METODE VECTOR SPACE RETRIEVAL MODEL
TEMU BALIK INFORMASI PADA DOKUMEN TEKS BERBAHASA INDONESIA DENGAN METODE VECTOR SPACE RETRIEVAL MODEL Giat Karyono 1, Fandy Setyo Utomo 2 1 Program Studi Teknik Informatika, STMIK AMIKOM Purwokerto E-mail
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI Pada bab ini berisi tentang data dan informasi yang berkaitan dengan pokok permasalahan yang akan diuji, yaitu dengan mendalami tentang klasifikasi teks. Selain itu juga membahas
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Hukum acara pidana yang tertuang dalam Kitab Undang-undang Hukum Acara Pidana (KUHAP), merupakan kumpulan aturan-aturan yang digunakan untuk melaksanakan tata
Lebih terperinciText Pre-Processing. M. Ali Fauzi
Text Pre-Processing M. Ali Fauzi Latar Belakang Latar Belakang Dokumen-dokumen yang ada kebanyakan tidak memiliki struktur yang pasti sehingga informasi di dalamnya tidak bisa diekstrak secara langsung.
Lebih terperinci1.5 Metode Penelitian
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam perkembangan teknologi internet yang semakin maju ini kita dapat mengakses dokumen, buku dan majalah mulai dari bahasa asing sampai bahasa daerah yang
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Dalam kehidupan sehari-hari, seorang individu memiliki berbagai jenis kebutuhan dimana kebutuhan tersebut tidaklah mutlak sama antar setiap individu. Tetapi ada satu
Lebih terperinciSistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN
Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Dokumen Penyimpanan yang Terorganisasi Database Mahasiswa Database Buku ID Nama Buku Pengarang 001 Information Retrieval Ricardo baeza
Lebih terperinci