APLIKASI PREDICTIVE TEXT BERBAHASA INDONESIA DENGAN METODE N-GRAM
|
|
|
- Indra Sumadi
- 9 tahun lalu
- Tontonan:
Transkripsi
1 APLIKASI PREDICTIVE TEXT BERBAHASA INDONESIA DENGAN METODE N-GRAM Silvia Rostianingsih 1), Sendy Andrian Sugianto 2), Liliana 3) 1, 2, 3) Program Studi Teknik Informatika Fakultas Teknologi Industri Universitas Kristen Petra 1, 3) Abstrak Aplikasi untuk memproses kata dengan dibantu prediksi kemunculan sebuah kata membantu mempercepat proses pengetikkan. Predictive text banyak diaplikasikan pada perangkat komunikatif yang membutuhkan input text, seperti komputer, personal digital assistant (PDA), dan telepon selular. Metode lain yang dapat digunakan adalah n-gram. Metode n-gram digabung dengan fungsi scoring yang mendukung prediksi kata, yaitu language model dan semantic affinity. Language model didasarkan pada urutan kata dan kata yang paling sering digunakan dalam input-an teks, sedangkan semantic affinity didasarkan pada kemungkinan kata-kata tersebut muncul bersama dalam sebuah kalimat. Proses dimulai dengan memecah kata per kata dan mengelompokkannya sesuai dengan language model. Selanjutnya dilakukan proses scoring untuk menentukan kata mana yang sesuai untuk menjadi pilihan prediksi kata. Hasil pengujian menunjukkan bahwa metode bigram dan trigram dalam language model mempengaruhi sistem predictive text, karena setiap scoring yang dilakukan oleh sistem mengacu pada language model dari kata yang diprediksi. Keystroke saving yang dihasilkan dapat mencapai angka 25% bergantung pada data training. Rata-rata prediksi efektif terjadi di atas 30% dari total prediksi yang terjadi. Hal ini dikarenakan oleh pengaruh dari language model yang dapat memprediksi kata dengan lebih efektif dan akurat. Kata kunci : N-gram, Keystroke Saving, Predictive Text Pendahuluan Untuk dapat membantu pengguna aplikasi editor text agar dapat mengetikkan nasikahnya lebih cepat, maka salah satunya adalah diperlukannya fungsi yang dapat memprediksi kata-kata apa akan digunakan oleh pengguna berdasarkan kalimat yang sering diketikkan. Sehingga dengan hanya mengetikkan beberapa karakter awal dari kata tersebut, prediksi kata-kata yang dimaksud dapat muncul dengan sendirinya. Pemrograman dilakukan menggunakan bahasa C# dan penyimpanan data menggunakan file text. Aplikasi yang dibuat adalah editor yang dapat menghasilkan file.txt. Cara pengujian yang dilakukan adalah dengan menginputkan beberapa kalimat bahasa Indonesia pada aplikasi editor sebagai isi file, lalu disimpan terlebih dahulu. Setelah itu, dibuka halaman baru untuk mengetikkan kembali kalimat yang mirip dengan yang telah diinputkan untuk menilai seberapa akurat predictive text yang muncul sesuai dengan kalimat awal yang sudah diinputkan Studi Pustaka Predictive Text adalah sebuah fitur pada pengetikan yang bertujuan mengurangi keystroke dalam pengetikan dengan cara memprediksi kata yang akan muncul berdasarkan huruf yang diketikkan. Metode T9 adalah metode yang digunakan pada mobile device yaitu membandingkan kemungkinan kata ke database linguistik untuk "menebak" kata dimaksudkan (M. Silfverberg, 2000)]. Metode lain adalah n-gram yang dilakukan dengan menghitung probabilitas bersyarat untuk sebuah kata dari urutan kata sebelumnya (Yousef Bassil, 2012). N-gram tidak terlalu sensitif terhadap kesalahan penulisan yang terdapat pada suatu dokumen (Ahmad Hanafi, 2009). Sebuah n- gram adalah sebuah kumpulan kata dengan masing-masing memiliki panjang n kata. Sebagai contoh, sebuah n-gram ukuran 1 disebut sebagai unigram; ukuran 2 sebagai bigram ; ukuran 3 sebagai "trigram", dan seterusnya. Untuk mendukung predictive text maka dilakukan penggabungan metode n-gram dengan fungsi scoring seperti language model dan semantic affinity. Language model didasarkan pada urutan kata dan kata yang paling sering digunakan dalam input-an teks, sedangkan semantic affinity didasarkan pada kemungkinan kata tersebut muncul bersama dalam sebuah kalimat (Yousef Bassil, 2012). Language Model adalah metode input berdasarkan frekuensi kata dan tidak peka terhadap 1
2 SNTI V-2014 Universitas Trisakti ISBN :. konteks dan bobot ditentukan dengan mengiterasi subset dari kombinasi yang mungkin (Jakob Jorwall, 2009). Sebuah interpolasi linier dari n-gram yang berbeda menjadi: (1) = weights t untuk spesifik n-gram Dengan menggunakan n-gram yang panjangnya tidak lebih dari tiga, model hanya membutuhkan kata-kata tersebut berada dalam sebuah kelompok yang masing-masing maksimal hanya berisi tiga kata di dalam korpus. Semantic affinity antara dua kata untuk mengukur hubungan dalam kalimat (Jianhua Li and Graeme Hirst, 2005), terdefinisi sebagai berikut: (2) C(w i,w j ) = jumlah berapa kali kata w i dan w j terjadi dalam sebuah kalimat di dalam korpus C(w i ) = jumlah kata w i di dalam korpus. Hubungan simetrisnya adalah : (3) Afinitas semantiknya diperkirakan dari sebuah kata w, didefinisikan sebagai berikut: (4) H = konteks kata w (mengandung kata-kata dari sebelah kiri kata saat ini) Metodologi Penelitian Metodologi penelitian dilakukan dengan mempelajari tentang metode N-Gram-Based, dilanjutkan dengan membuat perancangan sistem tentang pengolahan kata dan metode scoring kata. Pembuatan perangkat lunak yaitu dengan mengimplementasikan desain sistem yang telah dibuat ke dalam bahasa pemrograman, meliputi language model, frequency scoring, semantic scoring, Ngram scoring. Selanjutnya dilakukan pengujian aplikasi dalam melakukan prediksi dan keystroke saving yang dihasilkan oleh tiap metode scoring. Kesimpulan dilakukan dengan membandingkan hasil prediksi dan keystroke saving yang dihasilkan dari aplikasi. Desain Sistem Dalam melakukan predictive text, user terlebih dahulu memasukkan metode n-gram yang digunakan. Selanjutnya sistem akan melakukan load file kata yang ada sesuai metode n-gram yang dipilih. Sistem akan membaca input karakter dari user dan melakukan parsing data. Selanjutnya sistem melakukan searching dan scoring kata dari file untuk menghasilkan predictive text. Terakhir, sistem memberikan usulan kata yang menjadi predictive text kepada user. Rancangan sistem kerja aplikasi secara garis besar ditunjukkan pada Gambar 1.
3 Gambar 1. Desain Sistem Kerja Predictive Text Parsing dilakukan saat ada input huruf dari user. Parsing dilakukan jika pada aplikasi telah tersimpan 2 kata atau lebih. Parsing adalah proses untuk membagi kata-kata menjadi rangkaian kata sepanjang n, dimana n adalah sesuai metode n-gram yang dipilih. Untuk proses parsing data sendiri, kata-kata yang di-parsing adalah kata-kata dari dokumen baru / dokumen yang sedang aktif yang telah terdapat input-an karakter baru dari user dan sudah membentuk kata. Proses cleaning string dilakukan untuk membersihkan kata dari tanda baca atau lain yang tidak dibutuhkan. Kata dijadikan lower case, selanjutnya dipecah berdasarkan spasi menjadi kumpulan kata yang terdiri dari satu kata. Selanjutnya kata dikelompokkan sesuai dengan metode n-gram yang dipilih. Proses Get Input Data pada Gambar 2 digunakan untuk menentukan kata yang diusulkan menjadi pilihan kata predictive text. Pertama dilakukan pencarian kata yang dapat diusulkan menjadi pilihan kata predictive text dari file (proses searching), dan yang kedua adalah proses penilaian dari tiap kata yang telah dipilih untuk menjadi pilihan predictive text (proses scoring). Setelah mendapat input, proses berikutnya adalah frequency scoring pada Gambar 3 yaitu mengolah data input untuk mencari kata yang berpotensi menjadi usulan kata predictive text pada file. Usulan kata diolah untuk menjadi pilihan predictive text. Ada 3 penilaian yang dilakukan, yang pertama adalah penilaian berdasarkan frekuensi kata pernah keluar, baik dalam dokumen yang sedang diketik user maupun dalam dokumen-dokumen sebelumnya. 3
4 SNTI V-2014 Universitas Trisakti ISBN :. Gambar 2. Diagram Alur Proses Get Input Data Frequency Scoring int i = 0 Text = kata yang berpotensi sebagai predictive text Return Tidak i < jumlah data pada file Ya Cek isi kata pada data[i] apakah ada yang sama dengan Text Tidak Ya Tambahkan score untuk text karena kata text pernah keluar Gambar 3. Diagram Alur Proses Frequency Scoring Penilaian berdasarkan hubungan semantik pada Gambar 4 dilakukan berdasarkan hubungan semantik kata yang pernah terjadi. Hubungan semantik kata adalah hubungan antara kata yang satu dengan lain (kata tersebut pernah muncul dalam dokumen yang disimpan sebelumnya). Gambar 4. Diagram Alur Proses Semantic Scoring
5 Proses terakhir adalah n-gram scoring pada Gambar 5 yaitu menilai berdasarkan kesamaan suku n-gram yang dimiliki oleh kata kandidat dibandingkan dengan suku n-gram dari kata input. Gambar 5. Diagram Alur Proses Ngram Scoring Hasil dan Pembahasan Pengujian dilakukan antara lain menguji bobot dari tiap metode scoring-nya, yakni Keystroke Saving (KS) dan Score Efektif (SPE). Pengujian dengan menghitung keystroke saving adalah untuk menghitung seberapa banyak karakter yang dapat dihemat untuk menghasilkan sebuah teks tertentu. SPE didapat dari jumlah prediksi efektif yang terjadi dibandingkan dengan jumlah total prediksi yang terjadi. Hasil perhitungan yang didapat dari pengujian pada Bigram (Tabel 1) dan Trigram (Tabel 2) menunjukkan nilai yang hampir sama. Sedangkan untuk persentase frekuensi kata keluar (Tabel 3) menunjukkan bahwa metode bigram dan trigram masih memiliki persentase frekuensi kata keluar yang lebih tinggi dibanding metode lainnya. Tabel 1. Hasil Perhitungan Formula Pada Bigram No Nama Data Kata Efektif KS SPE 1 Artikel Opini Ekonomi Politik ,47 47,21 2 Berita Honda ,16 42,27 3 Artikel Trio Harry Potter ,17 33,33 4 Artikel Usir Ketombe ,36 41,38 5 Berita Gadget Mozilla ,92 36,47 6 Berita Pembangunan Rusun ,36 49,23 7 Artikel Opini untuk Siswa ,5 39,71 Tabel 2. Hasil Perhitungan Formula Pada Trigram No Nama Data Kata Efektif KS SPE 1 Artikel Opini Ekonomi Politik ,07 43,94 2 Berita Honda ,04 41,94 3 Artikel Trio Harry Potter ,06 34,48 4 Artikel Usir Ketombe ,03 43,68 5 Berita Gadget Mozilla ,77 38,10 5
6 SNTI V-2014 Universitas Trisakti ISBN :. 6 Berita Pembangunan Rusun ,16 50,00 7 Artikel Opini untuk Siswa ,09 38,35 Tabel 3. Persentase Frekuensi Kata Keluar Banyak Presentase Frekuensi Kata Keluar 2-gram 3-gram 4-gram 5-gram >8x 0,03% 0,00% 0,00% 0,00% 6-8x 0,04% 0,03% 0,00% 0,00% 3-5x 0,36% 0,21% 0,03% 0,00% 2x 0,94% 2,60% 0,65% 0,52% 1x 98,63% 97,16% 99,32% 99,48% Kesimpulan Dari hasil penelitian dapat disimpulkan: a. Rata-rata keystroke saving yang dihasilkan pada pengujian ini adalah 15 hingga 25 persen bergantung pada data training. b. Rata-rata prediksi efektif terjadi di atas 30% dari total prediksi yang terjadi. Hal ini dikarenakan oleh pengaruh dari language model yang dapat langsung memprediksi kata dengan lebih efektif dan akurat. c. Frekuensi dari language model yang tinggi sangat mempengaruhi scoring sistem, karena semakin tinggi frekuensi language model suatu kata, maka akan semakin tinggi pula bobot / nilai dari kata itu sendiri. d. Semakin besar nilai n dalam n-gram berbanding terbalik dengan jumlah frekuensi keluar yang didapat, yaitu semakin kecil atau lebih jarang keluar. Penggunaan model bi-gram dan tri-gram untuk language model masih memungkinkan, karena hasil dari jumlah frekuensi keluar pada suku n-gram-nya masih cukup besar dan datanya masih valid apabila diproses lebih lanjut. Daftar pustaka Ahmad Hanafi, 2009, Pengenalan Bahasa Suku Bangsa Indonesia Berbasis Teks Menggunakan Metode N-gram. Tugas Akhir IT TELKOM. Jakob Jorwall and Sebastian Ganslandt, 2009, Context-Aware Predictive Text Entry for Swedish using Semantics and Syntax. Retrieved January 12, 2013, from /sebastian_jakob.pdf. Jianhua Li and Graeme Hirst, 2005, Semantic knowledge in word completion, In Assets 05: Proceedings of the 7th international ACM SIGACCESS conference on Computers and accessibility, Baltimore. M. Silfverberg, I.S. MacKenzie, and P. Korhonen, 2000, Predicting Text Entry Speed on mobile phones, Proceedings of the ACM Conference on Human Factors in Computing Systems - CHI 2000, pp. 9-16, New York: ACM. Yousef Bassil, 2012, Parallel Spell Checking Algorithm Based on Yahoo! N-Grams Dataset, International Journal of Research and Reviews in Computer Science (IJRRCS), Vol. 3, No. 1, February 2012, Lebanese Association for Computational Sciences.
used. Other than n-gram based method, setting of the weights for each scoring method also affect the process of word prediction.
PEMBUATAN APLIKASI PREDICTIVE TEXT MENGGUNAKAN METODE N-GRAM-BASED Sendy Andrian Sugianto 1, Liliana 2, Silvia Rostianingsih 3 Program Studi Teknik Informatika Fakultas Teknologi Industri Universitas Kristen
APLIKASI PERBAIKAN EJAAN PADA KARYA TULIS ILMIAH DIPROGRAM STUDI TEKNIK INFORMATIKA DENGAN MENERAPKAN ALGORITMA LEVENSHTEIN DISTANCE
APLIKASI PERBAIKAN EJAAN PADA KARYA TULIS ILMIAH DIPROGRAM STUDI TEKNIK INFORMATIKA DENGAN MENERAPKAN ALGORITMA LEVENSHTEIN DISTANCE Roby Nur Hamzah Artikel Skripsi Universitas Nusantara PGRI Kediri Di
APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL
APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,
Perbaikan Ejaan Kata pada Dokumen Bahasa Indonesia dengan Metode Cosine Similarity
Perbaikan Ejaan pada Bahasa Indonesia dengan Metode Cosine Similarity Muhammad Fachrurrozi 1, Anne Agustina Manik 2 1,2 Jurusan Teknik Informatika Universitas Sriwijaya Kampus Unsri Indralaya Ogan Ilir
BAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang teori-teori dan konsep dasar yang mendukung pembahasan dari sistem yang akan dibuat. 2.1 Anak Berkebutuhan Khusus (ABK) Menurut Alimin (2012) Anak
BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
BAB 1 PENDAHULUAN Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Komputer adalah sebuah alat yang dipakai untuk mengolah informasi menurut prosedur yang telah dirumuskan (Wikipedia, 2007: Komputer). Komputer berkembang mulai
BAB 1 PENDAHULUAN. dengan proses pengolahan citra digital (digital image processing), dimana data berupa
BAB 1 PENDAHULUAN 1.1 Latar Belakang Pada awalnya, komputer hanya dapat digunakan untuk melakukan pemrosesan terhadap data numerik. Tetapi pada sekarang ini, komputer telah membawa banyak perubahan dan
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Dalam Era yang telah berkembang saat ini, banyak perkembangan perangkat lunak, adapun salah satu yang kita kenal adalah text editor. Seiring dengan perkembangan zaman
BAB III ANALISIS DAN PERANCANGAN SISTEM
BAB III ANALISIS DAN PERANCANGAN SISTEM Pada pengembangan suatu sistem diperlukan analisis dan perancangan sistem yang tepat, sehingga proses pembuatan sistem dapat berjalan dengan lancar dan sesuai seperti
Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk
Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma
IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA
IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,
IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE
IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE Novario Jaya Perdana 1, Diana Purwitasari 2 Teknik Informatika, Fakultas Teknologi Informasi, Institut
BAB 1 PENDAHULUAN 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi dan informasi telah berdampak pada semua bidang. Semakin banyaknya aplikasi yang dapat mendukung mengerjakan suatu pekerjaan tertentu agar menjadi
1. Introduction. tertentu memegang peran penting dalam. Abstract
Perbandingan Metode Latent Semantic Analysis, Syntactically Enhanced Latent Semantic Analysis, dan Generalized Latent Semantic Analysis dalam Klasifikasi Dokumen Berbahasa Inggris Gilbert Wonowidjojo Bina
BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang
BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang
BAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 1.1 Tinjauan studi Penelitian yang sudah ada sebelumnya, yaitu : 1. Nur Afifah (2010), Pembuatan Kamus Elektronik Kalimat Bahasa Indonesia dan Bahasa Jawa untuk Aplikasi Mobile
APLIKASI PENENTUAN JENIS PART OF SPEECH MENGGUNAKAN METODE N-GRAM DAN STRING MATCHING
APLIKASI PENENTUAN JENIS PART OF SPEECH MENGGUNAKAN METODE N-GRAM DAN STRING MATCHING 1 Nurzaenab dan 2 Purnawansyah 1 [email protected], 2 [email protected] 12 Teknik Informatika, Fakultas
Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient
Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,
BAB I PENDAHULUAN Latar Belakang
1 BAB I PENDAHULUAN 1.1. Latar Belakang Perkembangan dunia IT (Information Technology) dengan hadirnya mesin pencarian (Search Engine) di dalam sistem komputer yang merupakan salah satu fasilitas internet
BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai
BAB II TINJAUAN PUSTAKA Penelitian awal dalam bidang automatic text summarization dimulai dengan pembuatan metode term frequency oleh Luhn pada tahun 1958. Metode ini berasumsi bahwa frekuensi kata di
BAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Seiring dengan perkembangan teknologi informasi, maka proses dan media penyimpanan data pun semakin berkembang. Dengan adanya personal computer (PC), orang dapat menyimpan,
Implementasi Generalized Vector Space Model Menggunakan WordNet
Implementasi Generalized Vector Space Model Menggunakan WordNet Adi Wibowo*, Andreas Handojo**, Charistian Widjaja*** Jurusan Teknik Informatika Fakultas Teknologi Industri, Universitas Kristen Petra E-Mail:
Aplikasi String Matching Pada Fitur Auto-Correct dan Word-Suggestion
Aplikasi String Matching Pada Fitur Auto-Correct dan Word-Suggestion Johan - 13514206 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10
BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen
BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi
APLIKASI SISTEM INFORMASI AKADEMIK DAN PENJADWALAN MATA PELAJARAN SEKOLAH MENENGAH ATAS DI SAMPIT
APLIKASI SISTEM INFORMASI AKADEMIK DAN PENJADWALAN MATA PELAJARAN SEKOLAH MENENGAH ATAS DI SAMPIT Alexander Setiawan 1), Liliana 2), Bryan Andhika 3) 1,2,3) Program Studi Teknik Informatika, Fakultas Teknologi
BAB III ANALISA DAN PERANCANGAN SISTEM
BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Analisa Masalah Pemilihan dosen pembimbing Tugas Akhir pada jurusan Teknik Informatika Universitas Muhammadiyah Malang dilakukan mahasiswa secara mandiri, hal
BAB III ANALISA MASALAH DAN RANCANGAN PROGRAM
BAB III ANALISA MASALAH DAN RANCANGAN PROGRAM III.1. Analisa Perancangan aplikasi kamus mobile menggunakan bahasa pemograman Java dimana platform yang digunakan adalah J2ME ( Java 2 Micro Edition). J2ME
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity
Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Komang Rinartha
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Anggaran kegiatan merupakan salah satu komponen utama dalam suatu instansi pemerintahan. Di dalam penyelenggaraan pemerintahan, anggaran kegiatan menjadi hal penting
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Bahasa merupakan alat komunikasi lingual manusia baik secara lisan maupun tulisan. Dalam membuat suatu karya ilmiah, penggunaan Bahasa Indonesia harus sesuai
APLIKASI PENERJEMAH KALIMAT BAHASA INDONESIA KE BAHASA SIMALUNGUN DENGAN ALGORITMA BERRY - RAVINDRAN
APLIKASI PENERJEMAH KALIMAT BAHASA INDONESIA KE BAHASA SIMALUNGUN DENGAN ALGORITMA BERRY - RAVINDRAN Saut Dohot Siregar 1*, Mawaddah Harahap 2, Yohana Marbun 3 1,2,3 Program Studi Teknik Informatika, Fakultas
PROPOSAL SKRIPSI. JUDUL PROPOSAL SKRIPSI DALAM BAHASA INDONESIA DITULIS SECARA SIMETRIS (Studi Kasus: Tempat Penelitian Tesis-jika ada, optional)
PROPOSAL SKRIPSI JUDUL PROPOSAL SKRIPSI DALAM BAHASA INDONESIA DITULIS SECARA SIMETRIS (Studi Kasus: Tempat Penelitian Tesis-jika ada, optional) Nama : NIM : Disusun oleh: PROGRAM STUDI S1 TEKNIK INFORMATIKA
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan
GAME LABIRIN BERBASIS PENGOLAH BAHASA ALAMI UNTUK PENGENALAN LOGIKA PEMROGRAMAN SEDERHANA. Abstrak
GAME LABIRIN BERBASIS PENGOLAH BAHASA ALAMI UNTUK PENGENALAN LOGIKA PEMROGRAMAN SEDERHANA Chandra Kusuma Dewa Jurusan Teknik Informatika, Fakultas Teknologi Industri Universitas Islam Indonesia, Yogyakarta
UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi komputer khususnya di jaringan Internet telah berkembang dengan sangat cepat. Semua orang dapat saling bertukar dan mendapatkan informasi
Jurnal Ilmiah Sains, Teknologi, Ekonomi, Sosial dan Budaya Vol. 1 No. 4 Desember 2017
TEXT MINING DALAM PENENTUAN KLASIFIKASI DOKUMEN SKRIPSI DI PRODI TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER BERBASIS WEB Teuku Muhammad Johan dan Riyadhul Fajri Program Studi Teknik Informatika Fakultas
HASIL DAN PEMBAHASAN. profil dokumen adalah pada banyaknya tabel yang dihasilkan. Tabel 2 Kategori dokumen Kategori
4 HASIL DAN PEMBAHASAN Koleksi Dokumen Koleksi dokumen yang digunakan pada penelitian ini berasal dari corpus Adisantoso & Ridha (2004). Jumlah dokumen pada koleksi ini adalah 1000 dokumen. Akan tetapi,
STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011
STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011 ANALISIS METODE HUFFMAN UNTUK KOMPRESI DATA CITRA DAN TEKS PADA APLIKASI KOMPRESI DATA Shelly Arysanti
Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
BAB I PENDAHULUAN. atau keterlibatan dunia sehingga internet dewasa ini menjadi jendela dunia di
1 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi yang sangat cepat terutama di bidang teknologi internet yang setiap saat mengalami perubahan signifikan, tidak lepas dari peranan atau
PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan
BAB 1 PERSYARATAN PRODUK Bab ini membahas mengenai hal umum dari produk yang dibuat, meliputi tujuan, ruang lingkup proyek, perspektif produk, fungsi produk dan hal umum yang lainnya. 1.1 Pendahuluan Hal
Bab 1 PENDAHULUAN Latar Belakang Masalah
Bab 1 PENDAHULUAN Latar Belakang Masalah Pada masa sekarang ini perkembangan dalam dunia komputer terutama dalam bidang software telah maju dengan pesat dan mempengaruhi berbagai sektor kehidupan manusia,
ISSN : e-proceeding of Applied Science : Vol.3, No.3 Desember 2017 Page 1310
ISSN : 2442-5826 e-proceeding of Applied Science : Vol.3, No.3 Desember 2017 Page 1310 PEMBANGUNAN APLIKASI MEDIA PEMBELAJARAN BERBASIS WEB UNTUK MATERI MENULIS DALAM MATA KULIAH BAHASA INGGRIS (STUDI
BAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN III.1 Analisis Sistem Keylogger merupakan aplikasi yang digunakan untuk merekam segala aktifitas pada komputer yang berhubungan dengan fungsi keyboard, metode string matching
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Di dalam dunia pemrograman komputer, kode program (source code) adalah kumpulan deklarasi atau pernyataan dari bahasa pemrograman computer yang di tulis dan bisa dibaca
BAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)
BAB 1 PENDAHULUAN Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Lahirnya teknologi informasi komputer dan fasilitas pendukungnya seperti layanan internet saat ini membuat perkembangan yang sangat luas. Segala informasi-informasi
BAB I PENDAHULUAN Latar belakang
BAB I PENDAHULUAN Bab ini membahas mengenai garis besar Tugas Akhir yang meliputi latar belakang, tujuan, rumusan dan batasan masalah, metodologi pembuatan tugas akhir, dan sistematika penulisan laporan.
KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO
F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING
APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING Dzulfie Zamzami 1, Dr.Eng.Faisal Rahutomo,ST.,M.Kom 2., Dwi Puspitasari, S.Kom., M.Kom.
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah PDA (Personal Digital Assistant) adalah perangkat komputer berukuran kecil bersifat mobile yang berfungsi untuk membantu mencatat jadwal atau aktivitas yang
STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011
STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 PENERAPAN METODE CLUSTERING HIRARKI AGGLOMERATIVE UNTUK KATEGORISASI DOKUMEN PADA WEBSITE SMA NEGERI
BAB 1 PENDAHULUAN. semua kalangan masyarakat memiliki telepon seluler, personal digital assistant
BAB 1 PENDAHULUAN 1.1 Latar Belakang Teknologi mobile telah menjadi bagian kehidupan kita sehari-hari. Hampir semua kalangan masyarakat memiliki telepon seluler, personal digital assistant (PDA) atau sejenisnya
STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Genap Tahun 2010/2011
STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Genap Tahun 2010/2011 APLIKASI PENERJEMAH KATA DALAM BAHASA INDONESIA BAHASA INGGRIS DAN BAHASA PALEMBANG BERBASIS JAVA ME
WORD PREDICTION MENGGUNAKAN WINDOWS API BERBASIS WORD FREQUENCIES SKRIPSI ADE N TAMBUNAN
WORD PREDICTION MENGGUNAKAN WINDOWS API BERBASIS WORD FREQUENCIES SKRIPSI ADE N TAMBUNAN 091402054 PROGRAM STUDI S-1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA
BAB I PENDAHULUAN 1.1 Latar Belakang Perpustakaan merupakan faktor penting di dalam penunjang transformasi antara sumber ilmu (koleksi) dengan pencari ilmu (pengunjung). Perpustakaan juga sering disebut
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN
EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik
BAB 3 ANALISIS MASALAH DAN PERANCANGAN
BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic
BAB III ANALISA DAN PERANCANGAN 3.1 ANALISA PERANGKAT LUNAK BASIS DATA MULTIMEDIA
BAB III ANALISA DAN PERANCANGAN 3.1 ANALISA PERANGKAT LUNAK BASIS DATA MULTIMEDIA Dalam bagian ini akan dianalisis berbagai hal yang berkaitan dengan perancangan dan implementasi aplikasi multimedia. Analisis
PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING
PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING 1 Arrummaisha Adrifina 2 Juwita Utami Putri 3 I Wayan Simri W 1 [email protected] 2 [email protected] 3 [email protected]
PENERAPAN METODE PAPER PROTOTYPE DALAM PEMBUATAN INTERFACE APLIKASI PEMUTAR MUSIK
PENERAPAN METODE PAPER PROTOTYPE DALAM PEMBUATAN INTERFACE APLIKASI PEMUTAR MUSIK Yarza Aprizal 1, Benedictus Effendi 2 STMIK PalComTech; Jln.Basuki Rahmat No.05, Telp:0711-358916, Fax:0711-359089 Sistem
BAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Membaca merupakan bagian kebutuhan manusia, baik membaca buku, surat kabar, dan majalah. Dengan kebutuhan tersebut melalui perkembangan teknologi informasi diantaranya
BAB IV HASIL DAN PEMBAHASAN
BAB IV HASIL DAN PEMBAHASAN A. Analisis Sistem a) Identifikasi Masalah Permasalahan permasalahan yang terjadi pada sistem lama atau sistem yang berjalan saat ini antara lain : a. Faktor kelelahan penilai
BAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN 3.1 Analisis Analisis atau bisa juga disebut dengan Analisis sistem (systems analysis) dapat didefinisikan sebagai penguraian dari suatu sistem informasi yang utuh ke dalam
Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
UNSUR POKOK PENULISAN PROPOSAL TUGAS AKHIR
UNSUR POKOK PENULISAN PROPOSAL TUGAS AKHIR Pedoman penulisan proposal tugas akhir sekurang-kurangnya memuat unsur-unsur pokok sebagai berikut : A. Bagian Awal (Cover), meliputi : 1. Judul Tugas akhir yang
BAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Seiring dengan perkembangan zaman, kemajuan dalam bidang ilmu pengetahuan dan teknologi informasi berkembang sangat pesat. Maka informasi juga semakin banyak dan membuat
BAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih
BAB 1 PENDAHULUAN Pengantar
BAB 1 PENDAHULUAN 1.1. Pengantar Dewasa ini fungsi komputer semakin dimanfaatkan dalam segala bidang. Baik di bidang pendidikan, bisnis, ataupun penelitian. Penggunaan komputer kini tidak lagi terbatas
Pembuatan Kakas Bantu untuk Mendeteksi Ketidaksesuaian Diagram Urutan (Sequence Diagram) dengan Diagram Kasus Penggunaan (Use Case Diagram)
JURNAL TEKNIK ITS Vol. 6, No. 1, (2017) ISSN: 2337-3539 (2301-9271 Print) A-71 Pembuatan Kakas Bantu untuk Mendeteksi Ketidaksesuaian Diagram Urutan (Sequence Diagram) dengan Diagram Kasus Penggunaan (Use
Parsing dan Konversi Kalimat Tanya Konfirmatif Menjadi Query Sparql Menggunakan Pendekatan Top-Down Parsing
Volume 9 Nomor 2, Oktober 2016 Hlm. 91-98 ISSN 0216-9495 (Print) ISSN 2502-5325 (Online) Parsing dan Konversi Kalimat Tanya Konfirmatif Menjadi Query Sparql Menggunakan Pendekatan Top-Down Parsing Mohammad
Pencarian File Teks Berbasis Content dengan Pencocokan String Menggunakan Algoritma Brute force
Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Pencarian File Teks Berbasis Content dengan Pencocokan String Menggunakan
BAB 1 PENDAHULUAN Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Dalam ilmu kesehatan banyak terdapat istilah medis yang berasal dari bahasa Yunani atau Latin. Secara umum, istilah yang berkaitan dengan diagnosis dan operasi memiliki
BAB IV ANALISIS SISTEM BERJALAN. ada yaitu Analisis Antarmuka dan Aliran Data pada Sistem Informasi Dinas Komunikasi
BAB IV ANALISIS SISTEM BERJALAN 4.1 Prosedur Sistem Berjalan Analisis Sistem dapat diartikan sebagai suatu proses untuk memahami sistem yang ada yaitu Analisis Antarmuka dan Aliran Data pada Sistem Informasi
Identifikasi Fitur Laptop beserta Orientasinya dengan Metode Apriori dan Lexicon-Based
Journal of Applied Informatics and Computing (JAIC) Vol.1, No.1, Desember 2017 e-issn: 2548-6861 33 Identifikasi Fitur Laptop beserta Orientasinya dengan Metode Apriori dan Lexicon-Based Try Satria Amanattullah
BAB I I. PENDAHULUAN 1.1 Latar belakang
BAB I I. PENDAHULUAN 1.1 Latar belakang Pada bab ini membahas tentang pendahuluan. Teknologi sudah sangat berkembang di era zaman sekarang. Bahkan teknologi sudah menjadi kebutuhan primer dari manusia
STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011
STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011 PENERAPAN PENCARIAN KATA DENGAN VECTOR SPACE MODEL PADA APLIKASI TERJEMAHAN JUZ AMMA BERBASIS JAVA
BAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN Bab ini menjelaskan mengenai analisa sistem dan perancangan yang akan digunakan untuk membuat Aplikasi Permainan Hangman Tebak Kalimat untuk Pembelajaran Bahasa Inggris
BAB III ANALISIS DAN PERANCANGAN SISTEM
BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1. Analisis Masalah Setiap tahunnya, DPP Infokom selaku panitia Pelatihan Aplikasi Teknologi dan Informasi (PATI) Universitas Muhammadiyah Malang menerima ribuan
Sistem Rekomendasi Bacaan Tugas Akhir Jurusan Teknik Informatika Universitas Sriwijaya menggunakan Metode Collaborative Filtering dan Naive Bayes
Sistem Rekomendasi Bacaan Tugas Akhir Jurusan Teknik Informatika Universitas Sriwijaya menggunakan Metode Collaborative Filtering Naive Bayes Riri Intan Aprilia 1 Teknik Informatika Fakultas Ilmu Komputer
BAB III METODE PENELITIAN Langkah-Langkah Penelitian Sistem Pendukung Keputusan (SPK) yang dibangun merupakan sistem
BAB III METODE PENELITIAN 3.1. Langkah-Langkah Penelitian Sistem Pendukung Keputusan (SPK) yang dibangun merupakan sistem untuk menentukan peringkat siswa berdasarkan penilaian hasil belajar siswa. Hasil
datanya. Hasil User dapat melanjutkan aktivitas selanjutnya setelah memilih File yang diinginkan. 2. Use Case Menyisipkan Teks Table 4-2 Deskripsi Use
BAB 4. PERANCANGAN Bagian ini menjelaskan perancangan sistem dan antar muka aplikasi 4.1. Perancangan Sistem 4.1.1 Perancangan Pembuatan Sistem (Use Case Diagram) Gambar 4-1 Use Case aplikasi Audio Steganografi
TAKARIR. : diagram aktifitas yang memodelkan alur kerja. suatu proses. dipakai. berurutan. : perangkat untuk simulasi hasil aplikasi pada IDE
TAKARIR Activity diagram : diagram aktifitas yang memodelkan alur kerja sebuah proses bisnis dan urutan aktivitas dalam suatu proses Backward chaining Class diagram : penalaran mundur : diagram kelas yang
EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA
EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah
BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang
58 BAB 3 METODE PENELITIAN 3.1 Analisis Masalah Seiring dengan perkembangan zaman, jumlah informasi yang disimpan dalam betuk digital semakin bertambah, sehingga dibutuhkan cara pengorganisasian dan pengelolaan
BAB I PENDAHULUAN. bagaimana membuat mesin (komputer) dapat melakukan pekerjaan seperti dan
BAB I PENDAHULUAN 1.1 Latar Belakang Era digital berkembang ditandai dengan munculnya tiga teknologi, yaitu: komputer, komunikasi, dan multimedia. Hal tersebut membawa kepada perubahan besar yang pada
