Pengenalan Entitas Bernama untuk Identifikasi Transaksi Akuntansi Menggunakan Hidden Markov Model

Ukuran: px
Mulai penontonan dengan halaman:

Download "Pengenalan Entitas Bernama untuk Identifikasi Transaksi Akuntansi Menggunakan Hidden Markov Model"

Transkripsi

1 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Vol. 2, No. 7, Juli 2018, hlm Pengenalan Entitas Bernama untuk Identifikasi Transaksi Akuntansi Menggunakan Hidden Markov Model Rika Raudhotul Rizqiyah 1, Lailil Muflikhah 2, Mochammad Ali Fauzi 3 Program Studi Teknik Informatika, 1 rikaraudhotul@gmail.com, 2 lailil@ub.ac.id, 3 moch.ali.fauzi@ub.ac.id Abstrak Akuntansi merupakan suatu pekerjaan yang memiliki peranan penting dalam mendukung kelancaran ekonomi, karena pencatatan setiap proses bisnis yang terjadi dilakukan dalam akuntansi. Namun, pencatatan transaksi keuangan dalam akuntansi untuk dapat dilakukan identifikasi ke dalam bentuk jurnal masih dilakukan secara manual, sehingga dibutuhkan klasifikasi dan ekstraksi informasi yang terdapat pada teks transaksi akuntansi. Named Entity Recognition (NER) atau pengenalan entitas bernama merupakan langkah awal yang dibutuhkan untuk melakukan proses ekstraksi informasi. Untuk menyelesaikan masalah tersebut, dilakukan pengenalan entitas bernama untuk identifikasi transaksi akuntansi. Pada penelitian ini digunakan metode Hidden Markov Model (HMM), karena HMM dapat menyelesaikan pelabelan serta dikenal handal dalam melakukan pengenalan entitas bernama. Proses utama dalam pengenalan entitas bernama ini dibagi menjadi dua, yaitu proses pemodelan menggunakan Hidden Markov Model dan proses decoding menggunakan Viterbi Algorithm. Pada penelitian ini akan dilakukan pengenalan terhadap 12 entitas, antara lain, TITLE, PER, TRANS, EXP_MON, TYP_COMP, FIRST_ORG, SECOND_ORG, EXP_, NO_, MONTH dan YEAR. Secara keseluruhan pengenalan entitas yang dilakukan pada penelitian ini menghasilkan nilai rata-rata precision, recall dan f-measure berturut-turut yaitu 81.75%, 87.88% dan 82.39%. Kata kunci: pelabelan transaksi akuntansi, named entity recognition, hidden markov model, information extraction Abstract Accounting is a task which has an important role in supporting economic continuity, due to the recording of any business process that occurred was done in accounting. However, the recording of financial transactions in accounting for identification into journal is still done manually, so that required classification and extraction of information contained in the accounting transaction text to make it easier. Named Entity Recognition (NER) is the first step needed to perform information extraction. To solve this problem, named entity recognition done for identification of accounting transaction. In this research used method of Hidden Markov Model (HMM), because HMM can resolve labeling task and and known robustly in performing named entity recognition. The main process in this named entity recognition is divided into modeling process using Hidden Markov Model and decoding process using Viterbi Algorithm. In this research will be recognize 12 entities namely, TITLE, PER, TRANS, EXP_MON, TYP_COMP, FIRST_ORG, SECOND_ORG, EXP_, NO_, MONTH and YEAR. Overall entity recognition with addition Laplace Smoothing and Regular Expression techniques produce a value of average precision, recall and f-measure consecutive 81.75%, 87.88%, and 82.39%. Keywords: labeling accounting transaction, named entity recognition, hidden markov model, information extraction 1. PENDAHULUAN Pertumbuhan ekonomi dunia merupakan fenomena penting yang terjadi akhir-akhir ini. Berbagai ilmu dipelajari guna mendukung pertumbuhan ekonomi, salah satunya ialah dengan akuntansi. Akuntansi adalah suatu proses mengklasifikasi, mencatat, mengolah hingga menyajikan data yang berhubungan dengan Fakultas Ilmu Komputer Universitas Brawijaya 2851

2 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2852 keuangan sehingga dapat digunakan untuk menentukan keputusan. Fungsi utama dari akuntansi yaitu menyajikan informasi keuangan suatu organisasi, yang mana hasil dari laporan akuntansi tersebut dapat dilihat kondisi keuangan serta perubahan yang terjadi di dalamnya. Penyajian informasi yang tepat harus berdasarkan pencatatan transaksi akuntansi yang ada. Transaksi akuntansi merupakan transaksi yang memengaruhi minimal dua atau lebih data akuntansi. Proses pencatatan transaksi akuntansi ini dituliskan dalam sebuah jurnal yang mana dibutuhkan pemahaman mengenai konsep dasar akuntansi (Iswandi et al., 2015). Pada lingkup dunia pendidikan, biasanya dipelajari transaksi akuntansi berupa teks yang tidak terstruktur untuk kemudian diubah menjadi bentuk terstruktur ke dalam tabel jurnal. Studi kasus transaksi akuntansi sering digunakan untuk melatih kemampuan pelajar dalam mendalami ilmu akuntansi. Dibutuhkan suatu analisis terhadap transaksi akuntansi yang ada untuk dapat dikenali apa saja akun yang terdapat pada transaksi tersebut. Untuk itu diperlukan suatu teknik yang dapat membantu pekerjaan ini dalam memilah informasi dari teks transaksi akuntansi yang tidak terstruktur. Selanjutnya, dari hasil pemilahan informasi didapatkan informasi penting yang dibutuhkan yaitu informasi akun yang terdapat dalam transaksi tersebut. Teknik ini dikenal sebagai ekstraksi informasi, yang mana dari data yang berbentuk tekstual dapat diambil informasinya. Ekstraksi informasi memiliki tujuan utama yaitu mengambil informasi spesifik yang diinginkan dari dokumen teks bahasa alami, yang mana proses ekstraksi ini dilakukan secara otomatis menggunakan metode komputer (Abdelmagid et al., 2015). Named Entity Recognition (NER) atau dikenal juga dengan pengenalan entitas bernama merupakan subpekerjaan dari ektraksi informasi. NER bertugas mengenali entitas nama (bisa nama orang, perusahaan, organisasi, lokasi), ekspresi bilangan (seperti kardinal, persen, uang, numerik) dan ekspresi waktu (misal durasi, tanggal, waktu) pada kumpulan dokumen teks (Chinchor et al., 1999). NER dapat diselesaikan dengan pelabelan urutan kata statistik (statistical sequence labelling). Salah satu metode yang dapat menyelesaikan pelabelan ialah Hidden Markov Model (HMM) yang merupakan pengembangan model statistik dari model Markov. HMM dikenal mempunyai beberapa kelebihan, diantaranya memiliki fondasi statistik yang kuat, sangat cocok untuk domain bahasa alami, dan penanganan data baru dilakukan dengan baik atau robustly pengembangan komputasional yang efisien (Seymore et al., 1999). Untuk model seperti HMM, yang berisi hidden state, tugas untuk menentukan urutan variabel merupakan hal yang mendasari beberapa urutan pengamatan yang disebut sebagai tugas decoding. Algoritme decoding yang paling umum digunakan adalah Algoritme Viterbi yang merupakan sejenis pemrograman dinamis (Jurafsky & Martin, 2016). Penelitian mengenai pengenalan entitas bernama pada teks berbahasa India, Bengali dan Telugu pernah dilakukan oleh Sudha Morwal dan Deepti Chopra menggunakan metode Hidden Markov Model (HMM) pada tahun Terdapat tiga fase dalam sistem berbasis NER ini, diantaranya yaitu fase anotasi, fase pelatihan HMM dan fase pengujian HMM. Algoritme Viterbi diterapkan pada penelitian ini untuk menghitung urutan optimal untuk kalimat yang telah dimasukkan ke dalam sistem. Dari hasil pengujian pada penelitian ini didapatkan nilai F- Measure sebesar 96% untuk bahasa India, 98% untuk bahasa Bengali dan 98.5% untuk bahasa Telugu. 2. STUDI PUSTAKA 2.1. Transaksi Akuntansi Transaksi akuntansi ialah transaksi yang memengaruhi minimal dua data akuntansi. Transaksi akuntansi dapat dibedakan menjadi transaksi penjualan, transaksi pembelian, transaksi penerimaan uang serta transaksi pengeluaran uang. Sebuah transaksi akuntansi harus terdiri dari tanggal terjadinya transaksi, nama perusahaan, nilai uang dan jenis transaksi (Iswandi et al., 2015). Berikut merupakan label entitas yang biasa terdapat dalam transaksi akuntansi: 1. Tanggal. Bentuk penulisan tanggal terjadinya akuntansi biasa ditulis dengan Sd = {dd, MM, yy} Sd = Sample of Date dd = date MM = month yy = year 2. Nama subjek. Untuk melakukan identifikasi nama subjek dalam teks transaksi akuntansi yang berupa nama perusahaan, organisasi maupun individu.

3 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Nilai uang. Untuk melakukan identifikasi nilai uang pada teks transaksi akuntansi dapat berupa angka maupun kata-kata. 4. Kuantitas. Untuk melakukan identifikasi nilai dari kuantitas dalam teks transaksi akuntansi. 5. Jenis transaksi. Untuk melakukan identifikasi jenis transaksi pada teks transaksi akuntansi yang dapat berupa transaksi pembelian, transaksi penjualan, transaksi penerimaan uang dan transaksi pengeluaran uang. Hasil identifikasi terhadap transaksi akuntansi berupa pengenalan entitas-entitas akuntansi yang dibutuhkan untuk membuat pencatatan akuntansi atau biasanya lebih dikenal dengan istilah jurnal akuntansi Text Mining Proses text mining dimulai dengan pengumpulan atau koleksi dokumen dari berbagai sumber, kemudian diambil sebuah dokumen tertentu untuk dilakukan preprocessing dengan memeriksa format dan set karakter. Setelah itu dilakukan analisa teks yang merupakan analisis semantik guna memperoleh informasi yang berkualitas tinggi dari teks. Informasi yang didapatkan ini dapat disimpan dalam sistem informasi (Gaikwad et al., 2014). Pre-processing yang biasa dilakukan antara lain tokenisasi, filtering dan case folding Named Entity Recognition (NER) NER merupakan komponen utama dari ekstraksi informasi memiliki berbagai fungsi seperti mengenali entitas nama (bisa nama orang, perusahaan, organisasi, lokasi), ekspresi bilangan (seperti kardinal, persen, uang, numerik) dan ekspresi waktu (misal durasi, tanggal, waktu) pada kumpulan dokumen teks (Chinchor et al., 1999). Pada intinya named entity recognition ini mengidentifikasi kata-kata yang ditujukan sebagai sesuatu yang bersifat menarik dalam aplikasi tertentu. NER bukanlah hal yang sulit dilakukan oleh manusia, karena bahasa alami dalam bentuk teks ini sering digunakan manusia dalam kehidupan seharihari. Manusia dapat dengan mudahnya mengenali mana kata yang merupakan nama orang, organisasi, lokasi dan lain sebagainya. Hal ini dikarenakan entitas nama tersebut memiliki ciri unik, misal nama orang atau nama kota yang diawali dengan huruf kapital. Risa Amalia mendatangi acara ulang tahun [PERSON] perusahaan Medika Indonesia di Bandung mendatang[organization] [LOC] pada bulan Februari pada tahun [] Gambar 1. Contoh pengenalan entitas 2.3. Hidden Markov Model (HMM) HMM dapat dikatakan sebagai model urutan atau klasifikasi terurut merupakan model yang memiliki fungsi untuk menetapkan label atau kelas untuk setiap unit secara berurutan. HMM adalah model urutan probabilistik urutan dari unit-unit (kata, huruf, morfem, kalimat dan lain sebagainya) yang kemudian dihitung nilai distribusi probabilitas untuk didapatkan urutan label yang memungkinkan dan memilih urutan label yang terbaik. HMM ditentukan oleh komponen-komponen berikut, yaitu (Jurafsky & Martin, 2016): 1. Q = q 1 q 2 q N, sebagai kumpulan N kondisi 2. A = a 01 a 02 a n1 a nn, merupakan matriks transition probability A, setiap a ij mewakili probabilitas perpindahan dari kondisi i ke kondisi j. Transition probability dapat dihitung dengan menggunakan rumus pada persamaan 1. P(t i t i 1 ) = C(t i 1,t i ) C(t i 1 ) (1) 3. O = o 1 o 2 o r, merupakan urutan dari T pengamatan masing-masing diambil dari kosakata 4. B = b 1 (o t ), merupakan urutan pengamatan likelihood, disebut juga emission probabilities yang mana masing-masing mewakili probabilitas dari pengamatan o t yang dihasilkan dari kondisi i. Emission probabilities dapat dihitung dengan menggunakan rumus pada persamaan 2. P(w i t i ) = C(t i,w i ) C(t i ) (2) 5. q 0, q F, sebagai kondisi awal dan kondisi akhir (final) yang tidak berhubungan dengan pengamatan 2.4. Algoritme Viterbi Algoritme Viterbi ini bertugas untuk memberikan urutan tag yang optimal. Proses yang dilakukan dalam algoritme Viterbi ini ialah dengan mencari nilai tag optimum untuk suatu kata. Proses ini dilakukan dengan mencari nilai maksimum dari hasil peralian nilai transition

4 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2854 probability dan emission probability yang telah didapatkan pada pemodelan Hidden Markov Model. Algoritme Viterbi ini dilakukan secara rekursif sebanyak kata yang akan dikenali pada data uji. A Persamaan 3 digunakan untuk menghitung nilai setiap sel pada Viterbi pada waktu t (Jurafsky & Martin, 2016) N v t (j) = max v t 1 (i)a ij b j (o t ) (3) i = 1 Keterangan: v t 1 (i) : probabilitas jalur Viterbi sebelumnya dari langkah waktu sebelumnya a ij : probabilitas transisi dari kondisi sebelumnya q i ke kondisi sekarang q j b j o t : kemungkinan kondisi pengamatan dari o t berdasarkan kondisi j sekarang 2.5. Laplace Smoothing Martin Haulrich pada tahun 2009 melakukan penelitian mengenai implementasi Hidden Markov Model untuk part-of-speech tagger dan melakukan beberapa pendekatan yang berbeda untuk menangani kata yang tidak diketahui atau unknown word. Martin melakukan Laplace Smoothing untuk menghindari kalimat tanpa urutan tag dengan menambahkan nilai satu ketika melakukan estimasi transition probability. Penerapan Laplace Smoothing pada transiton probability dapat dilakukan dengan menggunakan rumus pada Persamaan 4. a km = q kq m +1 q k +QA (4) a km merupakan nilai transition probability dari kondisi q k ke kondisi q m, yaitu probabilitas dari kata dengan POS-tag q m yang diikuti dengan kata dengan POS_tag q k. QA adalah jumlah dari kemungkinan POS-tag. Penerapan Laplace Smoothing pada emission probabilities dapat dilakukan menggunakan rumus pada Persamaan 5. b i (o t ) = o tq i +1 q i +V (5) b i (o t ) adalah nilai emission probability, dengan o t adalah kata ke t dan q i adalah kondisi ke i. Nilai V adalah jumlah dari keseluruhan kata yang berbeda pada data latih. 3. PERANCANGAN SISTEM Pada pengenalan entitas bernama untuk identifikasi transaksi akuntansi menggunakan Hidden Markov Model dibagi menjadi dua rancangan sistem. Rancangan pertama ialah perancangan sistem untuk pemodelan yang mana pada rancangan sistem ini menerapkan Hidden Markov Model (HMM) seperti yang ditunjukkan pada Gambar 2 dan rancangan kedua ialah perancangan sistem decoding HMM dan pemberian tag pada data uji seperti yang ditunjukkan pada Gmbar 3. Mulai Masukan: kumpulan dokumen transaksi akuntansi sejumlah m data latih Pre-processing Proses training dengan Hidden Markov Model Keluaran: Hidden Markov Model Selesai Gambar 2. Diagram alir pemodelan Hidden Markov Model Berdasarkan Gambar 2 di atas, dokumen yang digunakan sebagai data latih akan dilakukan pre-processing. Keluaran dari proses ini merupakan pemodelan yang nantinya akan digunakan pada pengujian atau digunakan untuk memproses data uji. Mulai Masukan: dokumen uji transaksi akuntansi Pre-processing Algoritme Viterbi Pemberian urutan tag pada data uji Keluaran: data uji telah diberi tag Selesai Gambar 3. Diagram alir decoding HMM dan pemberian tag pada data uji

5 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2855 Berdasarkan Gambar 3 di atas, dokumen yang digunakan sebagai data uji akan dilakukan pre-processing, kemudian dijalankan proses algoritme Viterbi dan pemberian urutan tag yang optimum. Hasil akhir dari proses ini akan memberikan keluaran data yang berupa data uji yang telah dilabeli atau diberi tag. 4. PENGUJIAN DAN ANALISIS 4.1. Pengujian Hidden Markov Model Tabel 1. Pengujian fitting pada model yang telah dibuat Entitas Precision Recall F-Measure TITLE PER TRANS EXP_ MON MON TYP_ COMP FIRST_ ORG SECOND_ ORG EXP_ NO_ MONTH_ YEAR_ Rata-rata Pada pengujian ini total data uji yang digunakan adalah sebanyak 20 data yang dipilih secara random dari data latih, sedangkan jumlah data latih yang digunakan adalah 50. Berdasarkan hasil dari pengujian ini didapatkan nilai rata-rata dari precision, recall dan f- measure adalah sebesar 93.86%. Hal ini menunjukkan bahwa pengenalan entitas bernama menggunakan Hidden Markov Model sudah bagus karena mampu mengenali modelnya sendiri dengan baik. Tabel 2. Pengujian 20 data uji Entitas Precision Recall F-Measure TITLE PER TRANS EXP_ MON MON TYP_ COMP FIRST_ ORG SECOND_ ORG EXP_ NO_ MONTH_ YEAR_ Rata-rata Pada pengujian ini total data uji yang digunakan adalah sebanyak 20 data yang mana data ini tidak terdapat pada data latih, dan jumlah data latih yang digunakan adalah 50. Nilai precision, recall dan f-measure terendah didapatkan pada entitas SECOND_ORG dan YEAR_ yaitu sebesar 0%. Hal ini disebabkan sistem yang diimplementasikan berpacu pada nilai state sebelumnya atau dikenal dengan nilai transition probability dan dipengaruhi dengan nilai emission probability. Apabila suatu kata ditemukan pada data latih dan memiliki entitas, maka kata pada data uji yang seharusnya tidak memiliki entitas akan diberi entitas oleh sistem. Hal ini menyebabkan sistem akan menghasilkan pemberian entitas bernama yang kurang tepat pada kata-kata selanjutnya pada data uji Pengujian Hidden Markov Model dengan Menambahan Teknik Laplace Smoothing Penambahan teknik Laplace Smoothing, hal ini ditujukan agar data uji yang tidak ditemukan pada latih tidak bernilai nol atau memiliki nilai transition probability dan emission probability. Tabel 3. Hasil pengujian 2 Entitas Precision Recall F- Measure TITLE PER

6 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2856 TRANS EXP_MON MON TYP_COMP FIRST_ORG SECOND_OR G EXP_ NO_ MONTH_ YEAR_ Rata-rata Pengujian ini dilakukan dengan menambahkan teknik Laplace Smoothing, hal ini ditujukan agar data uji yang tidak ditemukan pada latih tidak bernilai nol atau memiliki nilai transition probability dan emission probability. Pengujian dengan menggunakan 20 data uji dan 50 data latih dengan menambahkan teknik Laplace Smoothing menghasilkan nilai precision, recall dan f-measure tertinggi sebesar 100%. Sedangkan nilai precision, recall dan f- measure terendah ialah 0% yang terdapat pada entitas. Hal ini disebabkan sistem yang diimplementasikan berpacu pada nilai state sebelumnya atau dikenal dengan nilai transition probability dan dipengaruhi dengan nilai emission probability. Mengingat bahwa teknik Laplace Smoothing ini mencegah munculnya nilai 0 pada transition probability dan emission probability, maka kata yang seharusnya diberi entitas jutru diberi entitas MONTH_ karena nilai transition probability dari perubahan state START ke MONTH_ lebih besar daripada probability dari START ke. Sehingga rata-rata nilai precision, recall dan f-measure yang didapatkan setelah menambahkan teknik Laplace Smoothing ini berturut-turut 74.06%, 80.19% dan 74.69%. Hal ini menunjukkan bahwa dengan menambahkan Laplace Smoothing dapat meningatkan nilai precision, recall dan f- measure namun masih perlu ditambahkan suatu teknik agar dapat meningkatkan nilai precision, recall dan f-measure pada entitas Pengujian Hidden Markov Model dengan Menambahan Teknik Laplace Smoothing dan Regular Expression Pengujian ini dilakukan dengan menambahkan teknik Laplace Smoothing dan Regular Expression agar data uji yang tidak ditemukan pada latih tidak bernilai nol atau memiliki nilai transition probability dan emission probability serta apabila data uji yang ditemukan memiliki pola seperti pada entitas maka sistem akan memberi entitas. Penambahan Regular Expression ini dikarenakan melihat dari pola kata pada entitas memiliki pola yang sama yaitu angkaangka yang dipisahkan oleh 2 garis miring. Tabel 4. Hasil pengujian 3 Entitas Precision Recall F- Measure TITLE PER TRANS EXP_MON MON TYP_COMP FIRST_ORG SECOND_OR G EXP_ NO_ MONTH_ YEAR_ Rata-rata Nilai precision terendah terdapat pada entitas EXP_MON sebesar 65.69% serta nilai recall dan f-measure terdapat pada entitas TYPE_COMP sebesar 66.67%. Penambahan Regular Expression pada sistem dapat menangani kesalahan pemberian entitas pada pengujian sebelumnya. Sehingga rata-rata nilai precision, recall dan f-measure yang didapatkan setelah menambahkan teknik Laplace Smoothing dan Regular Expression ini berturut-turut 81.75%, 87.88% dan 82.39%. Hal ini menunjukkan bahwa dengan menambahkan teknik Laplace Smoothing dan Regular Expression dapat meningatkan nilai precision, recall dan f-measure pada sistem pengenalan bernama untuk identifikasi transaksi akuntansi. 5. ANALISIS Berdasarkan pengujian yang telah dilakukan, didapatkan variasi terbaik pertama pada pengujian Hidden Markov Model dengan

7 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2857 menambahkan teknik Laplace Smoothing dan Regular Expression dengan rata-rata nilai precision, recall dan f-measure berturut-turut sebesar 81.75%, 87.88% dan 82.39%. Variasi terbaik kedua terdapat pada pengujian Hidden Markov Model dengan menambahkan teknik Laplace Smoothing dengan rata-rata nilai precision, recall dan f-measure berturut-turut sebesar 74.06%, 80.19%, dan 74.69%. Variasi terbaik ketiga terdapat pada pengujian Hidden Markov Model dengan rata-rata nilai precision, recall dan f-measure sebesar 39.19%. Berdasarkan pengujian yang telah dilakukan, terlihat bahwa pemodelan asli Hidden Markov Model memiliki kinerja yang cukup baik dalam mengenali entitas kata. Namun, pemodelan asli Hidden Markov Model akan memiliki hasil yang buruk apabila kata-kata pada data uji belum pernah dikenali sebelumnya atau tidak ada dalam data latih. Penambahan teknik Laplace Smoothing pada pemodelan Hidden Markov Model mampu menangani katakata yang belum pernah dikenali sebelumnya, sehingga penambahan teknik Laplace Smoothing ini dapat meningkatkan nilai precision, recall dan f-measure menjadi 74.06%, 80.19%, dan 74.69%.. Meskipun dengan penambahan teknik ini juga terdapat kelemahan, seperti kata yang seharusnya tidak memiliki entitas namun diberi entitas oleh sistem. Misalnya kata yang seharusnya diberi entitas tetapi sistem memberikan entitas MONTH_. Penambahan teknik Laplace Smoothing ini belum bisa menangani kata yang berentitas, hal ini disebabkan transition probability dari tag START ke MONTH_ lebih besar daripada transition probability dari tag START ke berdasarkan data latih. Penggunaan teknik Regular Expression dapat menangani masalah ini, yaitu kata yang terdapat di data uji pada pengujian sebelumnya yang diberi tag MONTH_ berhasil diperbaiki menjadi tag. Contohnya kata 23/1/2010 dikenali sebagai entitas MONTH_ pada pengujian sebelumnya, berhasil diperbaiki oleh sistem dengan mengenali ata 23/1/2010 sebagai entitas. Hal ini dikarenakan apabila kata yang diujikan memiliki pola yang sama dengan entitas akan dikenali oleh Regex, kemudian sistem secara otomatis akan memberikan tag pada kata tersebut. 6. KESIMPULAN Untuk mengimplementasikan Hidden Markov Model dan algoritme Viterbi yang harus dilakukan terlebih dahulu yaitu pre-processing terhadap data latih maupun data uji dengan menghilangkan stopword, melakukan tokenisasi serta case folding. Selanjutnya menghitung frekuensi tag yang muncul pada data latih serta frekuensi suatu kata dengan entitas tertentu pada data latih dan menghitung frekuensi perpindahan state pada data latih. Frekuensi yang telah disimpan akan dipanggil pada proses perhitungan transition probability dan emission probability. Setelah data latih telah dilakukan proses pemodelan menggunakan Hidden Markov Model, data uji akan diproses berdasarkan pemodelan yang telah dibuat menggunakan algoritme Viterbi. Berdasarkan hasil pengujian, nilai precision, recall dan f-measure yang didapatkan dari implementasi Hidden Markov Model ialah sebesar 93.86%, 93.93% dan 93.63% yang mana pengujian ini menggunakan data uji yang terdapat pada data latih. Namun, apabila data uji yang digunakan tidak terdapat pada data latih nilai precision, recall dan f-measure yang didapatkan cenderung menurun. Laplace Smoothing terbukti mampu menangani kata yang belum pernah muncul sebelumnya pada data latih. Serta penambahan Regular Expression mampu menangani katakata dengan pola seperti pada entitas. Sehingga dapat disimpulkan pengenalan entitas bernama untuk identifikasi transaksi akuntansi menggunakan Hidden Markov Model dengan penambahan teknik Laplace Smoothing dan Regular Expression akan menjadikan sistem handal atau robustly. REFERENSI Abdelmagid, M., Ahmed, A. & Himmat, M., Information Extraction Methods and Etraction Techniques in the Chemical Document's Contents: Survey. ARPN Journal of Engineering and Applied Sciences, X, pp Chinchor, N., Brown, E., Ferro, L. & Robinson, P., Named Entity Recognition Task Definition. The MITRE Corporation and SAIC. Gaikwad, S.V., Chaugule, A. & Patil, P., Text Mining Methods and Techniques. International Journal of Computer Applications, LXXXV, pp

8 Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2858 Haulrich, M., Different Approaches to Unknown Words in a Hidden Markov Model Part-of-Speech Tagger. pp.1-8. Iswandi, I., Suwardi, I.S. & Maulidevi, N.U., Perancangan Named Entity Recognition dalam Akuntansi untuk Identifikasi Transaksi berdasarkan Teks Indonesia. In Seminar Nasional Pengembangan Aktual Teknologi Informasi (SENA BAKTI). Surabaya, Jurafsky, D. & Martin, J.H., Speech and Language Processing. Morwal, S. & Chopra, D., Identification and Classification of Named Entities in Indian Languages. International Journal on Natural Language Computing (IJNLC), II, pp Seymore, K., McCallum, A. & Rosenfeld, R., Learning Hidden Markov Model Structure for Information Extraction.

Penerapan Named Entity Recognition Untuk Mengenali Fitur Produk Pada E-Commerce Menggunakan Rule Template Dan Hidden Markov Model

Penerapan Named Entity Recognition Untuk Mengenali Fitur Produk Pada E-Commerce Menggunakan Rule Template Dan Hidden Markov Model Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 10, Oktober 2018, hlm. 3912-3920 http://j-ptiik.ub.ac.id Penerapan Named Entity Recognition Untuk Mengenali Fitur

Lebih terperinci

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2013 PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL I Wayan Hendra Maha Putra¹, Imelda Atastina², Alfian Akbar Gozali³ ¹Teknik

Lebih terperinci

Penggunaan Hidden Markov Model untuk Kompresi Kalimat

Penggunaan Hidden Markov Model untuk Kompresi Kalimat Penggunaan Hidden Markov Model untuk Kompresi Kalimat TESIS Karya tulis sebagai salah satu syarat Untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh YUDI WIBISONO NIM: 23505023 Program

Lebih terperinci

Analisis Sentimen Menggunakan Lexicalized-Hidden Markov Model(L-HMM)

Analisis Sentimen Menggunakan Lexicalized-Hidden Markov Model(L-HMM) Analisis Sentimen Menggunakan Lexicalized-Hidden Markov Model(L-HMM) Virani Kartika Satrioputri 1, Warih Maharani 2, Jondri 3 Abstrak Saat ini semakin banyak produsen yang menawarkan produknya melalui

Lebih terperinci

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat

Lebih terperinci

IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan)

IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan) IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan) (Bab 8.5-8.8 Jurafsky & Martin) Ruli Manurung Fakultas Ilmu Komputer Universitas Indonesia 25 Februari 2008 Outline Stochastic POS Tagging

Lebih terperinci

BAB III. Hidden Markov Models (HMM) Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata,

BAB III. Hidden Markov Models (HMM) Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata, BAB III Hidden Markov Models (HMM) 3.1 Pendahuluan Rantai Markov mempunyai state yang dapat diobservasi secara langsung. Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata, beberapa

Lebih terperinci

PERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA

PERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA PERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA Astria Kurniawan Sumantri 1, Indra Budi 2, Heri Kurniawan 2 1,2,3 Fakultas Ilmu Komputer,Universitas

Lebih terperinci

Bandung, Indonesia Bandung, Indonesia

Bandung, Indonesia Bandung, Indonesia ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6353 Analisis dan Implementasi Pengklasifikasian Pesan Singkat pada Penyaringan SMS Spam Menggunakan Algoritma Multinomial Naïve

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi

Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN: 1978-1520 1 Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi Nitin Sabloak 1, Bebeto Agung Hardono 2, Derry Alamsyah 3 1,2 STMIK GI

Lebih terperinci

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Twitter Twiter adalah sebuah layanan media sosial yang memungkinkan penggunanya untuk menulis maksimal 140 karakter, yang dikenal sebagai Tweet. Twitter didirikan oleh Jack Dorsey

Lebih terperinci

EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA

EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

Truecasing untuk Teks Bahasa Indonesia

Truecasing untuk Teks Bahasa Indonesia Truecasing untuk Teks Bahasa Indonesia Said Al Faraby dan Ade Romadhony Fakultas Informatika Universitas Telkom Indonesia {saidalfaraby,aderomadhony}@telkomuniversity.ac.id Abstrak Penggunaan huruf besar

Lebih terperinci

BAB I PENDAHULUAN. Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi

BAB I PENDAHULUAN. Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi secara beruntun dan dengan kemungkinan yang berbeda-beda. Sebagai contoh sekarang

Lebih terperinci

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov JURNAL SAINS DAN SENI POMITS Vol. 6, No.2, (2017) 2337-3520 (2301-928X Print) A 39 Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov Risa Septi Pratiwi Daryono Budi Utomo Jurusan

Lebih terperinci

Named Entity Recognition Menggunakan Hidden Markov Model dan Algoritma Viterbi pada Teks Tanaman Obat

Named Entity Recognition Menggunakan Hidden Markov Model dan Algoritma Viterbi pada Teks Tanaman Obat Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 12, Desember 2017, hlm. 1858-1864 http://j-ptiik.ub.ac.id Named Entity Recognition Menggunakan Hidden Markov Model

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Indonesia adalah bahasa resmi dari Negara Indonesia. Berdasarkan ketentuan UU Nomor 24 tahun 2009 (Pasal 3) tujuan dari penggunaan Bahasa Indonesia sebagai bahasa

Lebih terperinci

BABI PENDAHULUAN. 1.1 Latar Belakang

BABI PENDAHULUAN. 1.1 Latar Belakang BABI PENDAHULUAN 1.1 Latar Belakang Named entity recognition(ner) merupakan salah satu bagian domain Information Extraction(IE) pada sistem Natural Language Processing(NLP). Sistem NER bertujuan untuk

Lebih terperinci

PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM.

PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM. PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM. 1208605026 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN ILMU KOMPUTER

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kemajuan dibidang teknologi informasi dan telekomunikasi berdampak pada munculnya berbagai media sosial, seperti Twitter. Twitter didirikan oleh Jack Dorsey, Biz Stone,

Lebih terperinci

SKRIPSI RANTI RAMADHIANA

SKRIPSI RANTI RAMADHIANA EKSTRAKSI KATA KUNCI OTOMATIS TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE TEXTRANK SKRIPSI RANTI RAMADHIANA 121402056 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

Lebih terperinci

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL Adhitya Teguh Nugraha Program Studi Teknik Informatika Jurusan Teknik Elektro Fakultas Teknik Universitas Tanjungpura ituteguh@gmail.com

Lebih terperinci

UKDW BAB 1 PENDAHULUAN Latar Belakang

UKDW BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Dengan perkembangan teknologi yang semakin pesat, setiap orang dituntut untuk bisa memanfaatkan dengan baik perkembangan teknologi dan dapat menggunakan di dalam kehidupan

Lebih terperinci

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov A39 Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov Risa Septi Pratiwi dan Daryono Budi Utomo Departemen Matematika, Fakultas Matematka dan Ilmu Pengetahuan Alam, Institut Teknologi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Memasuki era big data, pertumbuhan data berbentuk dokumen teks semakin tinggi. Sehingga diperlukan text processing untuk pengolahan data yang sangat besar. Dokumen

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

SISTEM ANALISIS SENTIMEN POSITIF DAN NEGATIF MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES PADA KASUS TOKOH PUBLIK CAPRES INDONESIA 2014

SISTEM ANALISIS SENTIMEN POSITIF DAN NEGATIF MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES PADA KASUS TOKOH PUBLIK CAPRES INDONESIA 2014 SISTEM ANALISIS SENTIMEN POSITIF DAN NEGATIF MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES PADA KASUS TOKOH PUBLIK CAPRES INDONESIA 2014 Oleh Yosafat Gerald Montalili NIM : 612006047 Skripsi Untuk melengkapi

Lebih terperinci

Pembuatan Kakas Bantu untuk Mendeteksi Ketidaksesuaian Diagram Urutan (Sequence Diagram) dengan Diagram Kasus Penggunaan (Use Case Diagram)

Pembuatan Kakas Bantu untuk Mendeteksi Ketidaksesuaian Diagram Urutan (Sequence Diagram) dengan Diagram Kasus Penggunaan (Use Case Diagram) JURNAL TEKNIK ITS Vol. 6, No. 1, (2017) ISSN: 2337-3539 (2301-9271 Print) A-71 Pembuatan Kakas Bantu untuk Mendeteksi Ketidaksesuaian Diagram Urutan (Sequence Diagram) dengan Diagram Kasus Penggunaan (Use

Lebih terperinci

PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI

PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI SKRIPSI I GEDE ARYA MAHARTA NIM. 1108605025 JURUSAN ILMU

Lebih terperinci

BAB I PENDAHULUAN. Perkembangan ilmu pengetahuan dan teknologi yang sangat pesat,

BAB I PENDAHULUAN. Perkembangan ilmu pengetahuan dan teknologi yang sangat pesat, BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan dan teknologi yang sangat pesat, menjadikan statistika memegang peranan penting dalam kehidupan. Hampir semua fenomena yang terjadi

Lebih terperinci

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM Jurnal Diajukan kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta untuk

Lebih terperinci

BAB III HIDDEN MARKOV MODELS. Rantai Markov bermanfaat untuk menghitung probabilitas urutan keadaan

BAB III HIDDEN MARKOV MODELS. Rantai Markov bermanfaat untuk menghitung probabilitas urutan keadaan BAB III HIDDEN MARKOV MODELS Rantai Markov bermanfaat untuk menghitung probabilitas urutan keadaan yang dapat diamati. Tetapi terkadang ada urutan dari suatu keadaan yang ingin diketahui tetapi tidak dapat

Lebih terperinci

Peringkasan Teks Otomatis Pada Artikel Berita Kesehatan Menggunakan K-Nearest Neighbor Berbasis Fitur Statistik

Peringkasan Teks Otomatis Pada Artikel Berita Kesehatan Menggunakan K-Nearest Neighbor Berbasis Fitur Statistik Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 11, November 2017, hlm. 1198-1203 http://j-ptiik.ub.ac.id Peringkasan Teks Otomatis Pada Artikel Berita Kesehatan

Lebih terperinci

IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING

IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING Imam Fahrur Rozi 3 Permasalahan yang pertama dihadapi dalam mengembangkan sistem opinion mining adalah menentukan apakah suatu teks

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kehadiran teknologi web yang interaktif telah merubah cara orang mengekspresikan pandangan dan opininya. Saat ini pengguna dapat menulis ulasan suatu produk pada situs

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com

Lebih terperinci

PEMBUATAN MODEL NAMED ENTITY RECOGNITION UNTUK TWITTER BAHASA INDONESIA DENGAN MENGGUNAKAN STANFORD NER

PEMBUATAN MODEL NAMED ENTITY RECOGNITION UNTUK TWITTER BAHASA INDONESIA DENGAN MENGGUNAKAN STANFORD NER PEMBUATAN MODEL NAMED ENTITY RECOGNITION UNTUK TWITTER BAHASA INDONESIA DENGAN MENGGUNAKAN STANFORD NER TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika

Lebih terperinci

AKUISISI PENGETAHUAN MENGGUNAKAN MULTIPLE CLASSIFICATION RIPPLE DOWN RULES (MCRDR)

AKUISISI PENGETAHUAN MENGGUNAKAN MULTIPLE CLASSIFICATION RIPPLE DOWN RULES (MCRDR) AKUISISI PENGETAHUAN MENGGUNAKAN MULTIPLE CLASSIFICATION RIPPLE DOWN RULES (MCRDR) Diana Pratiwi¹, Ririn Dwi Agustin², Agung Toto Wibowo³ ¹Teknik Informatika,, Universitas Telkom Abstrak Proses ekstraksi

Lebih terperinci

Text Pre-Processing. M. Ali Fauzi

Text Pre-Processing. M. Ali Fauzi Text Pre-Processing M. Ali Fauzi Latar Belakang Latar Belakang Dokumen-dokumen yang ada kebanyakan tidak memiliki struktur yang pasti sehingga informasi di dalamnya tidak bisa diekstrak secara langsung.

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah

Lebih terperinci

1. PENDAHULUAN 1.1 Latar belakang Masalah

1. PENDAHULUAN 1.1 Latar belakang Masalah 1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.

Lebih terperinci

Deteksi Fraud Menggunakan Metode Model Markov Tersembunyi pada Proses Bisnis

Deteksi Fraud Menggunakan Metode Model Markov Tersembunyi pada Proses Bisnis JURNAL TEKNIK ITS Vol. 6, No. 1, (2017) ISSN: 2337-3539 (2301-9271 Print) A-24 Deteksi Fraud Menggunakan Metode Model Markov Tersembunyi pada Proses Bisnis Andrean Hutama Koosasi, Riyanarto Sarno, dan

Lebih terperinci

Prodi S1 Teknik Informatika, Fakultas Teknik, Universitas Telkom.

Prodi S1 Teknik Informatika, Fakultas Teknik, Universitas Telkom. Implementasi dan Analisis Keterkaitan Semantik Antar Kata Menggunakan Pointwise Mutual Informationmax dengan Estimasi dari Kata Polisemi Implementation and Analysis of Semantic Relatedness to Words Pair

Lebih terperinci

Implementasi Teori Graf Dalam Masalah Fingerprint Recognition (Pengenalan Sidik Jari)

Implementasi Teori Graf Dalam Masalah Fingerprint Recognition (Pengenalan Sidik Jari) Implementasi Teori Graf Dalam Masalah Fingerprint Recognition (Pengenalan Sidik Jari) Amalfi Yusri Darusman Jurusan Teknik Informatika Institut Teknologi Bandung, jalan Ganesha 10 Bandung, email : if17023@students.if.itb.a.c.id

Lebih terperinci

KAJIAN MODEL HIDDEN MARKOV KONTINU DENGAN PROSES OBSERVASI ZERO DELAY DAN APLIKASINYA PADA HARGA GABAH KERING PANEN T A M U R I H

KAJIAN MODEL HIDDEN MARKOV KONTINU DENGAN PROSES OBSERVASI ZERO DELAY DAN APLIKASINYA PADA HARGA GABAH KERING PANEN T A M U R I H KAJIAN MODEL HIDDEN MARKOV KONTINU DENGAN PROSES OBSERVASI ZERO DELAY DAN APLIKASINYA PADA HARGA GABAH KERING PANEN T A M U R I H SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009 PERNYATAAN MENGENAI

Lebih terperinci

1. Introduction. tertentu memegang peran penting dalam. Abstract

1. Introduction. tertentu memegang peran penting dalam. Abstract Perbandingan Metode Latent Semantic Analysis, Syntactically Enhanced Latent Semantic Analysis, dan Generalized Latent Semantic Analysis dalam Klasifikasi Dokumen Berbahasa Inggris Gilbert Wonowidjojo Bina

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan jumlah situs web (website) di Internet berdasarkan hasil survey dari Netcraft (2013) menunjukkan peningkatan pesat dari 18 juta website pada tahun 2000

Lebih terperinci

PENENTUAN LOKASI PARKIR KOSONG MENGGUNAKAN ALGORITMA PROBABILISTIC NEURAL NETWORK (PNN) SKRIPSI JOKO KURNIANTO

PENENTUAN LOKASI PARKIR KOSONG MENGGUNAKAN ALGORITMA PROBABILISTIC NEURAL NETWORK (PNN) SKRIPSI JOKO KURNIANTO PENENTUAN LOKASI PARKIR KOSONG MENGGUNAKAN ALGORITMA PROBABILISTIC NEURAL NETWORK (PNN) SKRIPSI JOKO KURNIANTO 121402102 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

ABSTRAK. Kata kunci: Sistem Tanya Jawab, Semantic Web, Ontology, domain terbatas. v Universitas Kristen Maranatha

ABSTRAK. Kata kunci: Sistem Tanya Jawab, Semantic Web, Ontology, domain terbatas. v Universitas Kristen Maranatha ABSTRAK Informasi telah menjadi bagian yang sangat penting didalam pertumbuhan masyarakat modern. Dengan meningkatnya kebutuhan informasi ini, maka banyak orang memerlukan mesin pencari informasi yang

Lebih terperinci

ABSTRAK. Kata Kunci: economic order quantity, inventory. Universitas Kristen Maranatha

ABSTRAK. Kata Kunci: economic order quantity, inventory. Universitas Kristen Maranatha ABSTRAK Perusahaan XXX adalah perusahaan yang bergerak di bidang penjualan onderdil motor. Perusahaan ini masih manual dalam melakukan pencatatan datanya sehingga dapat menyebabkan data yang dicatat rusak

Lebih terperinci

BAB 3 PERANCANGAN SISTEM

BAB 3 PERANCANGAN SISTEM 21 BAB 3 PERANCANGAN SISTEM Sebelum citra tanda tangan dikenali dengan menggunakan Hidden Markov Model (HMM) citra tanda tangan tersebut ditransmisikan dengan dikompresi menggunakan Run Length Encoding

Lebih terperinci

Oleh: ARIF DARMAWAN NIM

Oleh: ARIF DARMAWAN NIM APLIKASI PENGKLASIFIKASIAN DOKUMEN INFO PADA TWITTER MENGGUNAKAN ALGORITMA NAIVE BAYES TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

APLIKASI PENDATAAN DAN PENGELOLAAN ADMINISTRASI KEUANGAN PT MITRA LINTANG INDONESIA. Program Studi Diploma III Teknik Informatika.

APLIKASI PENDATAAN DAN PENGELOLAAN ADMINISTRASI KEUANGAN PT MITRA LINTANG INDONESIA. Program Studi Diploma III Teknik Informatika. APLIKASI PENDATAAN DAN PENGELOLAAN ADMINISTRASI KEUANGAN PT MITRA LINTANG INDONESIA Tugas Akhir untuk memenuhi sebagian persyaratan mencapai derajat Diploma III Program Studi Diploma III Teknik Informatika.

Lebih terperinci

EKSTRAKSI FITUR AKSARA BALI MENGGUNAKAN METODE ZONING

EKSTRAKSI FITUR AKSARA BALI MENGGUNAKAN METODE ZONING 44 Teknologi Elektro, Vol. 14, No.2, Juli Desember 2015 EKSTRAKSI FITUR AKSARA BALI MENGGUNAKAN METODE ZONING I Wayan Agus Surya Darma 1, I Ketut Gede Darma Putra 2, Made Sudarma 3 Abstract Feature extraction

Lebih terperinci

Penerapan Hidden Markov Model Pada Harga Saham

Penerapan Hidden Markov Model Pada Harga Saham Penerapan Hidden Markov Model Pada Harga Saham Sri Wahyuni Mamonto 1, Yohanes A. R. Langi 2, Altien J. Rindengan 3 1 Program Studi Matematika, FMIPA, UNSRAT Manado, mamontosri@gmail.com 2 Program Studi

Lebih terperinci

PREDIKSI BENCANA ALAM DI WILAYAH KABUPATEN WONOGIRI DENGAN KONSEP MARKOV CHAINS

PREDIKSI BENCANA ALAM DI WILAYAH KABUPATEN WONOGIRI DENGAN KONSEP MARKOV CHAINS E-ISSN 2527-9378 Jurnal Statistika Industri dan Komputasi Volume 3, No. 1, Januari 2018, pp. 63-70 PREDIKSI BENCANA ALAM DI WILAYAH KABUPATEN WONOGIRI DENGAN KONSEP MARKOV CHAINS Petronella Mira Melati

Lebih terperinci

BAB 3 PERANCANGAN. Tabel 3.1 Daftar Kategori dan Jumlah Dokumen Teks. Dokumen Bulutangkis 155 Basket 59 Otomotif 160 Sepakbola 767 Tenis 159

BAB 3 PERANCANGAN. Tabel 3.1 Daftar Kategori dan Jumlah Dokumen Teks. Dokumen Bulutangkis 155 Basket 59 Otomotif 160 Sepakbola 767 Tenis 159 23 BAB 3 PERANCANGAN Bab ini menjelaskan tentang perancangan yang digunakan untuk melakukan eksperimen klasifikasi dokumen teks. Bab perancangan klasifikasi dokumen teks ini meliputi data (subbab 3.1),

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

JISICOM (Journal of Information System, Informatics and Computing ) APLIKASI PENGENALAN UCAPAN HURUF JEPANG MENGGUNAKAN HIDDEN MARKOV MODEL (HMM)

JISICOM (Journal of Information System, Informatics and Computing ) APLIKASI PENGENALAN UCAPAN HURUF JEPANG MENGGUNAKAN HIDDEN MARKOV MODEL (HMM) APLIKASI PENGENALAN UCAPAN HURUF JEPANG MENGGUNAKAN HIDDEN MARKOV MODEL (HMM) Dahlan Abdullah* 1, Cut Ita Erliana* 2 *1 Prodi Teknik Informatika, Universitas Malikussaaleh, Aceh, Indonesia *2 Prodi Teknik

Lebih terperinci

Klasifikasi Dokumen Sambat Online Menggunakan Metode K-Nearest Neighbor dan Features Selection Berbasis Categorical Proportional Difference

Klasifikasi Dokumen Sambat Online Menggunakan Metode K-Nearest Neighbor dan Features Selection Berbasis Categorical Proportional Difference Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 8, Agustus 2018, hlm. 2449-2454 http://j-ptiik.ub.ac.id Klasifikasi Dokumen Sambat Online Menggunakan Metode K-Nearest

Lebih terperinci

Saat ini Web merupakan sumber informasi dengan volume yang besar.

Saat ini Web merupakan sumber informasi dengan volume yang besar. TUGAS AKHIR Sistem Ekstraksi Informasi Web Menggunakan Metode Pencarian Pola Otomatis Berbasis Pencocokan Pohon Sigit Dewanto 05/186213/PA/10559 http://nuevasystem.com PENDAHULUAN Latar Belakang Masalah

Lebih terperinci

Pengenalan Plat Nomor Mobil Menggunakan Metode Learning Vector Quantization

Pengenalan Plat Nomor Mobil Menggunakan Metode Learning Vector Quantization Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 3, Maret 2018, hlm. 1313-1317 http://j-ptiik.ub.ac.id Pengenalan Plat Nomor Mobil Menggunakan Metode Learning Vector

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh

Lebih terperinci

RANCANG BANGUN SISTEM PENCARIAN DOKUMEN JURNAL MENGGUNAKAN METODE BM25+

RANCANG BANGUN SISTEM PENCARIAN DOKUMEN JURNAL MENGGUNAKAN METODE BM25+ RANCANG BANGUN SISTEM PENCARIAN DOKUMEN JURNAL MENGGUNAKAN METODE BM25+ LEMBAR JUDUL SKRIPSI DENI SUPRIAWAN NIM. 1108605001 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN

Lebih terperinci

SISTEM NOTIFIKASI KEMACETAN LALU LINTAS BERBASIS MEDIA SOSIAL DENGAN METODE NLP

SISTEM NOTIFIKASI KEMACETAN LALU LINTAS BERBASIS MEDIA SOSIAL DENGAN METODE NLP SISTEM NOTIFIKASI KEMACETAN LALU LINTAS BERBASIS MEDIA SOSIAL DENGAN METODE NLP TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh

Lebih terperinci

ABSTRAK. Kata kunci: Spam, Android, Pesan, Java, Webservice. Universitas Kristen Maranatha

ABSTRAK. Kata kunci: Spam, Android, Pesan, Java, Webservice. Universitas Kristen Maranatha ABSTRAK Penipuan dengan menggunakan pesan singkat pada ponsel yang diterima oleh pengguna sampai sekarang ini masih sangat banyak. Pesan penipuan ini dikirim oleh orang yang tidak bertanggung jawab dan

Lebih terperinci

BAB 1 PENDAHULUAN. tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai

BAB 1 PENDAHULUAN. tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai 1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Komputer adalah sebuah alat/mesin yang membantu kita untuk menyelesaikan tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai penghibur

Lebih terperinci

Perbandingan Teknik Pengklasteran Dalam Visualisasi Data Teks Bahasa Indonesia

Perbandingan Teknik Pengklasteran Dalam Visualisasi Data Teks Bahasa Indonesia Perbandingan Teknik Pengklasteran Dalam Visualisasi Data Teks Bahasa Indonesia Praditya Kurniawan 1, Ema Utami 2, Andi Sunyoto 3 1,2,3 STMIK AMIKOM Yogyakarta e-mail: * 1 pradityakurniawan@gmail.com, 2

Lebih terperinci

RANCANG BANGUN SISTEM INFORMASI PENGELOLAAN PERPUSTAKAAN MENGGUNAKAN SCAN BARCODE HP BERBASIS WEB(STUDI KASUS : STT DHARMA ISWARA MADIUN) SKRIPSI

RANCANG BANGUN SISTEM INFORMASI PENGELOLAAN PERPUSTAKAAN MENGGUNAKAN SCAN BARCODE HP BERBASIS WEB(STUDI KASUS : STT DHARMA ISWARA MADIUN) SKRIPSI RANCANG BANGUN SISTEM INFORMASI PENGELOLAAN PERPUSTAKAAN MENGGUNAKAN SCAN BARCODE HP BERBASIS WEB(STUDI KASUS : STT DHARMA ISWARA MADIUN) SKRIPSI Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

PEMODELAN MARKOV SWITCHING AUTOREGRESSIVE

PEMODELAN MARKOV SWITCHING AUTOREGRESSIVE PEMODELAN MARKOV SWITCHING AUTOREGRESSIVE asa M arga ro) C ng Semara SKRIPSI Oleh : FIQRIA DEVI ARIYANI 24010210120021 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO 2014 PEMODELAN

Lebih terperinci

SKRIPSI. Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata Satu Program Studi Informatika

SKRIPSI. Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata Satu Program Studi Informatika HALAMAN JUDU L PENGUKURAN TINGKAT KEMIRIPAN DOKUMEN MENGGUNAKAN ALGORITMA JARO-WINKLER DAN ENHANCED CONFIX STRIPPING STEMMER SKRIPSI Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata

Lebih terperinci

IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX

IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.3 Desember 2015 Page 7422 IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX IMPLEMENTATION

Lebih terperinci

SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL

SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.1 April 2015 Page 262 SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL SIMULATION AND ANALYSIS

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM BAB 3 ANALISIS DAN PERANCANGAN PROGRAM Program aplikasi ini dirancang dengan menggunakan perangkat lunak Microsoft Visual C# 2008 Express Edition. Proses perancangan menggunakan pendekatan Object Oriented

Lebih terperinci

Penggunaan Named Entity Recognition dan Artificial Intelligence Markup Language untuk Penerapan Chatbot Berbasis Teks

Penggunaan Named Entity Recognition dan Artificial Intelligence Markup Language untuk Penerapan Chatbot Berbasis Teks Jurnal Telematika, vol. 10 no. 2, Institut Teknologi Harapan Bangsa, Bandung ISSN: 1858-2516 Penggunaan Named Entity Recognition dan Artificial Intelligence Markup Language untuk Penerapan Chatbot Berbasis

Lebih terperinci

PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM ABSTRAK

PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM  ABSTRAK J~ICON, Vol. 3 No. 2, Oktober 2015, pp. 106 ~ 112 106 PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM E-MAIL Tince Etlin Tallo 1, Bertha S. Djahi 2, Yulianto T. Polly 3 1,2,3 Jurusan Ilmu

Lebih terperinci

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL (Studi Kasus Perpustakaan Universitas Udayana) LEMBAR JUDUL KOMPETENSI RPL SKRIPSI NI MADE

Lebih terperinci

ABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA

ABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA ABSTRAK Twitter merupakan sebuah aplikasi social networking yang memungkinkan usernya untuk dapat mengirimkan pesan pada waktu yang bersamaan. Data yang diambil melalui Twitter dapat dijadikan sebagai

Lebih terperinci

SKRIPSI ALMAN JULINIUS TARIGAN

SKRIPSI ALMAN JULINIUS TARIGAN IMPLEMENTASI SPEECH RECOGNITION PADA APLIKASI PEMBELAJARAN YANG DITUJUKAN UNTUK MEMBANTU ANAK-ANAK PENDERITA DISLEKSIA DENGAN METODE HIDDEN MARKOV MODEL DAN METODE MULTISENSORI SKRIPSI ALMAN JULINIUS TARIGAN

Lebih terperinci

ABSTRAK. vii. Kata Kunci : konstruksi, material, informasi. Universitas Kristen Maranatha

ABSTRAK. vii. Kata Kunci : konstruksi, material, informasi. Universitas Kristen Maranatha ABSTRAK Masalah pengadaan material seringkali menjadi penghambat dalam suatu proyek konstruksi sipil. Baik dari penentuan volume kebutuhan material dalam proyek maupun penjadwalan pengadaan material ke

Lebih terperinci

HASIL DAN PEMBAHASAN

HASIL DAN PEMBAHASAN 10 HASIL DAN PEMBAHASAN Pengumpulan Dokumen Tahapan awal yang dilakukan dalam penelitian adalah mengolah dokumen XML yang akan menjadi korpus. Terdapat 21578 dokumen berita yang terdiri atas 135 topik.

Lebih terperinci

SISTEM KLASIFIKASI REPORTING BERITA MENGGUNAKAN METODE NAIVE BAYES (Studi Kasus Situs Resmi Pemerintahan) KOMPETENSI RPL SKRIPSI

SISTEM KLASIFIKASI REPORTING BERITA MENGGUNAKAN METODE NAIVE BAYES (Studi Kasus Situs Resmi Pemerintahan) KOMPETENSI RPL SKRIPSI SISTEM KLASIFIKASI REPORTING BERITA MENGGUNAKAN METODE NAIVE BAYES (Studi Kasus Situs Resmi Pemerintahan) KOMPETENSI RPL SKRIPSI Luh Gde Apryta Astaridewi 1108605042 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN

Lebih terperinci

BAB I PENDAHULUAN A. PENDAHULUAN. Dewasa ini persaingan bisnis antar perusahaan semakin ketat. Banyak

BAB I PENDAHULUAN A. PENDAHULUAN. Dewasa ini persaingan bisnis antar perusahaan semakin ketat. Banyak 1 BAB I A. PENDAHULUAN PENDAHULUAN Dewasa ini persaingan bisnis antar perusahaan semakin ketat. Banyak diantara perusahaan mengubah strategi bisnis mereka guna meningkatkan laba dan juga dengan memperbaiki

Lebih terperinci

ANALISA HASIL PERBANDINGAN IDENTIFIKASI CORE POINT PADA SIDIK JARI MENGGUNAKAN METODE DIRECTION OF CURVATURE DAN POINCARE INDEX

ANALISA HASIL PERBANDINGAN IDENTIFIKASI CORE POINT PADA SIDIK JARI MENGGUNAKAN METODE DIRECTION OF CURVATURE DAN POINCARE INDEX ANALISA HASIL PERBANDINGAN IDENTIFIKASI CORE POINT PADA SIDIK JARI MENGGUNAKAN METODE DIRECTION OF CURVATURE DAN POINCARE INDEX Mohammad imron (1), Yuliana Melita (2), Megister Teknologi Informasi Institusi

Lebih terperinci

ABSTRAK. v Universitas Kristen Maranatha

ABSTRAK. v Universitas Kristen Maranatha ABSTRAK PT. Mavic Lestarindo Persada adalah perusahaan yang memproduksi dan menjual produk oli otomotif dan industrial. Perusahaan ini memiliki divisi marketing yang bertugas melakukan penjualan produk.

Lebih terperinci

PENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT

PENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT PENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT Dedy Ahmad Kurniawan 1), Danny Kriestanto 2) Teknik Informatika, STMIK AKAKOM e-mail: dedyahmad.akakom10@gmail.com 1), danny@akakom.ac.id 2) ABSTRAK

Lebih terperinci

PENGENALAN WAJAH DENGAN CITRA MASUKAN BERUPA CITRA SKETSA WAJAH SEBAGAI HASIL SINTESIS DENGAN TEKNIK MULTISCALE MARKOV RANDOM FIELD (MRF)

PENGENALAN WAJAH DENGAN CITRA MASUKAN BERUPA CITRA SKETSA WAJAH SEBAGAI HASIL SINTESIS DENGAN TEKNIK MULTISCALE MARKOV RANDOM FIELD (MRF) PENGENALAN WAJAH DENGAN CITRA MASUKAN BERUPA CITRA SKETSA WAJAH SEBAGAI HASIL SINTESIS DENGAN TEKNIK MULTISCALE MARKOV RANDOM FIELD (MRF) Disusun oleh : Alvin Silajaya (0922018) Jurusan Teknik Elektro,

Lebih terperinci

Kata kunci: Sistem Informasi, poin of sale, aplikasi data mining, algoritma apriori, Borland Delphi, SQL 2000, Association rules.

Kata kunci: Sistem Informasi, poin of sale, aplikasi data mining, algoritma apriori, Borland Delphi, SQL 2000, Association rules. PERANCANGAN DAN PEMBUATAN APLIKASI DATA MINING DENGAN MENGGUNAKAN ALGORITMA APRIORI PADA MINI MARKET X Norio Nurtanio / 0422115 Jurusan Teknik Elektro, Fakultas Teknik, Jalan Prof. Drg. Suria Sumantri

Lebih terperinci

ABSTRAK. Kata kunci: algoritma Smith-Waterman, algoritma Nazief-Adriani, cosine similarity, data mining, dokumen tugas akhir, nilai kemiripan

ABSTRAK. Kata kunci: algoritma Smith-Waterman, algoritma Nazief-Adriani, cosine similarity, data mining, dokumen tugas akhir, nilai kemiripan ABSTRAK Sistem pengecekan kemiripan dokumen tugas akhir pada Fakultas Teknologi Informasi Universitas Kristen Maranatha masih dilakukan secara manual sehingga mahasiswa dapat meniru dokumen tugas akhir

Lebih terperinci