IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan)

Ukuran: px
Mulai penontonan dengan halaman:

Download "IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan)"

Transkripsi

1 IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan) (Bab Jurafsky & Martin) Ruli Manurung Fakultas Ilmu Komputer Universitas Indonesia 25 Februari 2008

2 Outline Stochastic POS Tagging 1 Stochastic POS Tagging 2 3 4

3 POS ditentukan oleh konteks Ide dasar POS tagging POS tag sebuah kata dapat ditentukan oleh konteks di mana ia muncul. Bisa dalam corpus 1 Gue bisa menyelesaikan persoalan itu kok. 2 Penjinak ular menguras bisa hanya dengan cangkir plastik. 3 Masyarakat dan aparat bisa membersihkan sampah dengan baik. 4 Beliau menyatakan bisa menurunkan harga kedelai tahun ini. Aturan apa yang dapat disimpulkan mengenai bisa? Dalam rule-based tagger, ide ini dinyatakan dalam rule yang dibuat secara manual (mis: jika kata sesudahnya..., maka... ) Pada stochastic POS, konteks (corpus) diamati dan dipelajari secara otomatis.

4 Pemodelan statistik Pada intinya, pilih tag yang memaksimalkan rumus berikut: P(kata tag) P(tag n tag sebelumnya) Sebagai aproksimasi, sebuah bigram tagger memilih tag untuk kata ke-i (t i ) berdasarkan tag sebelumnya (t i 1 ) dan kata ke-i tersebut (w i ) t i = argmax j P(t j ti 1, w i ) Melalui beberapa asumsi Markovian, diperoleh: t i = argmax j P(t j ti 1) P(w i t j ) Perumusan statistik: Berapa kemungkinan tag VB (atau NN) jika tag sebelumnya TO? (tag sequence probability) dikalikan dengan Jika diketahui sebuah kata adalah VB (atau NN), berapa kemungkinan ia adalah race? (lexical likelihood)

5 Sebuah contoh Amati race pada dua kalimat berikut: 1 Secretariat/NNP is/vbz expected/vbn to/to race/vb tomorrow/nn 2 People/NNS continue/vbp to/to inquire/vb the/dt reason/nn for/in the/dt race/nn for/in outer/jj space/nn Bayangkan sudah diketahui POS tag yg benar kecuali untuk race. Konteks yang perlu diamati (secara bigram): 1 to/to race/??? 2 the/dt race/??? Untuk kasus pertama: 1 P(VB TO) P(race VB) = = P(NN TO) P(race NN) = =

6 Menggunakan statistik Definisi Hidden Markov Model (HMM) adalah pemodelan statistik di mana sebuah sistem menghasilkan (emit) urutan simbol yang dapat diamati (observation symbols) berdasarkan sebuah proses probabilistik yang parameternya tidak diketahui (hidden parameters). Proses probabilistik dinyatakan sebuah FSA: x 1, x 2,... adalah state yang menyatakan proses. a ij adalah state transition probabilities: berapa kemungkinan proses berpindah dari state i ke j? y 1, y 2,... adalah observation symbols. b ij adalah output/emission probability: berapa kemungkinan proses di state i menghasilkan symbol j?

7 Contoh gambar HMM

8 Menggunakan statistik HMM sering digunakan untuk memodelkan data sequential/temporal, di mana proses berjalan seiring waktu t, dengan asumsi berikut: Nilai hidden state x(t) sepenuhnya ditentukan oleh hidden state sebelumnya, x(t 1). Nilai observed symbol y(t) sepenuhnya ditentukan oleh hidden state pada saat itu, x(t). Menghitung probabilitas sebuah observation sequence Probabilitas Y = y 0, y 1, y 2,..., y L 1 dengan panjang L adalah P(Y ) = P X P(Y X)P(X). Jadi, kita menjumlahkan semua kemungkinan X = x 0, x 1, x 2,..., x L 1. Penghitungan brute-force dalam prakteknya bersifat intractable. Namun, ada algoritma forward dan Viterbi...

9 HMM Tagger Stochastic POS Tagging Contoh race: memilih tag terbaik untuk kata yang diamati. Sebuah HMM tagger memilih tag sequence terbaik untuk word sequence yang diamati. Word sequence yang diamati: W = w 1, w 2,..., w n Tag sequence yang terbaik/ benar : T = t 1, t 2,..., t n ˆT = argmax T τ P(T W ) Dengan Bayes Law: ˆT = argmax T τ P(T )P(W T ) Dengan chain rule: Q ˆT = argmax n T τ i=1 P(w i w 1 t 1... w i 1 t i 1 t i )P(t i t 1,... t i 1 )

10 Transformation-Based Tagging Eric Brill merumuskan teori transformation-based learning. Ide dasar: tangani dulu secara bodoh, perbaiki masalah yang timbul. Ulangi sampai beres. Contoh: P(NN race) = 0.98 P(VB race) = 0.02 Kesimpulan: tag semua race sebagai NN! Berdasarkan training data, pelajari rule, mis: Change NN to VB when the previous tag is TO.

11 Cara kerja TBL Tagger Cara kerja: 1 Lakukan proses tagging berdasarkan kamus 2 Cobalah semua kemungkinan transformasi (rule). Pilih yang paling banyak mengurangi error. Aplikasikanlah. 3 Ulangi langkah di atas sampai cukup. Tentunya ada banyak sekali kemungkinan transformasi, jadi dibatasi dengan template: Kata sebelum/sesudah adalah Z. Kata kedua sebelum/sesudah adalah Z. Salah satu dari kedua kata sebelum/sesudah adalah Z. dst.

12 Mengevaluasi hasil POS Tagger Biasanya dibandingkan dengan gold standard: data yang sudah di-tag secara manual oleh manusia. Yang dihitung adalah persentase tag yang dihasilkan benar sesuai dengan gold standard. Rata-rata POS tagger sekarang memiliki akurasi 96-97% (untuk tagset Penn Treebank sederhana ) Ini bagus atau jelek?

13 Mengevaluasi hasil POS Tagger Biasanya dibandingkan dengan gold standard: data yang sudah di-tag secara manual oleh manusia. Yang dihitung adalah persentase tag yang dihasilkan benar sesuai dengan gold standard. Rata-rata POS tagger sekarang memiliki akurasi 96-97% (untuk tagset Penn Treebank sederhana ) Ini bagus atau jelek? Human ceiling (upper-bound) Marcus et al. (1993) menemukan bahwa manusia memiliki kesepakatan 96-97% ketika Brown Corpus di-tag dengan tagset Penn Treebank. Artinya, sebuah gold standard dapat memiliki error 3-4%.

14 Mengevaluasi hasil POS Tagger Biasanya dibandingkan dengan gold standard: data yang sudah di-tag secara manual oleh manusia. Yang dihitung adalah persentase tag yang dihasilkan benar sesuai dengan gold standard. Rata-rata POS tagger sekarang memiliki akurasi 96-97% (untuk tagset Penn Treebank sederhana ) Ini bagus atau jelek? Human ceiling (upper-bound) Marcus et al. (1993) menemukan bahwa manusia memiliki kesepakatan 96-97% ketika Brown Corpus di-tag dengan tagset Penn Treebank. Artinya, sebuah gold standard dapat memiliki error 3-4%. Unigram baseline (lower-bound) Charniak et al. (1993) menunjukkan bahwa sebuah baseline algorithm, yang hanya menggunakan frekuensi unigram, mencapai akurasi 90-91%!

15 Multiple tags, Multiple words Multiple tags Kadang-kadang, sebuah POS tagger benar-benar kesulitan menentukan tag sebuah kata. Daripada memaksa untuk memilih, ia akan memberikan alternatif, mis: (JJ/VBD/VBN), (JJ/NN), dst. Multiple words Beberapa tagset, mis. C5 dan C7, menganggap frasa sebagai sebuah kata, mis: in terms of dianggap sebagai sebuah preposition (II3) dan diberi label in/ii31 terms/ii32 of/ii33 Beberapa corpus memecah stem + morfem-nya, mis: would/md n t/rb dan children/nns s/pos

16 Ringkasan Stochastic POS Tagging POS tag (yang ambigu) bisa ditentukan dengan bantuan konteks. Stochastic POS tagger memaksimalkan probabilitas P(kata tag) P(tag n tag sebelumnya) (nilai dihitung dari corpus). Hidden Markov Model adalah model statistik yang bisa mengestimasi hidden parameter dari pengamatan observable sequence yang dihasilkan. Tagger berdasarkan transformation based learning menggabungkan pendekatan rule-based dan stochastic. tagger dilakukan terhadap gold standard dan unigram baseline.

Tutorial: Pengenalan terhadap POS tagging dan Probabilistic Parsing

Tutorial: Pengenalan terhadap POS tagging dan Probabilistic Parsing 1/53 Tutorial: Pengenalan terhadap POS tagging dan Probabilistic Ruli Manurung Fakultas Ilmu Komputer Universitas Indonesia maruli@cs.ui.ac.id Workshop Nasional INACL Kamis, 7 Januari 2016 2/53 Outline

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Memasuki era big data, pertumbuhan data berbentuk dokumen teks semakin tinggi. Sehingga diperlukan text processing untuk pengolahan data yang sangat besar. Dokumen

Lebih terperinci

SKRIPSI. Triastuti Chandrawati

SKRIPSI. Triastuti Chandrawati Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning SKRIPSI Triastuti Chandrawati 1204000866 UNIVERSITAS INDONESIA FAKULTAS

Lebih terperinci

1. PENDAHULUAN 1.1 Latar belakang Masalah

1. PENDAHULUAN 1.1 Latar belakang Masalah 1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.

Lebih terperinci

BAB III HIDDEN MARKOV MODELS. Rantai Markov bermanfaat untuk menghitung probabilitas urutan keadaan

BAB III HIDDEN MARKOV MODELS. Rantai Markov bermanfaat untuk menghitung probabilitas urutan keadaan BAB III HIDDEN MARKOV MODELS Rantai Markov bermanfaat untuk menghitung probabilitas urutan keadaan yang dapat diamati. Tetapi terkadang ada urutan dari suatu keadaan yang ingin diketahui tetapi tidak dapat

Lebih terperinci

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2013 PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL I Wayan Hendra Maha Putra¹, Imelda Atastina², Alfian Akbar Gozali³ ¹Teknik

Lebih terperinci

UKDW BAB 1 PENDAHULUAN Latar Belakang

UKDW BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Dengan perkembangan teknologi yang semakin pesat, setiap orang dituntut untuk bisa memanfaatkan dengan baik perkembangan teknologi dan dapat menggunakan di dalam kehidupan

Lebih terperinci

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat

Lebih terperinci

Hidden Markov Model. 7.1 Probabilistic Reasoning

Hidden Markov Model. 7.1 Probabilistic Reasoning 7 Hidden Markov Model Probability is expectation founded upon partial knowledge. A perfect acquaintance with all the circumstances affecting the occurrence of an event would change expectation into certainty,

Lebih terperinci

BAB I PENDAHULUAN. Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi

BAB I PENDAHULUAN. Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi secara beruntun dan dengan kemungkinan yang berbeda-beda. Sebagai contoh sekarang

Lebih terperinci

PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM.

PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM. PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM. 1208605026 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN ILMU KOMPUTER

Lebih terperinci

BAB III. Hidden Markov Models (HMM) Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata,

BAB III. Hidden Markov Models (HMM) Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata, BAB III Hidden Markov Models (HMM) 3.1 Pendahuluan Rantai Markov mempunyai state yang dapat diobservasi secara langsung. Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata, beberapa

Lebih terperinci

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA Oleh: M Karibun H S G64101053 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi

Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN: 1978-1520 1 Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi Nitin Sabloak 1, Bebeto Agung Hardono 2, Derry Alamsyah 3 1,2 STMIK GI

Lebih terperinci

PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL

PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL Eka Rahayu Setyaningsih Teknik Informatika, Sekolah Tinggi Teknik Surabaya (1) e-mail: eka@stts.edu ABSTRAK Dalam penelitian

Lebih terperinci

IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING

IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING Imam Fahrur Rozi 3 Permasalahan yang pertama dihadapi dalam mengembangkan sistem opinion mining adalah menentukan apakah suatu teks

Lebih terperinci

Penggunaan Hidden Markov Model untuk Kompresi Kalimat

Penggunaan Hidden Markov Model untuk Kompresi Kalimat Penggunaan Hidden Markov Model untuk Kompresi Kalimat TESIS Karya tulis sebagai salah satu syarat Untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh YUDI WIBISONO NIM: 23505023 Program

Lebih terperinci

BAB I PENDAHULUAN. Perkembangan ilmu pengetahuan dan teknologi yang sangat pesat,

BAB I PENDAHULUAN. Perkembangan ilmu pengetahuan dan teknologi yang sangat pesat, BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan dan teknologi yang sangat pesat, menjadikan statistika memegang peranan penting dalam kehidupan. Hampir semua fenomena yang terjadi

Lebih terperinci

Implementasi Opinion Mining (Analisis Sentimen) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi

Implementasi Opinion Mining (Analisis Sentimen) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi 37 Implementasi Opinion Mining (Analisis Sentimen) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi Imam Fahrur Rozi, Sholeh Hadi Pramono dan Erfan Achmad Dahlan Abstrak Sentiment analysis atau

Lebih terperinci

Pengenalan Entitas Bernama untuk Identifikasi Transaksi Akuntansi Menggunakan Hidden Markov Model

Pengenalan Entitas Bernama untuk Identifikasi Transaksi Akuntansi Menggunakan Hidden Markov Model Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 7, Juli 2018, hlm. 2851-2858 http://j-ptiik.ub.ac.id Pengenalan Entitas Bernama untuk Identifikasi Transaksi Akuntansi

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang 1 BAB 1 PENDAHULUAN Bab ini berisi tentang latar belakang (subbab 1.1), tujuan penelitian (subbab 1.2), perumusan dan pembatasan masalah (subbab 1.3), metodologi penelitian (subbab 1.4), serta penjelasan

Lebih terperinci

Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara

Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara Bima Laksmana Pramudita (13511042) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,

Lebih terperinci

Teori Dasar Hidden Markov Model

Teori Dasar Hidden Markov Model Teori Dasar Hidden Markov Model Muhammad Eko Budi Prasetyo 18209020 1 Program Studi Sistem dan teknologi Informasi Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung

Lebih terperinci

TINJAUAN PUSTAKA. II.1 Model-model Pola Tata Bahasa

TINJAUAN PUSTAKA. II.1 Model-model Pola Tata Bahasa BAB II TINJAUAN PUSTAKA Bab ini membahas hal-hal apa saja yang pernah dilakukan sebelumnya mengenai model-model pola tata bahasa, pengurai (parser) untuk bahasa lain, dan pembangkitan pola tata bahasa

Lebih terperinci

BAB I PENDAHULUAN. I.1 Latar Belakang

BAB I PENDAHULUAN. I.1 Latar Belakang BAB I PENDAHULUAN I.1 Latar Belakang Pola tata bahasa memiliki manfaat dalam pemrosesan bahasa alami. Pemrosesan bahasa alami berawal dari keinginan manusia untuk berkomunikasi dengan komputer menggunakan

Lebih terperinci

PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA

PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA BAB III PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA Pada Bab III ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses awal (preprocessing) membentuk file masukan untuk pengurai

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN Bab ini akan menjelaskan latar belakang dari penelitian yang memberikan gambaran awal mengenai analisis sentimen dan perannya dalam perkembangan teknologi informasi. Tujuan dan ruang

Lebih terperinci

METODE MARKOV DAN PENERAPANNYA Markov Model and Its Applications. Noor Cholis Basjaruddin POLBAN

METODE MARKOV DAN PENERAPANNYA Markov Model and Its Applications. Noor Cholis Basjaruddin POLBAN METODE MARKOV DAN PENERAPANNYA Markov Model and Its Applications Noor Cholis Basjaruddin Politeknik Negeri Bandung 2016 Daftar Isi 1 Abstrak... 3 2 Abstract... 3 3 Pendahuluan... 3 4 Model Markov... 4

Lebih terperinci

PENGENALAN FORMULA MATEMATIKA DARI POLA TULISAN TANGAN

PENGENALAN FORMULA MATEMATIKA DARI POLA TULISAN TANGAN PENGENALAN FORMULA MATEMATIKA DARI POLA TULISAN TANGAN Yuliana Melita Pranoto, Edwin Pramana, dan Renato Budiman Teknik Informatika Sekolah Tinggi Teknik Surabaya ymp@stts.edu, epramana@gmail.com, dan

Lebih terperinci

Deteksi Fraud Menggunakan Metode Model Markov Tersembunyi pada Proses Bisnis

Deteksi Fraud Menggunakan Metode Model Markov Tersembunyi pada Proses Bisnis JURNAL TEKNIK ITS Vol. 6, No. 1, (2017) ISSN: 2337-3539 (2301-9271 Print) A-24 Deteksi Fraud Menggunakan Metode Model Markov Tersembunyi pada Proses Bisnis Andrean Hutama Koosasi, Riyanarto Sarno, dan

Lebih terperinci

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari BAB I PENDAHULUAN 1.1 Latar Belakang Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari internet ataupun milik pribadi juga semakin berkembang. Permasalahan utama adalah bagaimana memperoleh

Lebih terperinci

PART-OF-SPEECH TAGGING UNTUK BAHASA INDONESIA MENGGUNAKAN STANFORD POS-TAGGING

PART-OF-SPEECH TAGGING UNTUK BAHASA INDONESIA MENGGUNAKAN STANFORD POS-TAGGING PART-OF-SPEECH TAGGING UNTUK BAHASA INDONESIA MENGGUNAKAN STANFORD POS-TAGGING 1) Viny Christanti M., M.Kom, 2) Ir. Jeanny Pragantha, M.Eng dan 3) Victor 1,2,3) Teknik Informatika, Fakultas Teknologi Informasi,

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Empiris Pada penelitian ini, ada beberapa penelitian terkait yang peneliti gunakan sebagai tinjauan studi. Berikut merupakan penelitian penelitian terkait yang pernah

Lebih terperinci

KAJIAN MODEL HIDDEN MARKOV KONTINU DENGAN PROSES OBSERVASI ZERO DELAY DAN APLIKASINYA PADA HARGA GABAH KERING PANEN T A M U R I H

KAJIAN MODEL HIDDEN MARKOV KONTINU DENGAN PROSES OBSERVASI ZERO DELAY DAN APLIKASINYA PADA HARGA GABAH KERING PANEN T A M U R I H KAJIAN MODEL HIDDEN MARKOV KONTINU DENGAN PROSES OBSERVASI ZERO DELAY DAN APLIKASINYA PADA HARGA GABAH KERING PANEN T A M U R I H SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009 PERNYATAAN MENGENAI

Lebih terperinci

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA Oleh: M Karibun H S G64101053 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

SKRIPSI. Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik Informatika. Disusun Oleh :

SKRIPSI. Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik Informatika. Disusun Oleh : SKRIPSI PENERAPAN ANALISIS MORFOLOGI UNTUK PENANGANAN KATA BERIMBUHAN PADA POS TAGGER BAHASA INDONESIA BERBASIS STATISTIK IMPLEMENTING MORPHOLOGICAL ANALYZER FOR AFFIXES HANDLING IN STATISTIC BASED INDONESIAN

Lebih terperinci

Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia

Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia Abd Wahab Syahroni 1), Joan Santoso 2), Endang Setyati

Lebih terperinci

Penerapan Named Entity Recognition Untuk Mengenali Fitur Produk Pada E-Commerce Menggunakan Rule Template Dan Hidden Markov Model

Penerapan Named Entity Recognition Untuk Mengenali Fitur Produk Pada E-Commerce Menggunakan Rule Template Dan Hidden Markov Model Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 10, Oktober 2018, hlm. 3912-3920 http://j-ptiik.ub.ac.id Penerapan Named Entity Recognition Untuk Mengenali Fitur

Lebih terperinci

Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition

Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition Abstrak Angela Irfani 1, Ratih Amelia 2, Dyah Saptanti P 3 Laboratorium Ilmu dan Rekayasa Komputasi Departemen Teknik

Lebih terperinci

KEMUNGKINAN (LIKELIHOOD) MODEL FILOGENETIK MELALUI MODEL MARKOV TERSEMBUNYI Studi kasus: Hylobates, Pongo, Gorilla, Homo sapiens, dan Pan TESIS

KEMUNGKINAN (LIKELIHOOD) MODEL FILOGENETIK MELALUI MODEL MARKOV TERSEMBUNYI Studi kasus: Hylobates, Pongo, Gorilla, Homo sapiens, dan Pan TESIS KEMUNGKINAN (LIKELIHOOD) MODEL FILOGENETIK MELALUI MODEL MARKOV TERSEMBUNYI Studi kasus: Hylobates, Pongo, Gorilla, Homo sapiens, dan Pan TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar

Lebih terperinci

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL Adhitya Teguh Nugraha Program Studi Teknik Informatika Jurusan Teknik Elektro Fakultas Teknik Universitas Tanjungpura ituteguh@gmail.com

Lebih terperinci

Penerapan Hidden Markov Model Pada Harga Saham

Penerapan Hidden Markov Model Pada Harga Saham Penerapan Hidden Markov Model Pada Harga Saham Sri Wahyuni Mamonto 1, Yohanes A. R. Langi 2, Altien J. Rindengan 3 1 Program Studi Matematika, FMIPA, UNSRAT Manado, mamontosri@gmail.com 2 Program Studi

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang teori-teori dan konsep dasar yang mendukung pembahasan dari sistem yang akan dibuat. 2.1 Anak Berkebutuhan Khusus (ABK) Menurut Alimin (2012) Anak

Lebih terperinci

Hidden Markov Model (HMM) dan Pengenalan Pola. Toto Haryanto

Hidden Markov Model (HMM) dan Pengenalan Pola. Toto Haryanto Hidden Markov Model (HMM) dan Pengenalan Pola Toto Haryanto Hidden Markov Model Model Probabilistik Cocok Digunakan pada data yang bersifat temporal sekuenseial, contoh : Sinyal (Sinyal Suara, sinyal digital)

Lebih terperinci

Hidden Markov Model (HMM) dan Pengenalan Pola

Hidden Markov Model (HMM) dan Pengenalan Pola Hidden Markov Model (HMM) dan Pengenalan Pola Toto Haryanto Hidden Markov Model Model Probabilistik Cocok Digunakan pada data yang bersifat temporal sekuenseial, contoh : Sinyal (Sinyal Suara, sinyal digital)

Lebih terperinci

EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA

EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

PENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA

PENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA BAB IV PENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA Pada Bab IV ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses penentuan jenis kata (part of speech tagging)

Lebih terperinci

BAB I PENDAHULUAN. digunakan oleh masyarakat pada umumnya. Dahulu keramik hanya dimanfaatkan

BAB I PENDAHULUAN. digunakan oleh masyarakat pada umumnya. Dahulu keramik hanya dimanfaatkan BAB I PENDAHULUAN 1.1 Latar Belakang Keramik sudah dikenal di Indonesia sejak jaman Neolithikum. Keramik adalah salah satu dari peninggalan tersebut yang sampai saat ini masih banyak digunakan oleh masyarakat

Lebih terperinci

PEMODELAN MARKOV SWITCHING AUTOREGRESSIVE

PEMODELAN MARKOV SWITCHING AUTOREGRESSIVE PEMODELAN MARKOV SWITCHING AUTOREGRESSIVE asa M arga ro) C ng Semara SKRIPSI Oleh : FIQRIA DEVI ARIYANI 24010210120021 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO 2014 PEMODELAN

Lebih terperinci

Sistem Opinion Mining dengan Metode Pos Tagging dan SVM Untuk Ekstraksi Data Opini Publik pada Layanan JKBM

Sistem Opinion Mining dengan Metode Pos Tagging dan SVM Untuk Ekstraksi Data Opini Publik pada Layanan JKBM Teknologi Elektro, Vol. 16, No1, Januari-April 2017 91 Sistem on Mining dengan Metode Pos Tagging dan SVM Untuk Ekstraksi Data Publik pada Layanan JKBM Luh Ria Atmarani 1, I.A. Dwi Giriantari 2, Made Sudarma

Lebih terperinci

BAB 1 PENDAHULUAN. tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai

BAB 1 PENDAHULUAN. tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai 1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Komputer adalah sebuah alat/mesin yang membantu kita untuk menyelesaikan tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai penghibur

Lebih terperinci

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis

Lebih terperinci

: Peringkasan Terpandu Otomatis (Automatic Guided Summarization)

: Peringkasan Terpandu Otomatis (Automatic Guided Summarization) I. Identitas Calon Promotor Nama Lengkap Fakultas/Sekolah Kelompok Keahlian Telp/Fax/E mail : Ir. Dwi Hendratmo Widyantoro, M.Sc., Ph.D. : STEI : Informatika : (022)2502260/dwi@stei.itb.ac.id II. Deskripsi

Lebih terperinci

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

LAPORAN TUGAS AKHIR. Disusun oleh: Franky LAPORAN TUGAS AKHIR Analisis Sentimen Menggunakan Metode Naive Bayes, Maximum Entropy, dan Support Vector Machine pada Dokumen Berbahasa Inggris dan Dokumen Berbahasa Indonesia Hasil Penerjemahan Otomatis

Lebih terperinci

Penggunaan Hidden Markov Model untuk Kompresi Kalimat

Penggunaan Hidden Markov Model untuk Kompresi Kalimat Penggunaan Hidden Markov Model untuk Kompresi Kalimat TESIS Karya tulis sebagai salah satu syarat Untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh YUDI WIBISONO NIM: 23505023 Program

Lebih terperinci

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov A39 Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov Risa Septi Pratiwi dan Daryono Budi Utomo Departemen Matematika, Fakultas Matematka dan Ilmu Pengetahuan Alam, Institut Teknologi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 1.1 Tinjauan studi Penelitian yang sudah ada sebelumnya, yaitu : 1. Nur Afifah (2010), Pembuatan Kamus Elektronik Kalimat Bahasa Indonesia dan Bahasa Jawa untuk Aplikasi Mobile

Lebih terperinci

1. Introduction. tertentu memegang peran penting dalam. Abstract

1. Introduction. tertentu memegang peran penting dalam. Abstract Perbandingan Metode Latent Semantic Analysis, Syntactically Enhanced Latent Semantic Analysis, dan Generalized Latent Semantic Analysis dalam Klasifikasi Dokumen Berbahasa Inggris Gilbert Wonowidjojo Bina

Lebih terperinci

( ) ( ) (3) II-1 ( ) ( )

( ) ( ) (3) II-1 ( ) ( ) BAB II LANDASAN TEORI 2.1 Naïve Bayes Classifier 2.1.1 Teorema Bayes Bayes merupakan teknik prediksi berbasis probabilistik sederhana yang berdasar pada penerapan teorema Bayes (atau aturan Bayes) dengan

Lebih terperinci

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,

Lebih terperinci

Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas Maximum Entropy untuk Bahasa Jawa Krama

Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas Maximum Entropy untuk Bahasa Jawa Krama Pramudita, Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas Maximum Entropy untuk Bahasa Jawa Krama 235 Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas

Lebih terperinci

PREDIKSI PERGERAKAN NILAI TUKAR RUPIAH TERHADAP DOLAR AMERIKA SERIKAT MENGGUNAKAN HIDDEN MARKOV MODEL (HMM)

PREDIKSI PERGERAKAN NILAI TUKAR RUPIAH TERHADAP DOLAR AMERIKA SERIKAT MENGGUNAKAN HIDDEN MARKOV MODEL (HMM) Jurnal LOG!K@, Jilid 6, No 1, 2016, Hal 32-41 ISSN 1978 8568 PREDIKSI PERGERAKAN NILAI TUKAR RUPIAH TERHADAP DOLAR AMERIKA SERIKAT MENGGUNAKAN HIDDEN MARKOV MODEL (HMM) Mahmudi dan Ardi Program Studi Matematika,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika)

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika) PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh ROSA ARIANI SUKAMTO NIM

Lebih terperinci

IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE

IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE Novario Jaya Perdana 1, Diana Purwitasari 2 Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai

BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai BAB II TINJAUAN PUSTAKA Penelitian awal dalam bidang automatic text summarization dimulai dengan pembuatan metode term frequency oleh Luhn pada tahun 1958. Metode ini berasumsi bahwa frekuensi kata di

Lebih terperinci

Truecasing untuk Teks Bahasa Indonesia

Truecasing untuk Teks Bahasa Indonesia Truecasing untuk Teks Bahasa Indonesia Said Al Faraby dan Ade Romadhony Fakultas Informatika Universitas Telkom Indonesia {saidalfaraby,aderomadhony}@telkomuniversity.ac.id Abstrak Penggunaan huruf besar

Lebih terperinci

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov JURNAL SAINS DAN SENI POMITS Vol. 6, No.2, (2017) 2337-3520 (2301-928X Print) A 39 Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov Risa Septi Pratiwi Daryono Budi Utomo Jurusan

Lebih terperinci

TUGAS AKHIR. Disusun oleh : SUSI SETYOWATI

TUGAS AKHIR. Disusun oleh : SUSI SETYOWATI POS TAGGER TWITTER BAHASA INDONESIA MENGGUNAKAN STANFORD NLP TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Disusun

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah

Lebih terperinci

PENENTUAN KELAS KATA PADA PART OF SPEECH TAGGING KATA AMBIGU BAHASA INDONESIA

PENENTUAN KELAS KATA PADA PART OF SPEECH TAGGING KATA AMBIGU BAHASA INDONESIA JISKa (Jurnal Informatika Sunan Kalijaga), Vol. 2, No. 3, Januari, 2018, Pp. 157 166 ISSN 2527-5836 PENENTUAN KELAS KATA PADA PART OF SPEECH TAGGING KATA AMBIGU BAHASA INDONESIA Ahmad Subhan Yazid (1),

Lebih terperinci

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis 1 BAB I PENDAHULUAN 1.1 Latar Belakang Dalam bisnis Leasing, pemilihan keputusan penyetujuan suatu aplikasi merupakan hal mutlak dan bersifat sangat sensitif. Pada Umumnya, memang penyetujuan pengajuan

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN Bab ini berisikan tentang alasan peneliti mengambil permasalahan ini. Pada bab ini poin-poin yang akan dipaparkan antara lain Latar Belakang, Perumusan Masalah, Batasan Masalah, Tujuan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 1 BAB III METODOLOGI PENELITIAN 1.1 Instrumen penelitian Pada instrumen penelitian akan dijelaskan kebutuhan perangkat lunak, kebutuhan perangkat keras, serta kebutuhan bahan penelitian. Yaitu sebagai

Lebih terperinci

Pengenalan Konsep Pembelajaran Mesin dan Deep Learning

Pengenalan Konsep Pembelajaran Mesin dan Deep Learning Jan Wira Gotama Putra Pengenalan Konsep Pembelajaran Mesin dan Deep Learning Edisi 1.0 March 11, 2018 Untuk Tuhan, Bangsa, dan Almamater Kata Pengantar Buku ini ditujukan sebagai bahan penunjuang (atau

Lebih terperinci

BAB I PENDAHULUAN. Perkembangan teknologi informasi memberikan dampak yang cukup besar

BAB I PENDAHULUAN. Perkembangan teknologi informasi memberikan dampak yang cukup besar BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi informasi memberikan dampak yang cukup besar pada disiplin-disiplin ilmu lainnya termasuk biologi molekuler. Sehingga menghasilkan kolaborasi

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA 1 PENDAHULUAN Latar Belakang Mengenali sebuah kata atau kalimat bukanlah hal yang sulit dilakukan bagi manusia Apalagi kata tersebut merupakan Bahasa Utama yang digunakannya sehari-hari Berbagai logat

Lebih terperinci

IMPLEMENTASI HIDDEN MARKOV MODEL PADA PERAMALAN DATA SAHAM

IMPLEMENTASI HIDDEN MARKOV MODEL PADA PERAMALAN DATA SAHAM IMPLEMENTASI HIDDEN MARKOV MODEL PADA PERAMALAN DATA SAHAM M. Zulfikar 1 Alimin Bado 2, Kresna Jaya 2, Md Rafiul Hassan and Baikunth Nath 2 Program Studi Sarjana Statistika Universitas Hasanuddin, fikarz@scientist.com

Lebih terperinci

PENERJEMAHAN DOKUMEN INGGRIS-INDONESIA MENGGUNAKAN MESIN PENERJEMAH STATISTIK DENGAN WORD REORDERING DAN PHRASE REORDERING

PENERJEMAHAN DOKUMEN INGGRIS-INDONESIA MENGGUNAKAN MESIN PENERJEMAH STATISTIK DENGAN WORD REORDERING DAN PHRASE REORDERING PENERJEMAHAN DOKUMEN INGGRIS-INDONESIA MENGGUNAKAN MESIN PENERJEMAH STATISTIK DENGAN WORD REORDERING DAN PHRASE REORDERING Hansel Tanuwijaya Hisar Maruli Manurung Fakultas Ilmu Komputer, Universitas Indonesia,

Lebih terperinci

BAB I PENDAHULUAN. berdasarkan rencana pengaturan urutan kerja. Daftar atau tabel kegiatan atau

BAB I PENDAHULUAN. berdasarkan rencana pengaturan urutan kerja. Daftar atau tabel kegiatan atau BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Kamus Besar Bahasa Indonesia, jadwal adalah pembagian waktu berdasarkan rencana pengaturan urutan kerja. Daftar atau tabel kegiatan atau rencana kegiatan dengan

Lebih terperinci

PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA

PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA Ahmad Rio Adriansyah STT Terpadu Nurul Fikri, arasy@nurulfikri.ac.id, ahmad.rio.adriansyah@gmail.com Abstrak Korpus dalam bahasa Indonesia dibutuhkan

Lebih terperinci

Aplikasi Inferensi Bayes pada Data Mining terutama Pattern Recognition

Aplikasi Inferensi Bayes pada Data Mining terutama Pattern Recognition Aplikasi Inferensi Bayes pada Data Mining terutama Pattern Recognition Trilaksono Aribowo (18209015) Program Studi Sistem dan Teknologi Informasi Sekolah Teknik Elektro dan Informatika Institut Teknologi

Lebih terperinci

BAB I PENDAHULUAN. Hasil studi kasus seorang psikolog perkembangan Deni Nasri,mengemukakan bahwa empat dari lima orang dewasa yang krisis kepribadian

BAB I PENDAHULUAN. Hasil studi kasus seorang psikolog perkembangan Deni Nasri,mengemukakan bahwa empat dari lima orang dewasa yang krisis kepribadian BAB I PENDAHULUAN Pada bab ini berisi tentang latar belakang pembuatan dari sistem klasifikasi tipe pola asuh orang tua pada anak menggunakan k- nearest neighbor (KNN), rumusan masalah, tujuan, batasan

Lebih terperinci

BAB I PENDAHULUAN. pengetahuan dan teknologi. Hal ini tak bisa lepas dari peran berbagai cabang ilmu

BAB I PENDAHULUAN. pengetahuan dan teknologi. Hal ini tak bisa lepas dari peran berbagai cabang ilmu BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Kemajuan peradaban manusia berjalan seiring dengan kemajuan ilmu pengetahuan dan teknologi. Hal ini tak bisa lepas dari peran berbagai cabang ilmu pengetahuan

Lebih terperinci

Seminar Nasional Aplikasi Teknologi Informasi 2012 (SNATI 2012) ISSN: Yogyakarta, Juni 2012

Seminar Nasional Aplikasi Teknologi Informasi 2012 (SNATI 2012) ISSN: Yogyakarta, Juni 2012 IMPLEMENTASI PERINGKASAN KONTEN UTAMA HALAMAN WEB DENGAN ALGORITMA HYBRID HIDDEN MARKOV MODEL EXTRACTION METHOD DALAM PENERAPAN PADA INFORMATION RETRIEVAL Alfian Akbar Gozali 1, Imelda Atastina 2 1,2 Fakultas

Lebih terperinci

DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA. Aswin Juari dan Ayu Purwarianti

DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA. Aswin Juari dan Ayu Purwarianti DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA Aswin Juari dan Ayu Purwarianti Teknik Informatika, Institut Teknologi Bandung, Bandung, Indonesia aswin_tsy@yahoo.com, ayu@stei.itb.ac.id

Lebih terperinci

Indonesian Part-of-Speech Tag

Indonesian Part-of-Speech Tag Indonesian Part-of-Speech Tag Fam Rashel, Andry Luthfi, Arawinda Dinakaramani, and Ruli Manurung Faculty of Computer Science, Universitas Indonesia Email: fam.rashel@ui.ac.id, andry.luthfi@ui.ac.id, ard51@ui.ac.id,

Lebih terperinci

Analisis Sentimen pada Opini Mahasiswa Menggunakan Natural Language Processing

Analisis Sentimen pada Opini Mahasiswa Menggunakan Natural Language Processing Analisis Sentimen pada Opini Mahasiswa Menggunakan Natural Language Processing Aldi Nurzahputra 1, Much Aziz Muslim 2 1,2 Jurusan Ilmu Komputer, FMIPA, Universitas Negeri Semarang Email: 1 aldinurzah96@gmail.com,

Lebih terperinci

BAB V PEMBAHASAN DAN UJI COBA HASIL PENELITIAN

BAB V PEMBAHASAN DAN UJI COBA HASIL PENELITIAN BAB V PEMBAHASAN DAN UJI COBA HASIL PENELITIAN 5.1. Penyempurnaan Berikut adalah penyempurnaan yang sudah dilakukan pada aplikasi untuk memaksimalkan kinerja sistem. 5.1.1. Kamus Sinonim Offline Pada saat

Lebih terperinci

Bab V MetodeFunctional Statistics Algorithm (FSA) dalam Sintesis Populasi

Bab V MetodeFunctional Statistics Algorithm (FSA) dalam Sintesis Populasi 31 Bab V MetodeFunctional Statistics Algorithm (FSA) dalam Sintesis Populasi V.1 Mengenal Metode Functional Statistics Algorithm (FSA) Metode Functional Statistics Algorithm (FSA) adalah sebuah metode

Lebih terperinci

1. BAB I PENDAHULUAN 1.1. Latar Belakang

1. BAB I PENDAHULUAN 1.1. Latar Belakang 1. BAB I PENDAHULUAN 1.1. Latar Belakang Riset di bidang sistem pengenalan ucapan otomatis (Automatic Speech Recognition) merupakan salah satu riset yang banyak ditekuni dan terus dikembangkan hingga saat

Lebih terperinci

IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX

IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.3 Desember 2015 Page 7422 IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX IMPLEMENTATION

Lebih terperinci

BAB 1 PENDAHULUAN. 1 Universitas Kristen Maranatha

BAB 1 PENDAHULUAN. 1 Universitas Kristen Maranatha BAB 1 PENDAHULUAN 1.1 Latar Belakang Kata kunci adalah kata yang mewakili konsep atau garis besar dari suatu dokumen [1]. Kata kunci digunakan sebagai pernyataan informasi penting mengenai isi pembahasan

Lebih terperinci

PENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT

PENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT PENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT Dedy Ahmad Kurniawan 1), Danny Kriestanto 2) Teknik Informatika, STMIK AKAKOM e-mail: dedyahmad.akakom10@gmail.com 1), danny@akakom.ac.id 2) ABSTRAK

Lebih terperinci

SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL

SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.1 April 2015 Page 262 SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL SIMULATION AND ANALYSIS

Lebih terperinci

Gambar 1. Komponen Mesin Translasi Berbasis Statistik

Gambar 1. Komponen Mesin Translasi Berbasis Statistik Dampak Kelas Kata Bahasa Arab Terhadap Hasil Mesin Penerjemah Berbasis Statistik Rahmat Izwan Heroza Sistem Informasi e-mail: rahmatheroza@unsri.ac.id Abstrak Tulisan ini meneliti dampak kata yang dapat

Lebih terperinci

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika)

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika) http://www.gangsir.com PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh ROSA

Lebih terperinci

DAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi.

DAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi. DAFTAR ISI ABSTRAK...i ABSTRACT... ii KATA PENGANTAR... iii DAFTAR ISI... v DAFTAR GAMBAR...vii DAFTAR TABEL... viii DAFTAR ISTILAH... ix BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah...

Lebih terperinci