IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan)
|
|
- Sucianty Cahyadi
- 7 tahun lalu
- Tontonan:
Transkripsi
1 IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan) (Bab Jurafsky & Martin) Ruli Manurung Fakultas Ilmu Komputer Universitas Indonesia 25 Februari 2008
2 Outline Stochastic POS Tagging 1 Stochastic POS Tagging 2 3 4
3 POS ditentukan oleh konteks Ide dasar POS tagging POS tag sebuah kata dapat ditentukan oleh konteks di mana ia muncul. Bisa dalam corpus 1 Gue bisa menyelesaikan persoalan itu kok. 2 Penjinak ular menguras bisa hanya dengan cangkir plastik. 3 Masyarakat dan aparat bisa membersihkan sampah dengan baik. 4 Beliau menyatakan bisa menurunkan harga kedelai tahun ini. Aturan apa yang dapat disimpulkan mengenai bisa? Dalam rule-based tagger, ide ini dinyatakan dalam rule yang dibuat secara manual (mis: jika kata sesudahnya..., maka... ) Pada stochastic POS, konteks (corpus) diamati dan dipelajari secara otomatis.
4 Pemodelan statistik Pada intinya, pilih tag yang memaksimalkan rumus berikut: P(kata tag) P(tag n tag sebelumnya) Sebagai aproksimasi, sebuah bigram tagger memilih tag untuk kata ke-i (t i ) berdasarkan tag sebelumnya (t i 1 ) dan kata ke-i tersebut (w i ) t i = argmax j P(t j ti 1, w i ) Melalui beberapa asumsi Markovian, diperoleh: t i = argmax j P(t j ti 1) P(w i t j ) Perumusan statistik: Berapa kemungkinan tag VB (atau NN) jika tag sebelumnya TO? (tag sequence probability) dikalikan dengan Jika diketahui sebuah kata adalah VB (atau NN), berapa kemungkinan ia adalah race? (lexical likelihood)
5 Sebuah contoh Amati race pada dua kalimat berikut: 1 Secretariat/NNP is/vbz expected/vbn to/to race/vb tomorrow/nn 2 People/NNS continue/vbp to/to inquire/vb the/dt reason/nn for/in the/dt race/nn for/in outer/jj space/nn Bayangkan sudah diketahui POS tag yg benar kecuali untuk race. Konteks yang perlu diamati (secara bigram): 1 to/to race/??? 2 the/dt race/??? Untuk kasus pertama: 1 P(VB TO) P(race VB) = = P(NN TO) P(race NN) = =
6 Menggunakan statistik Definisi Hidden Markov Model (HMM) adalah pemodelan statistik di mana sebuah sistem menghasilkan (emit) urutan simbol yang dapat diamati (observation symbols) berdasarkan sebuah proses probabilistik yang parameternya tidak diketahui (hidden parameters). Proses probabilistik dinyatakan sebuah FSA: x 1, x 2,... adalah state yang menyatakan proses. a ij adalah state transition probabilities: berapa kemungkinan proses berpindah dari state i ke j? y 1, y 2,... adalah observation symbols. b ij adalah output/emission probability: berapa kemungkinan proses di state i menghasilkan symbol j?
7 Contoh gambar HMM
8 Menggunakan statistik HMM sering digunakan untuk memodelkan data sequential/temporal, di mana proses berjalan seiring waktu t, dengan asumsi berikut: Nilai hidden state x(t) sepenuhnya ditentukan oleh hidden state sebelumnya, x(t 1). Nilai observed symbol y(t) sepenuhnya ditentukan oleh hidden state pada saat itu, x(t). Menghitung probabilitas sebuah observation sequence Probabilitas Y = y 0, y 1, y 2,..., y L 1 dengan panjang L adalah P(Y ) = P X P(Y X)P(X). Jadi, kita menjumlahkan semua kemungkinan X = x 0, x 1, x 2,..., x L 1. Penghitungan brute-force dalam prakteknya bersifat intractable. Namun, ada algoritma forward dan Viterbi...
9 HMM Tagger Stochastic POS Tagging Contoh race: memilih tag terbaik untuk kata yang diamati. Sebuah HMM tagger memilih tag sequence terbaik untuk word sequence yang diamati. Word sequence yang diamati: W = w 1, w 2,..., w n Tag sequence yang terbaik/ benar : T = t 1, t 2,..., t n ˆT = argmax T τ P(T W ) Dengan Bayes Law: ˆT = argmax T τ P(T )P(W T ) Dengan chain rule: Q ˆT = argmax n T τ i=1 P(w i w 1 t 1... w i 1 t i 1 t i )P(t i t 1,... t i 1 )
10 Transformation-Based Tagging Eric Brill merumuskan teori transformation-based learning. Ide dasar: tangani dulu secara bodoh, perbaiki masalah yang timbul. Ulangi sampai beres. Contoh: P(NN race) = 0.98 P(VB race) = 0.02 Kesimpulan: tag semua race sebagai NN! Berdasarkan training data, pelajari rule, mis: Change NN to VB when the previous tag is TO.
11 Cara kerja TBL Tagger Cara kerja: 1 Lakukan proses tagging berdasarkan kamus 2 Cobalah semua kemungkinan transformasi (rule). Pilih yang paling banyak mengurangi error. Aplikasikanlah. 3 Ulangi langkah di atas sampai cukup. Tentunya ada banyak sekali kemungkinan transformasi, jadi dibatasi dengan template: Kata sebelum/sesudah adalah Z. Kata kedua sebelum/sesudah adalah Z. Salah satu dari kedua kata sebelum/sesudah adalah Z. dst.
12 Mengevaluasi hasil POS Tagger Biasanya dibandingkan dengan gold standard: data yang sudah di-tag secara manual oleh manusia. Yang dihitung adalah persentase tag yang dihasilkan benar sesuai dengan gold standard. Rata-rata POS tagger sekarang memiliki akurasi 96-97% (untuk tagset Penn Treebank sederhana ) Ini bagus atau jelek?
13 Mengevaluasi hasil POS Tagger Biasanya dibandingkan dengan gold standard: data yang sudah di-tag secara manual oleh manusia. Yang dihitung adalah persentase tag yang dihasilkan benar sesuai dengan gold standard. Rata-rata POS tagger sekarang memiliki akurasi 96-97% (untuk tagset Penn Treebank sederhana ) Ini bagus atau jelek? Human ceiling (upper-bound) Marcus et al. (1993) menemukan bahwa manusia memiliki kesepakatan 96-97% ketika Brown Corpus di-tag dengan tagset Penn Treebank. Artinya, sebuah gold standard dapat memiliki error 3-4%.
14 Mengevaluasi hasil POS Tagger Biasanya dibandingkan dengan gold standard: data yang sudah di-tag secara manual oleh manusia. Yang dihitung adalah persentase tag yang dihasilkan benar sesuai dengan gold standard. Rata-rata POS tagger sekarang memiliki akurasi 96-97% (untuk tagset Penn Treebank sederhana ) Ini bagus atau jelek? Human ceiling (upper-bound) Marcus et al. (1993) menemukan bahwa manusia memiliki kesepakatan 96-97% ketika Brown Corpus di-tag dengan tagset Penn Treebank. Artinya, sebuah gold standard dapat memiliki error 3-4%. Unigram baseline (lower-bound) Charniak et al. (1993) menunjukkan bahwa sebuah baseline algorithm, yang hanya menggunakan frekuensi unigram, mencapai akurasi 90-91%!
15 Multiple tags, Multiple words Multiple tags Kadang-kadang, sebuah POS tagger benar-benar kesulitan menentukan tag sebuah kata. Daripada memaksa untuk memilih, ia akan memberikan alternatif, mis: (JJ/VBD/VBN), (JJ/NN), dst. Multiple words Beberapa tagset, mis. C5 dan C7, menganggap frasa sebagai sebuah kata, mis: in terms of dianggap sebagai sebuah preposition (II3) dan diberi label in/ii31 terms/ii32 of/ii33 Beberapa corpus memecah stem + morfem-nya, mis: would/md n t/rb dan children/nns s/pos
16 Ringkasan Stochastic POS Tagging POS tag (yang ambigu) bisa ditentukan dengan bantuan konteks. Stochastic POS tagger memaksimalkan probabilitas P(kata tag) P(tag n tag sebelumnya) (nilai dihitung dari corpus). Hidden Markov Model adalah model statistik yang bisa mengestimasi hidden parameter dari pengamatan observable sequence yang dihasilkan. Tagger berdasarkan transformation based learning menggabungkan pendekatan rule-based dan stochastic. tagger dilakukan terhadap gold standard dan unigram baseline.
Tutorial: Pengenalan terhadap POS tagging dan Probabilistic Parsing
1/53 Tutorial: Pengenalan terhadap POS tagging dan Probabilistic Ruli Manurung Fakultas Ilmu Komputer Universitas Indonesia maruli@cs.ui.ac.id Workshop Nasional INACL Kamis, 7 Januari 2016 2/53 Outline
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Memasuki era big data, pertumbuhan data berbentuk dokumen teks semakin tinggi. Sehingga diperlukan text processing untuk pengolahan data yang sangat besar. Dokumen
Lebih terperinciSKRIPSI. Triastuti Chandrawati
Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning SKRIPSI Triastuti Chandrawati 1204000866 UNIVERSITAS INDONESIA FAKULTAS
Lebih terperinci1. PENDAHULUAN 1.1 Latar belakang Masalah
1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.
Lebih terperinciBAB III HIDDEN MARKOV MODELS. Rantai Markov bermanfaat untuk menghitung probabilitas urutan keadaan
BAB III HIDDEN MARKOV MODELS Rantai Markov bermanfaat untuk menghitung probabilitas urutan keadaan yang dapat diamati. Tetapi terkadang ada urutan dari suatu keadaan yang ingin diketahui tetapi tidak dapat
Lebih terperinciPENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL
Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2013 PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL I Wayan Hendra Maha Putra¹, Imelda Atastina², Alfian Akbar Gozali³ ¹Teknik
Lebih terperinciUKDW BAB 1 PENDAHULUAN Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Dengan perkembangan teknologi yang semakin pesat, setiap orang dituntut untuk bisa memanfaatkan dengan baik perkembangan teknologi dan dapat menggunakan di dalam kehidupan
Lebih terperinciBAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI
BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat
Lebih terperinciHidden Markov Model. 7.1 Probabilistic Reasoning
7 Hidden Markov Model Probability is expectation founded upon partial knowledge. A perfect acquaintance with all the circumstances affecting the occurrence of an event would change expectation into certainty,
Lebih terperinciBAB I PENDAHULUAN. Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam kehidupan sehari-hari, sering dijumpai peristiwa-peristiwa yang terjadi secara beruntun dan dengan kemungkinan yang berbeda-beda. Sebagai contoh sekarang
Lebih terperinciPART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM.
PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM. 1208605026 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN ILMU KOMPUTER
Lebih terperinciBAB III. Hidden Markov Models (HMM) Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata,
BAB III Hidden Markov Models (HMM) 3.1 Pendahuluan Rantai Markov mempunyai state yang dapat diobservasi secara langsung. Namun pada beberapa situasi tertentu yang ditemukan di kehidupan nyata, beberapa
Lebih terperinciPENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S
PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA Oleh: M Karibun H S G64101053 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciPart-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi
IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN: 1978-1520 1 Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi Nitin Sabloak 1, Bebeto Agung Hardono 2, Derry Alamsyah 3 1,2 STMIK GI
Lebih terperinciPART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL
PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL Eka Rahayu Setyaningsih Teknik Informatika, Sekolah Tinggi Teknik Surabaya (1) e-mail: eka@stts.edu ABSTRAK Dalam penelitian
Lebih terperinciIMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING
IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING Imam Fahrur Rozi 3 Permasalahan yang pertama dihadapi dalam mengembangkan sistem opinion mining adalah menentukan apakah suatu teks
Lebih terperinciPenggunaan Hidden Markov Model untuk Kompresi Kalimat
Penggunaan Hidden Markov Model untuk Kompresi Kalimat TESIS Karya tulis sebagai salah satu syarat Untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh YUDI WIBISONO NIM: 23505023 Program
Lebih terperinciBAB I PENDAHULUAN. Perkembangan ilmu pengetahuan dan teknologi yang sangat pesat,
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan dan teknologi yang sangat pesat, menjadikan statistika memegang peranan penting dalam kehidupan. Hampir semua fenomena yang terjadi
Lebih terperinciImplementasi Opinion Mining (Analisis Sentimen) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi
37 Implementasi Opinion Mining (Analisis Sentimen) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi Imam Fahrur Rozi, Sholeh Hadi Pramono dan Erfan Achmad Dahlan Abstrak Sentiment analysis atau
Lebih terperinciPengenalan Entitas Bernama untuk Identifikasi Transaksi Akuntansi Menggunakan Hidden Markov Model
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 7, Juli 2018, hlm. 2851-2858 http://j-ptiik.ub.ac.id Pengenalan Entitas Bernama untuk Identifikasi Transaksi Akuntansi
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
1 BAB 1 PENDAHULUAN Bab ini berisi tentang latar belakang (subbab 1.1), tujuan penelitian (subbab 1.2), perumusan dan pembatasan masalah (subbab 1.3), metodologi penelitian (subbab 1.4), serta penjelasan
Lebih terperinciImplementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara
Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara Bima Laksmana Pramudita (13511042) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,
Lebih terperinciTeori Dasar Hidden Markov Model
Teori Dasar Hidden Markov Model Muhammad Eko Budi Prasetyo 18209020 1 Program Studi Sistem dan teknologi Informasi Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung
Lebih terperinciTINJAUAN PUSTAKA. II.1 Model-model Pola Tata Bahasa
BAB II TINJAUAN PUSTAKA Bab ini membahas hal-hal apa saja yang pernah dilakukan sebelumnya mengenai model-model pola tata bahasa, pengurai (parser) untuk bahasa lain, dan pembangkitan pola tata bahasa
Lebih terperinciBAB I PENDAHULUAN. I.1 Latar Belakang
BAB I PENDAHULUAN I.1 Latar Belakang Pola tata bahasa memiliki manfaat dalam pemrosesan bahasa alami. Pemrosesan bahasa alami berawal dari keinginan manusia untuk berkomunikasi dengan komputer menggunakan
Lebih terperinciPENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA
BAB III PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA Pada Bab III ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses awal (preprocessing) membentuk file masukan untuk pengurai
Lebih terperinciBAB 1 PENDAHULUAN Latar Belakang
BAB 1 PENDAHULUAN Bab ini akan menjelaskan latar belakang dari penelitian yang memberikan gambaran awal mengenai analisis sentimen dan perannya dalam perkembangan teknologi informasi. Tujuan dan ruang
Lebih terperinciMETODE MARKOV DAN PENERAPANNYA Markov Model and Its Applications. Noor Cholis Basjaruddin POLBAN
METODE MARKOV DAN PENERAPANNYA Markov Model and Its Applications Noor Cholis Basjaruddin Politeknik Negeri Bandung 2016 Daftar Isi 1 Abstrak... 3 2 Abstract... 3 3 Pendahuluan... 3 4 Model Markov... 4
Lebih terperinciPENGENALAN FORMULA MATEMATIKA DARI POLA TULISAN TANGAN
PENGENALAN FORMULA MATEMATIKA DARI POLA TULISAN TANGAN Yuliana Melita Pranoto, Edwin Pramana, dan Renato Budiman Teknik Informatika Sekolah Tinggi Teknik Surabaya ymp@stts.edu, epramana@gmail.com, dan
Lebih terperinciDeteksi Fraud Menggunakan Metode Model Markov Tersembunyi pada Proses Bisnis
JURNAL TEKNIK ITS Vol. 6, No. 1, (2017) ISSN: 2337-3539 (2301-9271 Print) A-24 Deteksi Fraud Menggunakan Metode Model Markov Tersembunyi pada Proses Bisnis Andrean Hutama Koosasi, Riyanarto Sarno, dan
Lebih terperinciBAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari
BAB I PENDAHULUAN 1.1 Latar Belakang Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari internet ataupun milik pribadi juga semakin berkembang. Permasalahan utama adalah bagaimana memperoleh
Lebih terperinciPART-OF-SPEECH TAGGING UNTUK BAHASA INDONESIA MENGGUNAKAN STANFORD POS-TAGGING
PART-OF-SPEECH TAGGING UNTUK BAHASA INDONESIA MENGGUNAKAN STANFORD POS-TAGGING 1) Viny Christanti M., M.Kom, 2) Ir. Jeanny Pragantha, M.Eng dan 3) Victor 1,2,3) Teknik Informatika, Fakultas Teknologi Informasi,
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Empiris Pada penelitian ini, ada beberapa penelitian terkait yang peneliti gunakan sebagai tinjauan studi. Berikut merupakan penelitian penelitian terkait yang pernah
Lebih terperinciKAJIAN MODEL HIDDEN MARKOV KONTINU DENGAN PROSES OBSERVASI ZERO DELAY DAN APLIKASINYA PADA HARGA GABAH KERING PANEN T A M U R I H
KAJIAN MODEL HIDDEN MARKOV KONTINU DENGAN PROSES OBSERVASI ZERO DELAY DAN APLIKASINYA PADA HARGA GABAH KERING PANEN T A M U R I H SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009 PERNYATAAN MENGENAI
Lebih terperinciPENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S
PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA Oleh: M Karibun H S G64101053 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.
Lebih terperinciSKRIPSI. Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik Informatika. Disusun Oleh :
SKRIPSI PENERAPAN ANALISIS MORFOLOGI UNTUK PENANGANAN KATA BERIMBUHAN PADA POS TAGGER BAHASA INDONESIA BERBASIS STATISTIK IMPLEMENTING MORPHOLOGICAL ANALYZER FOR AFFIXES HANDLING IN STATISTIC BASED INDONESIAN
Lebih terperinciPendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia
Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia Abd Wahab Syahroni 1), Joan Santoso 2), Endang Setyati
Lebih terperinciPenerapan Named Entity Recognition Untuk Mengenali Fitur Produk Pada E-Commerce Menggunakan Rule Template Dan Hidden Markov Model
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 10, Oktober 2018, hlm. 3912-3920 http://j-ptiik.ub.ac.id Penerapan Named Entity Recognition Untuk Mengenali Fitur
Lebih terperinciAlgoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition
Algoritma Viterbi dalam Metode Hidden Markov Models pada Teknologi Speech Recognition Abstrak Angela Irfani 1, Ratih Amelia 2, Dyah Saptanti P 3 Laboratorium Ilmu dan Rekayasa Komputasi Departemen Teknik
Lebih terperinciKEMUNGKINAN (LIKELIHOOD) MODEL FILOGENETIK MELALUI MODEL MARKOV TERSEMBUNYI Studi kasus: Hylobates, Pongo, Gorilla, Homo sapiens, dan Pan TESIS
KEMUNGKINAN (LIKELIHOOD) MODEL FILOGENETIK MELALUI MODEL MARKOV TERSEMBUNYI Studi kasus: Hylobates, Pongo, Gorilla, Homo sapiens, dan Pan TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar
Lebih terperinciPREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha
PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL Adhitya Teguh Nugraha Program Studi Teknik Informatika Jurusan Teknik Elektro Fakultas Teknik Universitas Tanjungpura ituteguh@gmail.com
Lebih terperinciPenerapan Hidden Markov Model Pada Harga Saham
Penerapan Hidden Markov Model Pada Harga Saham Sri Wahyuni Mamonto 1, Yohanes A. R. Langi 2, Altien J. Rindengan 3 1 Program Studi Matematika, FMIPA, UNSRAT Manado, mamontosri@gmail.com 2 Program Studi
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang teori-teori dan konsep dasar yang mendukung pembahasan dari sistem yang akan dibuat. 2.1 Anak Berkebutuhan Khusus (ABK) Menurut Alimin (2012) Anak
Lebih terperinciHidden Markov Model (HMM) dan Pengenalan Pola. Toto Haryanto
Hidden Markov Model (HMM) dan Pengenalan Pola Toto Haryanto Hidden Markov Model Model Probabilistik Cocok Digunakan pada data yang bersifat temporal sekuenseial, contoh : Sinyal (Sinyal Suara, sinyal digital)
Lebih terperinciHidden Markov Model (HMM) dan Pengenalan Pola
Hidden Markov Model (HMM) dan Pengenalan Pola Toto Haryanto Hidden Markov Model Model Probabilistik Cocok Digunakan pada data yang bersifat temporal sekuenseial, contoh : Sinyal (Sinyal Suara, sinyal digital)
Lebih terperinciEKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA
EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah
Lebih terperinciPENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA
BAB IV PENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA Pada Bab IV ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses penentuan jenis kata (part of speech tagging)
Lebih terperinciBAB I PENDAHULUAN. digunakan oleh masyarakat pada umumnya. Dahulu keramik hanya dimanfaatkan
BAB I PENDAHULUAN 1.1 Latar Belakang Keramik sudah dikenal di Indonesia sejak jaman Neolithikum. Keramik adalah salah satu dari peninggalan tersebut yang sampai saat ini masih banyak digunakan oleh masyarakat
Lebih terperinciPEMODELAN MARKOV SWITCHING AUTOREGRESSIVE
PEMODELAN MARKOV SWITCHING AUTOREGRESSIVE asa M arga ro) C ng Semara SKRIPSI Oleh : FIQRIA DEVI ARIYANI 24010210120021 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO 2014 PEMODELAN
Lebih terperinciSistem Opinion Mining dengan Metode Pos Tagging dan SVM Untuk Ekstraksi Data Opini Publik pada Layanan JKBM
Teknologi Elektro, Vol. 16, No1, Januari-April 2017 91 Sistem on Mining dengan Metode Pos Tagging dan SVM Untuk Ekstraksi Data Publik pada Layanan JKBM Luh Ria Atmarani 1, I.A. Dwi Giriantari 2, Made Sudarma
Lebih terperinciBAB 1 PENDAHULUAN. tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai
1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Komputer adalah sebuah alat/mesin yang membantu kita untuk menyelesaikan tugas kita, mempermudah kita mencari informasi. Komputer juga bisa bergerak sebagai penghibur
Lebih terperinciTeam project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP
Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis
Lebih terperinci: Peringkasan Terpandu Otomatis (Automatic Guided Summarization)
I. Identitas Calon Promotor Nama Lengkap Fakultas/Sekolah Kelompok Keahlian Telp/Fax/E mail : Ir. Dwi Hendratmo Widyantoro, M.Sc., Ph.D. : STEI : Informatika : (022)2502260/dwi@stei.itb.ac.id II. Deskripsi
Lebih terperinciLAPORAN TUGAS AKHIR. Disusun oleh: Franky
LAPORAN TUGAS AKHIR Analisis Sentimen Menggunakan Metode Naive Bayes, Maximum Entropy, dan Support Vector Machine pada Dokumen Berbahasa Inggris dan Dokumen Berbahasa Indonesia Hasil Penerjemahan Otomatis
Lebih terperinciPenggunaan Hidden Markov Model untuk Kompresi Kalimat
Penggunaan Hidden Markov Model untuk Kompresi Kalimat TESIS Karya tulis sebagai salah satu syarat Untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh YUDI WIBISONO NIM: 23505023 Program
Lebih terperinciPrediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov
A39 Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov Risa Septi Pratiwi dan Daryono Budi Utomo Departemen Matematika, Fakultas Matematka dan Ilmu Pengetahuan Alam, Institut Teknologi
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 1.1 Tinjauan studi Penelitian yang sudah ada sebelumnya, yaitu : 1. Nur Afifah (2010), Pembuatan Kamus Elektronik Kalimat Bahasa Indonesia dan Bahasa Jawa untuk Aplikasi Mobile
Lebih terperinci1. Introduction. tertentu memegang peran penting dalam. Abstract
Perbandingan Metode Latent Semantic Analysis, Syntactically Enhanced Latent Semantic Analysis, dan Generalized Latent Semantic Analysis dalam Klasifikasi Dokumen Berbahasa Inggris Gilbert Wonowidjojo Bina
Lebih terperinci( ) ( ) (3) II-1 ( ) ( )
BAB II LANDASAN TEORI 2.1 Naïve Bayes Classifier 2.1.1 Teorema Bayes Bayes merupakan teknik prediksi berbasis probabilistik sederhana yang berdasar pada penerapan teorema Bayes (atau aturan Bayes) dengan
Lebih terperinciAPLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL
APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,
Lebih terperinciPengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas Maximum Entropy untuk Bahasa Jawa Krama
Pramudita, Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas Maximum Entropy untuk Bahasa Jawa Krama 235 Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas
Lebih terperinciPREDIKSI PERGERAKAN NILAI TUKAR RUPIAH TERHADAP DOLAR AMERIKA SERIKAT MENGGUNAKAN HIDDEN MARKOV MODEL (HMM)
Jurnal LOG!K@, Jilid 6, No 1, 2016, Hal 32-41 ISSN 1978 8568 PREDIKSI PERGERAKAN NILAI TUKAR RUPIAH TERHADAP DOLAR AMERIKA SERIKAT MENGGUNAKAN HIDDEN MARKOV MODEL (HMM) Mahmudi dan Ardi Program Studi Matematika,
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
Lebih terperinciPENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika)
PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh ROSA ARIANI SUKAMTO NIM
Lebih terperinciIMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE
IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE Novario Jaya Perdana 1, Diana Purwitasari 2 Teknik Informatika, Fakultas Teknologi Informasi, Institut
Lebih terperinciBAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai
BAB II TINJAUAN PUSTAKA Penelitian awal dalam bidang automatic text summarization dimulai dengan pembuatan metode term frequency oleh Luhn pada tahun 1958. Metode ini berasumsi bahwa frekuensi kata di
Lebih terperinciTruecasing untuk Teks Bahasa Indonesia
Truecasing untuk Teks Bahasa Indonesia Said Al Faraby dan Ade Romadhony Fakultas Informatika Universitas Telkom Indonesia {saidalfaraby,aderomadhony}@telkomuniversity.ac.id Abstrak Penggunaan huruf besar
Lebih terperinciPrediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov
JURNAL SAINS DAN SENI POMITS Vol. 6, No.2, (2017) 2337-3520 (2301-928X Print) A 39 Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov Risa Septi Pratiwi Daryono Budi Utomo Jurusan
Lebih terperinciTUGAS AKHIR. Disusun oleh : SUSI SETYOWATI
POS TAGGER TWITTER BAHASA INDONESIA MENGGUNAKAN STANFORD NLP TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Disusun
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah
Lebih terperinciPENENTUAN KELAS KATA PADA PART OF SPEECH TAGGING KATA AMBIGU BAHASA INDONESIA
JISKa (Jurnal Informatika Sunan Kalijaga), Vol. 2, No. 3, Januari, 2018, Pp. 157 166 ISSN 2527-5836 PENENTUAN KELAS KATA PADA PART OF SPEECH TAGGING KATA AMBIGU BAHASA INDONESIA Ahmad Subhan Yazid (1),
Lebih terperinciBAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis
1 BAB I PENDAHULUAN 1.1 Latar Belakang Dalam bisnis Leasing, pemilihan keputusan penyetujuan suatu aplikasi merupakan hal mutlak dan bersifat sangat sensitif. Pada Umumnya, memang penyetujuan pengajuan
Lebih terperinciNur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK
Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN Bab ini berisikan tentang alasan peneliti mengambil permasalahan ini. Pada bab ini poin-poin yang akan dipaparkan antara lain Latar Belakang, Perumusan Masalah, Batasan Masalah, Tujuan
Lebih terperinciBAB III METODOLOGI PENELITIAN
1 BAB III METODOLOGI PENELITIAN 1.1 Instrumen penelitian Pada instrumen penelitian akan dijelaskan kebutuhan perangkat lunak, kebutuhan perangkat keras, serta kebutuhan bahan penelitian. Yaitu sebagai
Lebih terperinciPengenalan Konsep Pembelajaran Mesin dan Deep Learning
Jan Wira Gotama Putra Pengenalan Konsep Pembelajaran Mesin dan Deep Learning Edisi 1.0 March 11, 2018 Untuk Tuhan, Bangsa, dan Almamater Kata Pengantar Buku ini ditujukan sebagai bahan penunjuang (atau
Lebih terperinciBAB I PENDAHULUAN. Perkembangan teknologi informasi memberikan dampak yang cukup besar
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi informasi memberikan dampak yang cukup besar pada disiplin-disiplin ilmu lainnya termasuk biologi molekuler. Sehingga menghasilkan kolaborasi
Lebih terperinciPENDAHULUAN TINJAUAN PUSTAKA
1 PENDAHULUAN Latar Belakang Mengenali sebuah kata atau kalimat bukanlah hal yang sulit dilakukan bagi manusia Apalagi kata tersebut merupakan Bahasa Utama yang digunakannya sehari-hari Berbagai logat
Lebih terperinciIMPLEMENTASI HIDDEN MARKOV MODEL PADA PERAMALAN DATA SAHAM
IMPLEMENTASI HIDDEN MARKOV MODEL PADA PERAMALAN DATA SAHAM M. Zulfikar 1 Alimin Bado 2, Kresna Jaya 2, Md Rafiul Hassan and Baikunth Nath 2 Program Studi Sarjana Statistika Universitas Hasanuddin, fikarz@scientist.com
Lebih terperinciPENERJEMAHAN DOKUMEN INGGRIS-INDONESIA MENGGUNAKAN MESIN PENERJEMAH STATISTIK DENGAN WORD REORDERING DAN PHRASE REORDERING
PENERJEMAHAN DOKUMEN INGGRIS-INDONESIA MENGGUNAKAN MESIN PENERJEMAH STATISTIK DENGAN WORD REORDERING DAN PHRASE REORDERING Hansel Tanuwijaya Hisar Maruli Manurung Fakultas Ilmu Komputer, Universitas Indonesia,
Lebih terperinciBAB I PENDAHULUAN. berdasarkan rencana pengaturan urutan kerja. Daftar atau tabel kegiatan atau
BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Kamus Besar Bahasa Indonesia, jadwal adalah pembagian waktu berdasarkan rencana pengaturan urutan kerja. Daftar atau tabel kegiatan atau rencana kegiatan dengan
Lebih terperinciPENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA
PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA Ahmad Rio Adriansyah STT Terpadu Nurul Fikri, arasy@nurulfikri.ac.id, ahmad.rio.adriansyah@gmail.com Abstrak Korpus dalam bahasa Indonesia dibutuhkan
Lebih terperinciAplikasi Inferensi Bayes pada Data Mining terutama Pattern Recognition
Aplikasi Inferensi Bayes pada Data Mining terutama Pattern Recognition Trilaksono Aribowo (18209015) Program Studi Sistem dan Teknologi Informasi Sekolah Teknik Elektro dan Informatika Institut Teknologi
Lebih terperinciBAB I PENDAHULUAN. Hasil studi kasus seorang psikolog perkembangan Deni Nasri,mengemukakan bahwa empat dari lima orang dewasa yang krisis kepribadian
BAB I PENDAHULUAN Pada bab ini berisi tentang latar belakang pembuatan dari sistem klasifikasi tipe pola asuh orang tua pada anak menggunakan k- nearest neighbor (KNN), rumusan masalah, tujuan, batasan
Lebih terperinciBAB I PENDAHULUAN. pengetahuan dan teknologi. Hal ini tak bisa lepas dari peran berbagai cabang ilmu
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Kemajuan peradaban manusia berjalan seiring dengan kemajuan ilmu pengetahuan dan teknologi. Hal ini tak bisa lepas dari peran berbagai cabang ilmu pengetahuan
Lebih terperinciSeminar Nasional Aplikasi Teknologi Informasi 2012 (SNATI 2012) ISSN: Yogyakarta, Juni 2012
IMPLEMENTASI PERINGKASAN KONTEN UTAMA HALAMAN WEB DENGAN ALGORITMA HYBRID HIDDEN MARKOV MODEL EXTRACTION METHOD DALAM PENERAPAN PADA INFORMATION RETRIEVAL Alfian Akbar Gozali 1, Imelda Atastina 2 1,2 Fakultas
Lebih terperinciDETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA. Aswin Juari dan Ayu Purwarianti
DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA Aswin Juari dan Ayu Purwarianti Teknik Informatika, Institut Teknologi Bandung, Bandung, Indonesia aswin_tsy@yahoo.com, ayu@stei.itb.ac.id
Lebih terperinciIndonesian Part-of-Speech Tag
Indonesian Part-of-Speech Tag Fam Rashel, Andry Luthfi, Arawinda Dinakaramani, and Ruli Manurung Faculty of Computer Science, Universitas Indonesia Email: fam.rashel@ui.ac.id, andry.luthfi@ui.ac.id, ard51@ui.ac.id,
Lebih terperinciAnalisis Sentimen pada Opini Mahasiswa Menggunakan Natural Language Processing
Analisis Sentimen pada Opini Mahasiswa Menggunakan Natural Language Processing Aldi Nurzahputra 1, Much Aziz Muslim 2 1,2 Jurusan Ilmu Komputer, FMIPA, Universitas Negeri Semarang Email: 1 aldinurzah96@gmail.com,
Lebih terperinciBAB V PEMBAHASAN DAN UJI COBA HASIL PENELITIAN
BAB V PEMBAHASAN DAN UJI COBA HASIL PENELITIAN 5.1. Penyempurnaan Berikut adalah penyempurnaan yang sudah dilakukan pada aplikasi untuk memaksimalkan kinerja sistem. 5.1.1. Kamus Sinonim Offline Pada saat
Lebih terperinciBab V MetodeFunctional Statistics Algorithm (FSA) dalam Sintesis Populasi
31 Bab V MetodeFunctional Statistics Algorithm (FSA) dalam Sintesis Populasi V.1 Mengenal Metode Functional Statistics Algorithm (FSA) Metode Functional Statistics Algorithm (FSA) adalah sebuah metode
Lebih terperinci1. BAB I PENDAHULUAN 1.1. Latar Belakang
1. BAB I PENDAHULUAN 1.1. Latar Belakang Riset di bidang sistem pengenalan ucapan otomatis (Automatic Speech Recognition) merupakan salah satu riset yang banyak ditekuni dan terus dikembangkan hingga saat
Lebih terperinciIMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.3 Desember 2015 Page 7422 IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX IMPLEMENTATION
Lebih terperinciBAB 1 PENDAHULUAN. 1 Universitas Kristen Maranatha
BAB 1 PENDAHULUAN 1.1 Latar Belakang Kata kunci adalah kata yang mewakili konsep atau garis besar dari suatu dokumen [1]. Kata kunci digunakan sebagai pernyataan informasi penting mengenai isi pembahasan
Lebih terperinciPENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT
PENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT Dedy Ahmad Kurniawan 1), Danny Kriestanto 2) Teknik Informatika, STMIK AKAKOM e-mail: dedyahmad.akakom10@gmail.com 1), danny@akakom.ac.id 2) ABSTRAK
Lebih terperinciSIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.1 April 2015 Page 262 SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL SIMULATION AND ANALYSIS
Lebih terperinciGambar 1. Komponen Mesin Translasi Berbasis Statistik
Dampak Kelas Kata Bahasa Arab Terhadap Hasil Mesin Penerjemah Berbasis Statistik Rahmat Izwan Heroza Sistem Informasi e-mail: rahmatheroza@unsri.ac.id Abstrak Tulisan ini meneliti dampak kata yang dapat
Lebih terperinciPENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika)
http://www.gangsir.com PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh ROSA
Lebih terperinciDAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi.
DAFTAR ISI ABSTRAK...i ABSTRACT... ii KATA PENGANTAR... iii DAFTAR ISI... v DAFTAR GAMBAR...vii DAFTAR TABEL... viii DAFTAR ISTILAH... ix BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah...
Lebih terperinci