Penggunaan Hidden Markov Model untuk Kompresi Kalimat

dokumen-dokumen yang mirip
Penggunaan Hidden Markov Model untuk Kompresi Kalimat

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika)

PENCARIAN MELODI PADA FILE MIDI

Bab IV Eksperimen. Bab ini membahas tujuan eksperimen, skenario eksperimen dan hasil eksperimen kompresi kalimat dengan HMM.

ANALISIS PEMANFAATAN SEQUENTIAL PATTERN UNTUK MENENTUKAN NODE ORDERING PADA ALGORITMA KONSTRUKSI STRUKTUR BAYESIAN NETWORK

PEMBANGUNAN SISTEM CONTENT-BASED IMAGE RETRIEVAL MENGGUNAKAN KODE FRAKTAL DARI DOKUMEN CITRA TESIS ARIF RAHMAN NIM :

ABSTRAK PENGEMBANGAN SUFFIX TREE CLUSTERING UNTUK COMPARATIVE TEXT MINING. Oleh KUSMAYA NIM :

MODEL PENJADWALAN BATCH PADA JOB SHOP DENGAN KELOMPOK MESIN HETEROGEN UNTUK MEMINIMASI TOTAL WAKTU TINGGAL AKTUAL

OPTIMASI PASOKAN GAS BUMI MENGGUNAKAN ANALISIS INPUT-OUTPUT TESIS. JATI ARIE WIBOWO NIM : Program Studi Teknik Perminyakan

TESIS PEMBANGUNAN PERANGKAT LUNAK PERINGKAS DOKUMEN DARI BANYAK SUMBER BERBASIS WEB MENGGUNAKAN SENTENCE SCORING DENGAN METODE TF-IDF

PENGUBAHAN SINGKATAN PADA PESAN SINGKAT TELEPON SELULER DENGAN MEMANFAATKAN POHON KEPUTUSAN C4.5

KAJIAN KARAKTER FASADE BANGUNAN-BANGUNAN RUMAH TINGGAL KOLONIAL DI KAWASAN PERUMAHAN TJITAROEM PLEIN BANDUNG TESIS

Penerapan Teknik Support Vector Machine untuk Pendeteksian Intrusi pada Jaringan

PENYUSUNAN METODOLOGI PELAKSANAAN TATA KELOLA TEKNOLOGI INFORMASI UNTUK PEMERINTAHAN TESIS

PELABELAN TOTAL TAK TERATUR TITIK PADA GRAF AMALGAMASI SIKLUS

PERANCANGAN APLIKASI PERINGKAS KALIMAT DENGAN MENGGUNAKAN METODE NOISY CHANNEL MODEL

PEMILIHAN LOKASI GUDANG PT. HPI DENGAN MENGGUNAKAN METODE CENTER OF GRAVITY DAN TRANSPORTASI TESIS K A R N A

PENGEMBANGAN METODE PENGELOLAAN AIRTANAH DENGAN TEORI PERMAINAN (Studi Kasus Cekungan Air Tanah Salatiga) TESIS

PERANGKAT LUNAK PENDUKUNG ESTIMASI BIAYA PRODUKSI DENGAN METODE K-MEANS DAN MULTIPLE LINEAR REGRESSION PADA SISTEM PRODUKSI JOB ORDER TESIS

ABSTRAK MOBILE LEARNING MANAGEMENT SYSTEM UNTUK TELEPON SELULER. Oleh SUPRIH WIDODO NIM:

Penerapan Support Vector Machine untuk Ekstraksi Informasi dari Dokumen Teks

PERINGKASAN TEKS BAHASA INDONESIA SECARA OTOMATIS MENGGUNAKAN METODE SENTENCE SCORING DAN DECISION TREE

MODEL STRATEGI LAYANAN GARANSI UNTUK PRODUK DENGAN POLA PENGGUNAAN INTERMITTENT TESIS

Sistem Pakar untuk Memilih Buku Ilmu Syar i Berbahasa Indonesia

REDUKSI ORDE MODEL SISTEM LINEAR PARAMETER VARYING MELALUI LINEAR MATRIX INEQUALITIES TESIS MUHAMMAD WAKHID MUSTHOFA NIM :

MODIFIKASI ALGORITMA J-BIT ENCODING UNTUK MENINGKATKAN RASIO KOMPRESI

PEMODELAN NILAI SATUAN UNIT APARTEMEN BERBASIS DATA TIGA DIMENSI TESIS SURYADI NIM :

ALJABAR ATAS SUATU LAPANGAN DAN DUALISASINYA TESIS. Edi Kurniadi NIM : Program Studi Matematika

PERANCANGAN ENTERPRISE ARCHITECTURE MENGGUNAKAN TOGAF DI DIREKTORAT JENDERAL PERBENDAHARAAN DEPARTEMEN KEUANGAN TESIS

ITERATIVE LEARNING CONTROL UNTUK PLANT NONLINEAR DENGAN FASE NONMINIMUM TESIS. IBNU HADI NIM : Program Studi Matematika

TESIS KLASIFIKASI TEKS SHORT MESSAGE SERVICE (SMS) HARLIANDI No. Mhs : /PS/MTF

STUDI PEMANFAATAN BATUBARA DI PABRIK PUPUK

ABSTRAK IDENTIFIKASI RISIKO KONTRAKTOR DALAM RANTAI PASOK PENGEMBANGAN PERUMAHAN. Oleh Betty Susanti NIM :

TSUNAMI AUGMENTED REALITY : INTERAKSI BERBASIS MARKER SEBAGAI POINTER

METODE MENENTUKAN PRIORITAS DALAM ANALYTIC HIERARCHY PROCESS MENGGUNAKAN DEKOMPOSISI NILAI SINGULAR PROYEK

ESTIMASI OUTSTANDING CLAIMS LIABILITY DAN ANALISIS SENSITIFITAS : MODEL PROBABILISTIC TREND FAMILY (PTF) TESIS ARIF HERLAMBANG NIM :

PEMBANGUNAN ADD-ON PADA MOZILLA THUNDERBIRD UNTUK ENKRIPSI SURAT ELEKTRONIK DENGAN CORRECTED BLOCK TINY ENCRYPTION ALGORITHM

ANALISIS PENCITRAAN GEORADAR TERHADAP PERKERASAN JALAN LENTUR. Tesis

Pengamanan Transmisi Hasil dan Data Query Basis Data dengan Algoritma Kriptografi RC4

PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM.

INVERSI SEISMIK MODEL BASED DAN BANDLIMITED UNTUK PENDEKATAN NILAI IMPEDANSI AKUSTIK TESIS

MODEL DIFUSI OKSIGEN DI JARINGAN TUBUH TESIS. KARTIKA YULIANTI NIM : Program Studi Matematika

IMPLEMENTASI DAN ANALISIS KINERJA ALGORITMA ARITHMETIC CODING DAN SHANNON-FANO PADA KOMPRESI CITRA BMP SKRIPSI SYAHFITRI KARTIKA LIDYA

ANALISIS KINERJA DAN IMPLEMENTASI ALGORITMA KOMPRESI ARITHMETIC CODING PADA FILE TEKS DAN CITRA DIGITAL SKRIPSI SARIFAH

KAJIAN POTENSI PENGEMBANGAN EARNED VALUE MANAGEMENT SYSTEM (EVMS) PADA SISTEM AKUNTANSI BIAYA KONTRAKTOR KECIL TESIS

ANALISIS SPASIAL DENGAN SEMIVARIOGRAM MODEL BOLA (Studi Kasus : Nilai Ujian Nasional Sekolah Menengah Kejuruan di Bandar Lampung) TESIS TRI WIBAWANTO

TESIS HERY NURMANSYAH PROGRAM MAGISTER TEKNIK INDUSTRI PROGRAM PASCASARJANA UNIVERSITAS MERCUBUANA 2016

Pengamanan Situs dengan Enkripsi Head dan Body HTML Menggunakan Algoritma RC4

Sistem Pakar Diagnosis dan Terapi Penyakit Umum dengan Induct/MCRDR

PENGARUH INFORMATION TECHNOLOGY INFRASTRUCTURE LIBRARY (ITIL) TERHADAP SERVICE QUALITY DI PT. ANABATIC TECHNOLOGIES TBK

MODEL FUNGSI SALARY DALAM VALUASI PROGRAM PENSIUN

BAB III METODE PENELITIAN

TEKNIK VIDEO DIGITAL WATERMARKING SEBAGAI PROTEKSI HAK CIPTA PADA DISTRIBUSI KONTEN MULTIMEDIA TESIS

STABILITAS PORTAL BIDANG

ABSTRAK METODE ELEMEN BATAS UNTUK PENYELESAIAN MASALAH PEMBENTUKAN DROPLET PADA BENANG FLUIDA VISCOELASTIS A.WAHIDAH.AK NIM :

SISTEM PERINGKAS BERITA ONLINE OTOMATIS MENGGUNAKAN ALGORITMA TEXTTEASER SKRIPSI ANWAR PASARIBU

FLUTTER PADA T TAIL PLATE-KOMPOSIT THESIS

EFEK VARIASI DARI PROSPEKTIF MORTALITA UNTUK MANFAAT NILAI TUNAI

KEMUNGKINAN (LIKELIHOOD) MODEL FILOGENETIK MELALUI MODEL MARKOV TERSEMBUNYI Studi kasus: Hylobates, Pongo, Gorilla, Homo sapiens, dan Pan TESIS

KAJIAN POLA RANTAI PASOK PENGEMBANGAN PERUMAHAN TESIS ERY RADYA JUARTI NIM :

PERANCANGAN MODEL CUSTOMER RELATIONSHIP MANAGEMENT PRODUK PASCABAYAR (STUDI KASUS : PT EXCELCOMINDO PRATAMA. TBK.)

KAJIAN MODEL HIDDEN MARKOV KONTINU DENGAN PROSES OBSERVASI ZERO DELAY DAN APLIKASINYA PADA HARGA GABAH KERING PANEN T A M U R I H

RANCANG BANGUN APLIKASI PERINGKAS TEKS OTOMATIS ARTIKEL BERBAHASA INDONESIA MENGGUNAKAN METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY

MUTASI C825T GEN katg ISOLAT L5 MULTIDRUG RESISTANT Mycobacterium tuberculosis TESIS RINA BUDI SATIYARTI NIM: Program Studi Kimia

JARINGAN SARAF TIRUAN UNTUK MENILAI ARANSEMEN MUSIK

KAJIAN PEMODELAN FISIS, AUTOMATA GAS KISI, DAN ANALITIS ALIRAN GLISERIN TESIS. ADITYA SEBASTIAN ANDREAS NIM: Program Studi Fisika

EKSTRAKSI JALAN SECARA OTOMATIS DENGAN DETEKSI TEPI CANNY PADA FOTO UDARA TESIS OLEH: ANDRI SUPRAYOGI NIM :

SMART BUSINESS PROCESS MANAGEMENT SYSTEM TESIS

ABSTRAK PENERAPAN ALGORITMA AGGLOMERATIVE PADA PETA KUALITAS PENDIDIKAN INDONESIA

PENILAIAN KESIAPAN (READINESS) DOSEN DAN MAHASISWA UNTUK E-LEARNING DI UNIVERSITAS KRISTEN MARANATHA TESIS

ABSTRAK. Kata kunci : Informasi, Information Retreival, Ant Colony Optimization, Graph, Fitur dokumen. vii

PERINGKASAN TEKS OTOMATIS DOKUMEN BAHASA INDONESIA DENGAN ALGORITMA GENETIKA LEMBAR JUDUL KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI

SHABRINA ROSE HAPSARI M SURAKARTA

PENENTUAN PELUANG TRANSISI t LANGKAH DAN UJI ORDE DARI SUATU RANTAI MARKOV Ō(r)

PADA. Oleh Ferryanto Chandra Program Studi Magister dan Doktor Teknik Penerbangan Fakultas Teknologi Industri Institut Teknologi Bandung

PENERAPAN ALGORITMA K-MEANS UNTUK PENGELOMPOKAN DATA EKSPRESI GEN

BAB 1 PENDAHULUAN. Latar Belakang

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL

OPTIMASI JUMLAH HIDDEN NODES EXTREME LEARNING MACHINE MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION UNTUK PERAMALAN JUMLAH PENJUALAN BARANG

KAJIAN LAJU ANGKUTAN SEDIMEN PADA SUNGAI SUNGAI DI SUMATERA SELATAN TESIS

KAJIAN PENENTUAN ALTERNATIF RUTE PERJALANAN PARIWISATA DI KPP KALIANDA KABUPATEN LAMPUNG SELATAN T E S I S

MODEL DINAMIK STRATEGI PENCEGAHAN PERTAMBAHAN JUMLAH PEROKOK TESIS. KASBAWATI NIM : Program Studi Matematika

PERANCANGAN DAN IMPLEMENTASI INTERAKSI MEDIA PEMBELAJARAN HIDROKARBON BERBASIS TEKNOLOGI AUGMENTED REALITY TESIS

Deteksi Otomatis Plagiarisme Source Code

Sistem Penganalisis Data Laporan Keuangan dengan Metode Rasio pada Organisasi Nirlaba (Studi Kasus : ITB BHMN)

PERINGKASAN TEKS BERITA SECARA OTOMATIS MENGGUNAKAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) SKRIPSI DANDUNG TRI SETIAWAN

PEMILIHAN DAN PENGEMBANGAN SISTEM MANAJEMEN JARINGAN ENTERPRISE OPEN SOURCE BERBASIS PROTOKOL SNMP DAN FRAMEWORK STANDAR FCAPS TESIS

MODEL SISTEM PENJADWALAN DEPENDENCY PADA BASIS DATA DEDUKTIF

IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan)

IDENTIFIKASI DAN VERIFIKASI TANDA TANGAN STATIK MENGGUNAKAN BACKPROPAGATION DAN ALIHRAGAM WAVELET

SINTESIS DAN KARAKTERISASI POLISTIRENA DENGAN BENZOIL PEROKSIDA SEBAGAI INISIATOR

DINAMIKA LAHAN PERTANIAN DALAM PEREKONOMIAN KOTA TANGERANG : SUATU PENDEKATAN SYSTEM DYNAMICS TESIS

RESPONS STRUKTUR PIER DAN PIERHEAD JEMBATAN CAWANG PRIOK TERHADAP BEBAN GEMPA SESUAI SNI GEMPA 1726 TAHUN 2003 DAN TERHADAP BEBAN LALU LINTAS TESIS

Seminar Nasional Aplikasi Teknologi Informasi 2012 (SNATI 2012) ISSN: Yogyakarta, Juni 2012

PENGARUH DUMMY VARIABLE PADA METODE NAÏVE BAYES DALAM KASUS KLASIFIKASI PENYAKIT KANDUNGAN

PERANCANGAN PERMAINAN DOMINO BERBASIS ANDROID SKRIPSI MUHAMMAD ANDIKA SYAPUTRA

: Peringkasan Terpandu Otomatis (Automatic Guided Summarization)

PEMODELAN EROSI SEDIMENTASI DI PERAIRAN SEKITAR LOKASI PLTU DAN PLTGU GRESIK

PEMBANGUNAN PERANGKAT LUNAK STREAMING ENSEMBLE ALGORITHM (SEA): ALGORITMA UNTUK KLASIFIKASI DALAM SKALA BESAR TESIS GIRI DHANESWARA NIM :

RANCANG BANGUN SISTEM OPINION MINING DENGAN METODE POS TAGGING

Transkripsi:

Penggunaan Hidden Markov Model untuk Kompresi Kalimat TESIS Karya tulis sebagai salah satu syarat Untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh YUDI WIBISONO NIM: 23505023 Program Studi Informatika INSTITUT TEKNOLOGI BANDUNG 2008

ABSTRAK Penggunaan Hidden Markov Model untuk Kompresi Kalimat Oleh Yudi Wibisono NIM: 23505023 Masalah utama dalam penggunaan handheld device adalah ukuran layar yang kecil sehingga mempersulit pengguna untuk mencari dan memperoleh informasi tekstual. Penggunaan peringkasan dokumen dapat membantu memecahkan masalah ini, tetapi kalimat yang dihasilkan masih terlalu panjang. Kompresi kalimat dapat diaplikasikan untuk mengurangi panjang kalimat tanpa menghilangkan informasi yang penting. Kompresi kalimat pada tesis ini menggunakan Hidden Markov Model (HMM) yang diadaptasi dari model statistical translation dan HMM-Hedge. Algoritma Viterbi digunakan untuk mencari susunan kata yang paling optimal. Eksperimen dilakukan untuk mengkaji pengaruh penambahan tag simbol numerik dan tag entitas pada preprocessing, bobot probabilitas pada model HMM, dan bigram smoothing. Selain itu kinerja metode HMM ini dibandingkan dengan metode Knight-Marcu Noisy Channel. Eksperimen dalam tesis ini menggunakan koleksi kalimat Ziff-Davis yang terdiri atas 1067 pasang kalimat. Hasil eksperimen memperlihatkan bahwa HMM terbaik dibangun dengan penambahan tag simbol numerik pada preprocessing, Jelinek Mercer smoothing dengan γ = 0.1, dan bobot probabilitas = 0.1. Setelah dibandingkan dengan metode Knight-Marcu Noisy Channel, ternyata kinerja HMM masih lebih rendah. Kata kunci: smoothing kompresi kalimat, Hidden Markov Model, algoritma viterbi, bigram ii

ABSTRACT Hidden Markov Model for Sentence Compression by Yudi Wibisono NIM: 23505023 Main problem in using handheld device is the smal screen size so that it makes difficult for user to find and get textual information. Document summarization can solve this problem, but sometimes the summary is still too long. Sentence compression can be applied to that summary to reduce sentence length without remove important information. Sentence compression in this thesis use Hidden Markov Model (HMM) adapted from statistical translation model and HMM-Hedge. Viterbi algorithm is also used to find optimal word sequence. There are two experiment goals. First, explore the influences of three parameters to quality of sentence compression. Second, compare our system performance with Knight- Marcu Noisy Channel performance. This experiment used Ziff-Davis corpus, that consists of 1067 pairs of sentences. Best HMM is constructed by adding numerical tags in preprocessing, Jelinek Mercer smoothing with γ = 0.1, and probability weight 0.1. This system is still worse than Knight Marcu Noisy Channel. Keyword: smoothing sentence compression, Hidden Markov Model, viterbi algorithm, bigram iii

Penggunaan Hidden Markov Model untuk Kompresi Kalimat Oleh Yudi Wibisono NIM: 23505023 Program Studi Informatika Institut Teknologi Bandung Menyetujui Tim Pembimbing Tanggal 26 Juni 2008 Ketua Ir. Dwi Hendratmo Widyantoro, M.Sc., Ph.D iv

PEDOMAN PENGGUNAAN TESIS Tesis S2 yang tidak dipublikasikan terdaftar dan tersedia di Perpustakaan Institut Teknologi Bandung, dan terbuka untuk umum dengan ketentuan bahwa hak cipta ada pada pengarang dengan mengikuti aturan HaKI yang berlaku di Institut Teknologi Bandung. Referensi kepustakaan diperkenankan dicatat, tetapi pengutipan atau peringkasan hanya dapat dilakukan seizin pengarang dan harus disertai dengan kebiasaan ilmiah untuk menyebutkan sumbernya. Memperbanyak atau menerbitkan sebagian atau seluruh tesis haruslah seizin Direktur Program Pascasarjana Institut Teknologi Bandung. v

KATA PENGANTAR Puji dan syukur penulis panjatkan kepada Allah SWT sehingga penulisan tesis ini dapat diselesaikan dengan baik. Penulis sangat berterima kasih kepada: 1. Bapak Ir. Dwi Hendratmo Widyantoro, M.Sc., Ph.D, sebagai pembimbing tesis atas segala saran, bimbingan, dan petunjuknya selama penelitian berlangsung dan selama penulisan tesis ini dilakukan. 2. Bapak Dr. Ir. Benhard Sitohang sebagai wali angkatan 2005 S2-IF. 3. Ibu Ir. Sri Purwanti, M.Sc (alm) sebagai penguji presentasi proposal dan seminar. 4. Ibu Dr. Eng. Ayu Purwarianti, ST, MT sebagai penguji pra sidang dan sidang. 5. Ibu Harlili, M.Sc sebagai penguji sidang. 6. Para staf pengajar Program Studi Teknik Informatika ITB terutama Ketua dan Sekretaris Program Studi Teknik Informatika. 7. Para staf tata usaha akademik S2-IF. 8. Masayu Leylia Khodra, MT sebagai istri dan teman diskusi yang banyak memberikan perhatian, saran, dan komentar. 9. Teman-teman angkatan 2005 S2-IF Bandung, 26 Juni 2008 Penulis vi

DAFTAR ISI ABSTRAK...ii ABSTRACT...iii PEDOMAN PENGGUNAAN TESIS...v KATA PENGANTAR...vi DAFTAR ISI...vii DAFTAR GAMBAR...viii DAFTAR TABEL...ix Bab I Pendahuluan...1 I.1 Latar Belakang...1 I.2 Rumusan Masalah...2 I.3 Ruang Lingkup dan Batasan Masalah...3 I.4 Tujuan Tesis...3 I.5 Metodologi Penelitian...3 I.6 Sistematika Pembahasan...4 Bab II Dasar Teori...5 II.1 Hidden Markov Model (HMM)...5 II.2 Decoding dengan Algoritma Viterbi...8 II.3 Kompresi Kalimat...8 II.3.1 Teknik yang Bergantung ada Bahasa Tertentu...9 II.3.2 Teknik yang Tidak Bergantung pada Bahasa...11 II.3.3 Evaluasi Kinerja...11 II.4 Aplikasi HMM untuk Kompresi Kalimat...12 II.4.1 Statistical Translation Model...12 II.4.2 HMM-Hedge...14 II.5 Bigram Smoothing...15 Bab III Analisis dan Rancangan Sistem Kompresi Kalimat...18 III.1 Model Probabilitas...18 III.2 Hidden Markov Model (HMM)...20 III.3 Decode Kompresi Kalimat...22 III.4 Preprocessing...24 III.5 Arsitektur Sistem...25 Bab IV Eksperimen...27 IV.1 Skenario Eksperimen...28 IV.2 Hasil Eksperimen Skenario Pertama...28 IV.2.1 Pengaruh Penambahan Tag Simbol Numerik dan Entitas pada Preprocessing...29 IV.2.2 Pengaruh Bigram Smoothing...30 IV.2.3 Pengaruh Bobot α...31 IV.3 Hasil Eksperimen Skenario Kedua...32 IV.4 Hasil Eksperimen Skenario Ketiga...32 Bab V Kesimpulan dan Saran...36 V.1 Kesimpulan...36 V.2 Saran...36 Daftar Pustaka...37 vii

DAFTAR GAMBAR Gambar I-1 Contoh Pemotongan Ringkasan Artikel pada Google News [GOO08]...1 Gambar I-2 Contoh kompresi kalimat pada koleksi dokumen Ziff-Davis...2 Gambar II-1 Contoh Markov Chain...5 Gambar II-2 Contoh HMM untuk part of speech tagger [JUR06]...7 Gambar II-3 Contoh pembuangan subordinat [COR99]...10 Gambar II-4 Topologi HMM-Hedge...15 Gambar III-1 Topologi Pertama HMM...21 Gambar III-2 Topologi Kedua HMM...21 Gambar III-3 Diagram trelis untuk t=1...23 Gambar III-4 Diagram trelis untuk t=2...23 Gambar III-5 Arsitektur Sistem Kompresi Kalimat...26 Gambar IV-1 Contoh pasangan kalimat pada koleksi Ziff Davis...27 Gambar IV-2 Contoh perbandingan hasil HMM dengan Knight-Marcu Noisy Channel.33 Gambar IV-3 Contoh hasil HMM yang lebih unggul dari Knight-Marcu Noisy Channel34 Gambar IV-3 Tiga kalimat hasil kompresi HMM dengan skor ROGUE-2 tertinggi...35 Gambar IV-4 Tiga kalimat hasil kompresi HMM dengan skor ROGUE-2 terendah...35 viii

DAFTAR TABEL Tabel III-1 Contoh pemberian tag simbol numerik...25 Tabel III-2 Contoh pemberian tag simbol entitas...25 Tabel IV-1 Parameter dan nilai yang diteliti dalam eksperimen...28 Tabel IV-2 Frekuensi tag simbol numerik pada data latihan...29 Tabel IV-3 ROUGE-2 untuk preprocessing...30 Tabel IV-4 ROUGE-2 Zue Smoothing...30 Tabel IV-5 Nilai ROUGE-2 untuk J-M Smoothing...31 Tabel IV-6 ROUGE-2 untuk berbagai nilai α...31 Tabel IV-7 ROUGE-2 untuk kedua topologi...32 Tabel IV-8 ROUGE-2 antara HMM dan K-M Noisy Channel...33 ix