BAB III METODOLOGI PENELITIAN

dokumen-dokumen yang mirip
MESIN PENERJEMAH BAHASA INDONESIA- BAHASA JAWA Johan Pranata 1, Muljono 2 1,2 Teknik Informatika, Fakultas Ilmu Komputer, Universitas Dian Nuswantoro

BAB II TINJAUAN PUSTAKA

Meningkatkan Akurasi Pada Mesin Penerjemah Bahasa Indonesia Ke Bahasa Melayu Pontianak Dengan Part Of Speech

TUNING FOR QUALITY UNTUK UJI AKURASI MESIN PENERJEMAH STATISTIK (MPS) BAHASA INDONESIA - BAHASA DAYAK KANAYATN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Gambar 1. Komponen Mesin Translasi Berbasis Statistik

Perbaikan Probabilitas Lexical Model untuk Meningkatkan Akurasi Mesin Penerjemah Statistik

BAB I PENDAHULUAN. 1.1 Latar belakang Latar belakang umum

APLIKASI PENERJEMAH DUA ARAH BAHASA INDONESIA BAHASA MELAYU SAMBAS BERBASIS WEB DENGAN MENGGUNAKAN DECODER MOSES

PENERJEMAHAN DOKUMEN INGGRIS-INDONESIA MENGGUNAKAN MESIN PENERJEMAH STATISTIK DENGAN WORD REORDERING DAN PHRASE REORDERING

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODE PENELITIAN. Berikut adalah tahapan penelitian yang dilakukan : Menentukan kebutuhan data yang digunakan, seperti data makanan, data

1. PENDAHULUAN 1.1 Latar belakang Masalah

BAB 3 METODOLOGI PENELITIAN. Desain penelitian untuk Sistem Optimalisasi Produksi ini menggunakan

BAB 3 METODE PENELITIAN. dalam melakukan penelitian untuk memudahkan penyusun dalam

IMPLEMENTASI MESIN PENERJEMAH STATISTIK BERBASIS ANDROID DENGAN MOSES DECODER

3.1 Desain Penelitian

BAB III METODOLOGI PENELITIAN

BAB III ANALISIS DAN PERANCANGAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

Konversi Bahasa Indonesia ke SQL (Structured Query Language) dengan Pendekatan Mesin Penerjemah Statistik

BAB 3. METODE PENELITIAN. Desain penelitian adalah tahapan atau gambaran yang akan dilakukan

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN

Berikut langkah-langkah penelitian yang dilakukan: 1. Menentukan kebutuhan data yang akan digunakan.

BAB III METODOLOGI PENELITIAN. melakukan penelitian yang bertujuan untuk memudahkan peneliti dalam

BAB III METODE PENELITIAN. Tahapan penelitian yang akan dilakukan adalah sebagai berikut: keputusan tingkat kesehatan.

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN. Untuk memperlancar proses penelitian, maka dibentuk desain penelitian yang

Aplikasi Informasi Penanganan Pertama Pada Cedera Olahraga dengan Fisioterapi Berbasis Android

BAB III METODOLOGI PENELITIAN

BAB I. Pendahuluan. 1.1 Latar Belakang Masalah. 1.2 Rumusan Masalah

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Saat ini minimnya perkembangan teknologi dalam dunia pendidikan menghambat kemampuan siswa untuk mendapatkan informasi berupa materi dan latihan soal

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

Mesin Penerjemah Situs Berita Online Bahasa Indonesia ke Bahasa Melayu Pontianak

BAB III METODOLOGI. Penelitian ini dilaksanakan di Ruang Server Biro Sistem Informasi (BSI)

BAB III METODOLOGI PENELITIAN

BAB II ANALISIS DAN PERANCANGAN

BAB III METODOLOGI PENELITIAN. Gambar 3.1 merupakan desain penelitian yang akan digunakan dalam

BAB 2 ANALISIS DAN PERANCANGAN. Dalam menciptakan sebuah aplikasi sistem penyewaan mobil secara

FRAMEWORK PHP BERBASIS KOMPONEN UNTUK MEMBUAT FORMULIR DAN LAPORAN SECARA OTOMATIS ABSTRAK

BAB III METODOLOGI PENELITIAN. Gambar 3.1 merupakan desain penelitian yang akan digunakan pada

Uji Akurasi Penerjemahan Bahasa Indonesia Dayak Taman dengan Penandaan Kata Dasar dan Imbuhan

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB 3 ARSITEKTUR DAN PERANCANGAN SISTEM

BAB III METODOLOGI PENELITIAN

pbab 4 IMPLEMENTASI DAN EVALUASI PROGRAM APLIKASI uji coba terhadap program aplikasi pengenalan plat nomor kendaraan roda empat ini,

BAB III METODOLOGI PENELITIAN. ini. Pada dasarnya penelitian ini terpisah antara pengembangan MBROLA

BAB III ANALISA DAN PERANCANGAN SISTEM

4 BAB 4 IMPLEMENTASI DAN PENGUJIAN

UKDW BAB 1 PENDAHULUAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

(7) Sebagai contoh, sebuah kalimat dari bahasa Jerman dengan terjemahannya dalam bahasa Inggris seperti berikut ini :

BAB 4 IMPLEMENTASI DAN EVALUASI

UKDW BAB 1 PENDAHULUAN Latar Belakang

BAB III METODOLOGI PENELITIAN. Berikut tahapan penelitian yang dilakukan: 1. Menentukan kebutuhan data yang akan digunakan.

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. dan rahasia telah menjadi suatu hal yang sangat berharga. Data atau informasi

BAB I PENDAHULUAN. dibidang penjualan alat elektronik seperti Computer, Notebook, Tablet, Camera, Projector, Printer dan Accesories Computer.

BAB III METODE PENELITIAN. Desain penelitian yaitu tahapan yang akan dilakukan peneliti untuk

khazanah Meningkatkan Peran Model Bahasa dalam Mesin Penerjemah Statistik (Studi Kasus Bahasa Indonesia-Dayak Kanayatn) informatika

BAB III METODE PENELITIAN. dilakukan untuk mempermudah dalam melakukan penelitian. Dalam

BAB III ANALISA DAN PERANCANGAN

ABSTRAK. Kata Kunci: sistem penerjemah Alkitab, Bilingual Evaluation Understudy, GIZA++, Statistical Machine Translation, dan IBM model.

BAB III METODE PENELITIAN. 3.1 Instrumen Penelitian 1. Identifikasi Kebutuhan Software Kebutuhan software dalam penelitian ini antara lain:

BAB III ANALISIS DAN PERANCANGAN

BAB IV HASIL DAN EVALUASI. QoS, yaitu : pengujian terhadap Delay, pengujian terhadap Jitter, pengujian

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB III METODE PENELITIAN. Peneliti melakukan penelitian dijurusan Ilmu Komputer Fakultas Matematika dan

BAB III METODOLOGI PENELITIAN. tools yang akan digunakan untuk merancang aplikasi generator denah

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN Alat Alat yang di gunakan dalam pembuatan aplikasi hadis sahih bukhari

BAB I PERSYARATAN PRODUK

BAB III METODOLOGI PENELITIAN

BAB II ANALISIS DAN PERANCANGAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN. Desain penelitian ini mengacu pada tahapan proses yang ada pada sistem

BAB III METODOLOGI PENELITIAN. Dalam penelitian penerapan metode Jaringan Syaraf Tiruan Learning Vector

1 BAB III METODE PENELITIAN

Gambar 3.1 Desain Penelitian

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN. calon seleksi alih golongan (SAG) dengan menggunakan metode SMART (Simple

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III ANALISIS DAN METODE PENELITIAN. Perangkat keras yang dibutuhkan pada penelitian ini adalah : Laptop Dell Inspiron N4030 dengan spesifikasi

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN. Desain penelitian adalah tahapan atau gambaran yang akan dilakukan

BAB III METODE PENELITIAN. tangan dengan menggunakan metode Support Vector Machine (SVM).

BAB II ANALISIS DAN PERANCANGAN. bertujuan untuk memberikan gambaran dan rancangan bangun yang jelas

Transkripsi:

1 BAB III METODOLOGI PENELITIAN 1.1 Instrumen penelitian Pada instrumen penelitian akan dijelaskan kebutuhan perangkat lunak, kebutuhan perangkat keras, serta kebutuhan bahan penelitian. Yaitu sebagai berikut : 1.1.1 Kebutuhan perangkat lunak Penelitian ini membutuhkan sekumpulan perangkat lunak, karena perangkat lunak merupakan faktor yang penting dan harus terpenuhi dalam penelitian ini, sehingga maksut dan tujuan penelitian dapat dicapai. perangkat lunak yang digunakan adalah : 1. Sistem Operasi Sistem operasi yang digunakan dalam penelitian ini adalah Ubuntu 14.04 LTS 64 bit. Digunakan untuk menjalankan tools pembuatan mesin penerjemah statistik. 2. SRILM Perangkat lunak SRILM (The SRI Language Modeling) yang dikembangkan oleh SRI Speech Technology and Research Laboratory adalah toolkit untuk pemodelan n-gram pada language model. SRILM yang digunakan adalah SRILM versi 1.7.1. 1

2 3. GIZA++ Perangkat lunak GIZA++ dikembangkan oleh franz josef och. GIZA++ digunakan pada translation model, khususnya digunakan untuk proses penjajaran kata. GIZA++ yang digunakan adalah versi 1.0.7. 4. Moses Perangkat lunak Moses dikembangkan oleh Hieu Hoang dan Philipp Koehn,perangkat ini merupakan perangkat yang bersifat terbuka. Moses digunakan untuk prepocessing dan decoding. Moses yang digunakan adalah versi 2.1.1. 1.1.2 Kebutuhan perangkat keras Selain kebutuhan perangkat lunak, dibutuhkan juga perangkat keras guna mendukung penelitian ini. Adapun kebutuhan hardware yang akan digunakan untuk membangun sistem tersebut memiliki spesifikasi sebagai berikut : 1. Processor : Intel(R) Core(TM) i5-3210m CPU @ 2.50Ghz (4 CPUs) 2. Memory (RAM) : 4096MB 1.1.3 Kebutuhan bahan penelitian Mesin penerjemah statistik memerlukan sekumpulan kalimat untuk pembuatan korpus paralel. Data atau kumpulan kalimat paralel yang digunakan sebagai pelatihan pada penelitian ini diambil dari Alkitab terjemahan Jawa dan Indonesia. Korpus Indonesia dan Korpus Jawa masing-masing memiliki 4.500 kalimat atau dataset. Pada penelitian ini juga membutuhkan 500 kalimat atau dataset digunakan untuk proses evaluasi. 1.2 Prosedur pengumpulan data 1. Pembelajaran literatur Pembelajaran literatur adalah proses mempelajari literer-literer yang berkaitan dengan penelitian yang dilakukan. Pembelajaran literasi juga

3 merupakan sebuah proses dalam mengevaluasi penelitian-penelitian yang pernah dilakukan dalam bidang yang sama. Dalam proses ini pula pembelajaran terhadap korpus Bahasa Indonesia-Jawa dilakukan kemudian dikumpulkan sebagai bahan pembuatan sistem. 2. Dokumentasi Data yang didapatkan dari pembelajaran literature kemudian dijadikan sebagai acuan dalam membangun sistem, kemudian setiap langkah yang dilakukan didokumentasikan sebagai bahan pembahasan. 1.3 Metode yang diusulkan Untuk pembuatan mesin penerjemah pada penelitian ini penulis menggunakan metode mesin penerjemah statistik berbasis frasa. Karena metode ini dianggap sebagai metode era baru untuk mesin penerjemah dibandingkan dengan metode lainnya seperti metode Direct dan Rule-based. Ide utama dari pendeketan ini adalah terjemahan akan dibuat dari kata yang paling mungkin di terjemahkan. Sistem ini terdiri dari tiga komponen yang berbeda. Language Model (LM) menghitung probabilitas bahasa target T sebagai probabilitas P (T), pada language model (LM) dilakukan proses penghalusan untuk mendapatkan model n-gram. Translation Model (TM), membantu untuk menghitung probabilitas bersyarat kalimat target diberi aturan sumber, P (T S). pada translation model terdapat beberapa elemen seperti penjajaran (alignment) dan extraction frasa (phrase extraction). Decoder memaksimalkan hasil probabilitas dari Language Model (LM) dan Translation Model (TM) pada model ini proses penerjemahan dilakukan. Untuk penjelasan dasar Mesin Penerjemah Statistik Berbasis Korpus ditujukan pada gambar berikut :

4 Source language Language Model P(T) Translation Model P(S T) Decoder e*=arg max P(T S) Target Language Gambar 1 : Dasar mesin penerjemah statistik berbasis korpus 1.4 Teknik analisis data Teknik analisis data yang digunakan dalam pembangunan mesin penerjemah terdiri dari beberapa tahapan. Tahapan pertama prepocessing kemudian beralih ke tahapan training. Tahapan prepocessing adalah tahapan mempersiapkan korpus paralel. Pada tahapan training dilakukan proses mengolah korpus untuk memperoleh model bahasa dan model penerjemahan. Setelah tahapan training memperoleh hasil lalu melakukan proses testing atau disebut juga dengan tahapan decoding. Dan yang terakhir adalah evaluasi. Berikut gambaran arsitektur pembangunan mesin penerjemah statistik :

5 \ Gambar 2 : Teknik analisis pembangunan mesin penerjemah statistik 1. Penjajaran kalimat adalah proses menata kedua bahasa tersebut menjadi susunan baris-baris kalimat. 2. Tokenisasi adalah proses memberi jarak antar kata, termasuk juga memberi jarak kata dengan tanda baca yang ada. 3. Cleaning adalah proses yang memberi batas maksimal pada panjang kalimat, lowercase merupakan proses untuk menyeragamkan besarkecilnya huruf. 4. Truecasing adalah proses setiap kata awal dari tiap kalimat dikonversi ke tempat yang paling mungkin.

6 5. Language model adalah proses pembentukan n-gram, penghalusan (smoothing), dan penambahan simbol sebagai batas (sentences boundary symbols) pada tiap kalimat. 6. Translation Model adalah proses menjajarkan kata pada korpus paralel, membuat tabel frasa (phrase table), pembuatan tabel lexicalized reordering atau pemanggilan kembali kata maupun frasa yang telah dibuat, pemberian score pada frasa, dan terakhir membuat berkas configuration file. 7. Decoder adalah proses menerjemahkan bahasa sumber ke bahasa target sesuai dengan masukan kalimat yang ditulis. 1.5 Teknik tuning Pada pembuatan mesin penerjemah statistik terdapat dua macam proses tuning yaitu tuning otomatis dan tuning manual. Proses yang dilakukan dalam penelitian ini adalah proses tuning yang dilakukan secara manual. Yang dilakukan dalam proses tuning manual adalah mecari bobot terbaik dari masing-masing parameter yang ada pada mesin penerjemah. Parameter tersebut antara lain, phrase translation model, language model, reordering model,dan word pinalty. Proses tuning dilakukan setelah proses evaluasi terhadap hasil terjemahan dan hasil evaluasi dari mesin penerjemah statistik bahasa Indonesia-bahasa Jawa selesai dikerjakan. Pencarian bobot terbaik dilakukan dengan uji-coba tiap tiap nilai bobot dari tiap-tiap parameter. Parameter phrase translation,language model, reordering model mempunyai rentang nilai bobot yaitu 0,1 hingga 1. Untuk parameter word penalty mempunyai rentang -3 hingga 3. Setelah didapatkan bobot terbaik dari masing-masing parameter maka dilakukan uji-coba dengan menggunakan bobot terbaik masing-masing parameter. Dan proses terakhir adalah membandingkan hasil evaluasi setelah tuning dan sebelum tuning pada mesin penerjemah statistik bahasa Indonesia-bahasa Jawa.

7 Mencari bobot terbaik pada masingmasing parameter Menguji tiap bobot terbaik pada tiap-tiap parameter Membandingkan hasil evaluasi sebelum tuning dan setelah tuning

8