TRANSLASI KALIMAT BAHASA INGGRIS KE BAHASA INDONESIA MENGGUNAKAN METODE AUGMENTED TRANSITION NETWORK

dokumen-dokumen yang mirip
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

Universitas Bina Nusantara. Jurusan Teknik Informatika Program Studi Ilmu Komputer Skripsi Sarjana Komputer Semester Ganjil 2007 / 2008

BAB I PENDAHULUAN. Inggris bahasa Madura Enggi Bunten. Madura yang digunakan untuk berkomunikasi dalam kehidupan seharihari.

Sistem Wawancara Virtual untuk Penerimaan Mahasiswa Jurusan Teknik Informatika di ITHB dengan Metode Natural Language Processing

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

LANGUAGES AND TRANSLATOR

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

BAB I PENDAHULUAN. gabah, dan yang sudah dibuang kulit luarnya disebut beras. Dalam praktek di

BAB II TINJAUAN PUSTAKA

UKDW BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. I.1 Latar Belakang

SISTEM PARSING PERKATAAN BAHASA INDONESIA

SPEECH RECOGNITION (Pengenalan Ucapan)

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

BAB 1 PENDAHULUAN. dengan banyaknya produk terkenal yang berkualitas milik negara Jepang, yang

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika)

IMPLEMENTASI ALGORITMA COCKE-YOUNGER-KASAMI (CYK) DAN LEVENSHTEIN UNTUK MENGOREKSI KESALAHAN PENGEJAAN KALIMAT BAHASA INGGRIS SKRIPSI

BAB I PENDAHULUAN 1.1 Latar Belakang

APLIKASI KAMUS ELEKTRONIK BAHASA ISYARAT BAGI TUNARUNGU DALAM BAHASA INDONESIA BERBASIS WEB

NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. Di era perkembangan teknologi sekarang ini menuntut semua perubahan dan

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha

Regina Malvinasrani Gitasari¹, -². ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

BAB II TINJAUAN PUSTAKA

RANCANG BANGUN PERANGKAT LUNAK PENGEMBANG SISTEM PAKAR BERBASIS ATURAN DENGAN METODE FORWARD CHAINING

Satu alat penting yang tidak dapat Anda tinggalkan adalah kamus teknis tentang topik yang sedang Anda terjemahkan. Dengan kamus itu, Anda dapat

BAB I PENDAHULUAN. pengantar dalam berkomunikasi antar bangsa. Dengan ditetapkannya bahasa

BAB I PENDAHULUAN! 1.1 Latar Belakang

INTERAKSI MANUSIA DAN KOMPUTER (HUMAN COMPUTER INTERACTION)

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

APLIKASI VIDEO ON DEMAND BERBASIS WEB

ANALISIS DAN PERANCANGAN APLIKASI HELP DESK BERBASIS INTRANET DENGAN PENERAPAN METODE NATURAL LANGUAGE PROCESSING PADA PT GLOBAL INFORMASI BERMUTU

APLIKASI PENGOLAH BAHASA ALAMI UNTUK OPERASI QUERI DATABASE

Pengantar Kecerdasan Buatan (AK045218) Bahasa Alami 1

INTERAKSI MANUSIA dan KOMPUTER (HUMAN COMPUTER INTERACTION)

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL

SENTENCE ANALYSIS WITH ARTIFICIAL INTELLIGENCE MACHINE LEARNING USING FINITE STATE AUTOMATA

APLIKASI SISTEM PAKAR UNTUK PERTOLONGAN PERTAMA MENDIAGNOSA DEMAM Shela Shelina Universitas Gunadarma Jl. Margonda Raya No. 100 Pondok Cina, Depok 164

PEMBUATAN MODEL NAMED ENTITY RECOGNITION UNTUK TWITTER BAHASA INDONESIA DENGAN MENGGUNAKAN STANFORD NER

RANCANG BANGUN PENCARIAN JUDUL TESIS BERBASIS TEKNOLOGI WEB SEMANTIK

BAB I PENDAHULUAN 1.1. Latar Belakang

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL

NATURAL LANGUAGE PROCESSING DALAM MEMPEROLEH INFORMASI AKADEMIK MAHASISWA UNIVERSITAS ATMA JAYA MAKASSAR

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

APLIKASI PIRANTI LUNAK PENGANALISIS SINTAKSIS KALIMAT BAHASA INDONESIA

ABSTRAK. Kata Kunci: sistem penerjemah Alkitab, Bilingual Evaluation Understudy, GIZA++, Statistical Machine Translation, dan IBM model.

BAB I PENDAHULUAN. informasi yang disampaikan dapat lebih cepat dan efektif. Pada tempat observasi penelitian, penyampaian informasi melalui layanan

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. Dalam pengembangan perangkat lunak, tim developer membangun cetak

Abstraksi. Kata kunci : Symbian, JAVA Mobile, J2ME, Indonesia-Inggris, Kamus. vii

E. Distribusi Mata Kuliah

KECERDASAN BUATAN (ARTIFICIAL INTELLIGENCE) By :Suthami A.

KURIKULUM 2009 (JALUR SKRIPSI)

Perancangan Aplikasi Pengklasifikasian Dokumen Dengan Algoritma Nearest Neighbor

Aplikasi Pengolah Bahasa Alami Untuk Operasi Queri Database Agus Purwo Handoko 3)

Pengenalan Kecerdasan Buatan (KB)

BAB I PENDAHULUAN. linguistik (Austin & Sallabank, 2011). Melalui bahasa, seseorang dapat. dimaksudkan oleh penyampai pesan kepada orang tersebut.

Prodi S1 Teknik Informatika, Fakultas Teknik, Universitas Telkom.

BAB I PENDAHULUAN. 1.1 Latar Belakang

ALGORITMA DALAM KAITANNYA DENGAN KOMPUTER

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENGANTAR PERKULIAHAN

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

AKUISISI PENGETAHUAN MENGGUNAKAN MULTIPLE CLASSIFICATION RIPPLE DOWN RULES (MCRDR)

BAB I PENDAHULUAN 1.1 Latar Belakang

Natural Language Processing

BAB I PENDAHULUAN. Orasi ilmiah DR. Arry Akhmad Arman, Fakultas Teknologi Industri, ITB, 23 Agustus

SISTEM INFORMASI PENELITIAN DAN PENGABDIAN DOSEN GUNA OTOMATISASI PENENTUAN ANGKA KREDIT DOSEN DAN MENDUKUNG AKTIVITAS TRIDHARMA PERGURUAN TINGGI

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Penerapan Metode Left Corner Parsing dalam Aplikasi Terjemahan Bahasa Indonesia ke Bahasa Bima

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang. Pada era globalisasi seperti saat ini, setiap negara di dunia telah terhubung

SISTEM NOTIFIKASI KEMACETAN LALU LINTAS BERBASIS MEDIA SOSIAL DENGAN METODE NLP

BAB I PENDAHULUAN 1.1. Latar Belakang

PENDAHULUAN. Latar Belakang

ABSTRAK Kata kunci : Universitas Kristen Maranatha

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

Bab 1 Pendahuluan 1.1 Latar Belakang

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

BAB 1 PENDAHULUAN. Hal 1. 1 Dan W. Patterson, Introduction to Artificial Intelligence and Expert System, Prentice Hall, 1990,

BAB 1 PENDAHULUAN. melakukan berbagai aktivitas baik pada saat bekerja maupun pada saat bersosialisasi di

IMPLEMENTASI DAN ANALISIS PENGOLAHAN KATA MENGGUNAKAN ALGORITMA HIDDEN MARKOV MODEL DENGAN POCKETSPHINX

Kamus Indonesia - Jawa Berbasis Sinonim

PENINGKATAN KUALITAS SINYAL SUARA DENGAN METODE PENDEKATAN SUBRUANG ABSTRAK

1. PENGANTAR KECERDASAN BUATAN (ARTIFICIAL INTELLIGENCE)

ANALISIS PEMBENTUKAN WORD GRAPH KATA BENDA MENGGUNAKAN TEORI KNOWLEDGE GRAPH HAIRUL SALEH

BAB I PENDAHULUAN. Kemampuan berkomunikasi ini meliputi mendengarkan (listening),

BAB I PENDAHULUAN Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. bagaimana membuat mesin (komputer) dapat melakukan pekerjaan seperti dan

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Genap Tahun 2010/2011

Transkripsi:

TRANSLASI KALIMAT BAHASA INGGRIS KE BAHASA INDONESIA MENGGUNAKAN METODE AUGMENTED TRANSITION NETWORK Nurhalimah Harahap¹, Eddy Muntina Dharma², Andrian Rakhmatsyah³ ¹Teknik Informatika,, Universitas Telkom Abstrak Bahasa merupakan faktor dasar yang penting dalam melakukan komunikasi dan interaksi sosial antar manusia. Bahasa dibentuk oleh dua komponen dasar yaitu struktur (grammar) dan kosa kata. Dalam berkomunikasi, faktor bahasa merupakan salah satu permasalahan sendiri yaitu penggunaan bahasa yang berbeda. Atas dasar inilah maka muncul ide untuk membuat mesin penerjemah bahasa, dalam hal ini yang diterjemahkan adalah bahasa Inggris ke bahasa Indonesia. Mesin penerjemah ini dibuat berdasarkan grammar dan kosa kata pembentuk kalimat. Cabang ilmu informatika yang mempelajari mengenai mesin penerjemah adalah Natural Language Processing (NLP). Dalam NLP, analisis ini tergolong ke dalam syntax yaitu merupakan tahapan analisis yang mempelajari aturan-aturan yang merangkai kata menjadi frase dan kalimat baku. Komponen utama dalam analisis syntax adalah grammar dan lexicon. Grammar dan lexicon dirancang dan diimplementasikan dengan menggunakan metode Augmented Transition Network (ATN). Hasil implementasi dari ATN dapat menghasilkan terjemahan kalimat bahasa Inggris ke bahasa Indonesia yang mirip dengan terjemahan manusia. Kata Kunci : natural language processing, augmented transition network, mesin penerjemah. Abstract Language is a major important factor to make communication and social interaction inter-human. Linguist is formed by two principal components. They are grammar and lexicon. Linguist as a particular problem is communicating each other with a different language. This leads to an idea of creating machine translation. In this case, the translation is from English into Indonesian. Machine translation is formed by grammar and lexicon that are principal component to build sentence. Natural Language Processing (NLP) is Interdisciplinary field of Artificial Intelligence that studies about machine translation and computational linguistics. Syntax is one of analyzing process in NLP. Syntax studies the rules for combining words into legal phrases and sentences. Grammar and lexicon are major component in analyzing syntax. Grammar and lexicon are designed and implemented by using Augmented Transition Network (ATN) method. The result of ATN implementation is a translation sentences that are similar to translation by human. Keywords : natural language processing, augmented transition network, machine translation.

1 Pendahuluan 1.1 Latar Belakang Bahasa merupakan faktor dasar yang penting dalam melakukan komunikasi dan interaksi sosial antar manusia. Adapun komponen dasar dalam suatu bahasa yaitu aturan-aturan dalam menggunakan bahasa yang disebut grammar atau struktur bahasa, dan daftar kata-kata untuk merepresentasikan sesuatu yang disebut kosa kata. Bahasa itu sendiri juga memiliki bermacam-macam permasalahan yang akan berkembang seiring dengan jalannya waktu. Salah satu contoh permasalahan dalam berbahasa yaitu, penggunaan bahasa yang berbeda. Perbedaan bahasa umumnya terjadi jika ingin melakukan komunikasi dengan orang-orang yang menggunakan bahasa yang berbeda-beda. Untuk dapat berkomunikasi diperlukan suatu kesepakatan dahulu, yaitu bahasa apakah yang akan dipakai sehingga masing-masing pihak mengerti apa maksud yang ingin disampaikan. Untuk menyelesaikan permasalahan ini maka dibuatlah solusi yaitu mesin penerjemah bahasa. Mesin ini nantinya diharapkan dapat menghasilkan terjemahan yang mendekati dengan hasil terjemahan manusia. Adapun cabang ilmu informatika yang mempelajari tentang bagaimana membuat sebuah mesin penerjemah bahasa yaitu Pengolahan Bahasa Alami. Dalam pengolahan bahasa alami dipelajari bagaimana mengkomputerisasi suatu bahasa sehingga memiliki kecerdasan berbahasa layaknya seperti kecerdasan manusia sendiri. Pengolahan Bahasa Alami juga memiliki komponen dasar yaitu aturan-aturan (grammar) dan daftar kosa kata. Mesin penerjemah bahasa yang akan dibuat disini yaitu dari bahasa Inggris diterjemahkan ke dalam bahasa Indonesia. Hal ini dikarenakan bahasa Inggris memiliki pola struktur yang sistematis, sehingga sangat memungkin untuk dibuat mesin penerjemahnya. Komponen dasar dalam pengolahan bahasa alami yaitu penentuan grammar dan kosa kata (lexicon) yang akan dibuat. Rancangan dua komponen ini akan sangat mempengaruhi hasil terjemahan dari mesin penerjemah. Adapun metode yang digunakan untuk merancang grammar, lexicon, dan membuat mesin penerjemah yaitu Augmented Transition Network (ATN). Metode ATN tidak hanya berfungsi untuk menolak atau menerima suatu struktur kalimat saja, tetapi juga dapat menganalisis struktur kalimat. Metode ini memperbolehkan adanya pengulangan atau rekursif pada jaringan grammarnya. Hal ini akan berfungsi menyederhanakan jaringan grammar dan membuat kombinasi jaringan grammar semakin banyak. Selain itu, metode ini juga memiliki suatu fitur yang disebut register. Register ini menyimpan data dari suatu frase yang cocok dengan struktur kalimat yang telah ditelusuri. Register tersebut merupakan hasil dari penggabungan dan pengirisan dari data property yang dimiliki oleh kata-kata yang tersimpan di dalam lexicon. 11

1.2 Perumusan Masalah Tugas Akhir ini membahas masalah bagaimana hasil terjemahan suatu kalimat bahasa Inggris ke kalimat bahasa Indonesia dari mesin penerjemah yang menggunakan metode Augmented Transition Network. Untuk menjaga agar Tugas Akhir ini tidak meluas, maka perlu batasanbatasan sebagai berikut. Mesin penerjemah tidak menangani masalah kebenaran makna dari suatu kalimat. Kalimat kompleks yang ditangani yaitu kalimat yang terdiri dari satu induk kalimat dan satu anak kalimat. Kalimat yang dikenali yaitu kalimat dalan bahasa tulisan (bukan lisan). Inputan berupa satu kalimat bahasa Inggris yang diakhir dengan tanda baca titik., tanda tanya?, dan tanda seru!. Frase yang dikenali yaitu frase yang kurang dari 4 kata. Ambuguitas kata yang ditangani yaitu homonymy. Kalimat yang dikenali yaitu kalimat yang sesuai dengan struktur tata bahasa Inggris[2]. Bentuk tense yang dikenali yaitu 12 tenses, hal ini dikarenakan 4 bentuk tense yang lain pada kenyataannya jarang sekali dipergunakan dalam berbahasa. 1.3 Tujuan Tujuan yang ingin dicapai dari Tugas Akhir ini yaitu mengaplikasikan metode Augmented Transtion Network dalam mesin penerjemah bahasa Inggris ke bahasa Indonesia, sehingga menghasilkan terjemahan yang mirip dengan terjemahan manusia. 1.4 Metodologi Penyelesaian Masalah Metodologi yang digunakan dalam penyelesaian masalah adalah gabungan antara studi literatur, analisis, perancangan, implementasi, dan pengujian, dengan detil sebagai berikut. 1. Studi Literatur Mempelajari pengertian dan konsep kecerdasan buatan, mempelajari pengertian dan konsep pemrosesan bahasa alami, mempelajari metode Augmented Transition Network, mempelajari tata bahasa Inggris. 2. Analisis Masalah Menganalisa struktur bahasa Inggris yang meliputi: bentuk dan macam kalimat, bentuk dan macam frase, bentuk dan macam kata, Perubahan bentuk kata, ambiguitas kata dalam bahasa Inggris. Menganalisa grammar bahasa Inggris dan bahasa Indonesia yang dapat menangani struktur bahasa Inggris. Menganalisis lexicon yang dapat menangani struktur bahasa Inggris. 12

3. Perancangan Merancang grammar bahasa Inggris ke dalam bentuk jaringan grammar. Mendapatkan rancangan grammar bahasa Indonesia dari hasil rancangan grammar bahasa Inggris. Merancang lexicon yang cocok untuk setiap jenis kelas kata. Merancang sistem yang dimodelkan dalam bentuk diagram UML. 4. Implementasi Mengimplementasikan grammar bahasa Inggris dan grammar bahasa Indonesia ke dalam file text. Mengimplementasikan lexicon untuk tiap kelas kata ke dalam file text. Mengimplementasikan mesin penerjemah ke dalam bahasa pemrograman. 5. Pengujian Melakukan pengujian terhadap mesin penerjemah dengan menginputkan sebuah kalimat, kemudian mencatat hasil pengujian untuk dievaluasi. 6. Laporan Membuat laporan dari apa yang telah dilakukan mulai dari tahap studi literatur sampai dengan tahap pengujian dalam bentuk buku laporan. 13

5 Kesimpulan dan Saran 5.1 Kesimpulan Metode ATN berhasil diaplikasikan pada mesin penerjemah bahasa dari bahasa Inggris ke bahasa Indonesia dan menghasilkan terjemahan sesuai dengan yang diharapkan tanpa mengubah maksud dari kalimat [6]. Permasalahan homonymy dalam word-sense disambiguity dapat diselesaikan dengan menggunakan metode ATN. ATN dapat menggunakan struktur lexicon yang berbeda untuk masingmasing kelas kata. Untuk frase kata benda yang terdiri dari article the dan kata benda, contoh the book, masih sulit untuk diterjemahkan. Hal ini dikarenakan frase the book dalam suatu kalimat dapat diterjemahkan sebagai buku dan sebagai buku itu. Hal ini dikarenakan belum adanya keseragaman atau standarisasi terjemahan jenis frase the book itu sendiri dan tidak adanya informasi yang jelas dalam kalimat yang menunjukkan frase the book diterjemahkan sebagai buku atau buku itu. 5.2 Saran Adapun saran-saran untuk penyempurnaan sistem penerjemah bahasa ini yaitu : Sistem penerjemah sebaiknya mampu untuk menerjemahkan bentuk kalimat kompleks yang terdiri dari satu induk kalimat dan dua atau lebih anak kalimat Sistem penerjemah sebaiknya mampu untuk menerjemahkan kalimat kompleks gabungan Sistem penerjemah sebaiknya mampu menangani permasalahan morphology dalam NLP. 62

6 Daftar Pustaka [1] Chin-Liang Chan, 1990, Pengantar Teknik Kecerdasan Buatan, Erlangga [2] Daniel Jurafsky, James H. Martin, 1999, Speech and Language Processing, Prentice Hall [3] Donny Hariyanto, Drs. Rudy Hariyono, 2003, English Garmmar for General Application, Gitamedia Press [4] Eko Sediyono, 2005, Teknik Kompilasi Teori dan Praktik, Andi Yogyakarta [5] George F Luger,William A. Stubblefield, 1993, ARTIFICIAL INTELLIGENCE Structures and Strategies for Complex Problem Solving, The Benjamin / Cummings Publishing Company, Inc. [6] Hotben D. Lingga, S.S dan Lim Ali Utomo, 2006, Intisari Tata Bahasa Inggris Kontemporer, Kesaint Blanc [7] James Allen, 1991, Natural Language Understanding, Benjamin- Cummings Publishing Company. [8] James Suciadi, 2001, Studi Analisis Metode-Metode Parsing dan Interpretasi Semantik Pada Natural Language Processing. JURNAL INFORMATIKA Vol. 2, No. 1, Mei 2001: 13-22 [9] Max Dennis Luesebrink, Natural Language Semantics, 2006, http://www.answers.com/topic/semantics, di download pada 1 desember 2006. [10] Oki Purwantiningsih, 2005, Perangkat Lunak Kamus Berintelegensia Untuk Bahasa Indonesia Untuk Menentukan Kelas Kata Berdasarkan Kelas Akar Kata Dan Imbuhan, Indonesia: STTTelkom. [11] Prof. Drs. S. Wojowasito,1995, Kamus Umum Lengkap Inggris- Indonesia dan Indonesia-Inggris, Pengarang [12] Robert C. Berwick, 2003, Natural Language Processing, Lecture 20 : Machine Translation 4, http://ocw.mit.edu/nr/rdonlyres/electrical- Engineering-and-Computer-Science/6-863JSpring2003/F82D361B- 8E4B-4045-BA66-4E8BE53F0907/0/lecture2003.pdf di donwload tanggal 1 Desember 2006 [13] Tan Chin Tuck, Techniques used in Natural Language Processing, 2006, http://www.doc.ic.ac.uk/~nd/surprise_97/journal/vol2/ctt/#reference, di download tanggal 19 desember 2006 63