TRANSLASI KALIMAT BAHASA INGGRIS KE BAHASA INDONESIA MENGGUNAKAN METODE AUGMENTED TRANSITION NETWORK Nurhalimah Harahap¹, Eddy Muntina Dharma², Andrian Rakhmatsyah³ ¹Teknik Informatika,, Universitas Telkom Abstrak Bahasa merupakan faktor dasar yang penting dalam melakukan komunikasi dan interaksi sosial antar manusia. Bahasa dibentuk oleh dua komponen dasar yaitu struktur (grammar) dan kosa kata. Dalam berkomunikasi, faktor bahasa merupakan salah satu permasalahan sendiri yaitu penggunaan bahasa yang berbeda. Atas dasar inilah maka muncul ide untuk membuat mesin penerjemah bahasa, dalam hal ini yang diterjemahkan adalah bahasa Inggris ke bahasa Indonesia. Mesin penerjemah ini dibuat berdasarkan grammar dan kosa kata pembentuk kalimat. Cabang ilmu informatika yang mempelajari mengenai mesin penerjemah adalah Natural Language Processing (NLP). Dalam NLP, analisis ini tergolong ke dalam syntax yaitu merupakan tahapan analisis yang mempelajari aturan-aturan yang merangkai kata menjadi frase dan kalimat baku. Komponen utama dalam analisis syntax adalah grammar dan lexicon. Grammar dan lexicon dirancang dan diimplementasikan dengan menggunakan metode Augmented Transition Network (ATN). Hasil implementasi dari ATN dapat menghasilkan terjemahan kalimat bahasa Inggris ke bahasa Indonesia yang mirip dengan terjemahan manusia. Kata Kunci : natural language processing, augmented transition network, mesin penerjemah. Abstract Language is a major important factor to make communication and social interaction inter-human. Linguist is formed by two principal components. They are grammar and lexicon. Linguist as a particular problem is communicating each other with a different language. This leads to an idea of creating machine translation. In this case, the translation is from English into Indonesian. Machine translation is formed by grammar and lexicon that are principal component to build sentence. Natural Language Processing (NLP) is Interdisciplinary field of Artificial Intelligence that studies about machine translation and computational linguistics. Syntax is one of analyzing process in NLP. Syntax studies the rules for combining words into legal phrases and sentences. Grammar and lexicon are major component in analyzing syntax. Grammar and lexicon are designed and implemented by using Augmented Transition Network (ATN) method. The result of ATN implementation is a translation sentences that are similar to translation by human. Keywords : natural language processing, augmented transition network, machine translation.
1 Pendahuluan 1.1 Latar Belakang Bahasa merupakan faktor dasar yang penting dalam melakukan komunikasi dan interaksi sosial antar manusia. Adapun komponen dasar dalam suatu bahasa yaitu aturan-aturan dalam menggunakan bahasa yang disebut grammar atau struktur bahasa, dan daftar kata-kata untuk merepresentasikan sesuatu yang disebut kosa kata. Bahasa itu sendiri juga memiliki bermacam-macam permasalahan yang akan berkembang seiring dengan jalannya waktu. Salah satu contoh permasalahan dalam berbahasa yaitu, penggunaan bahasa yang berbeda. Perbedaan bahasa umumnya terjadi jika ingin melakukan komunikasi dengan orang-orang yang menggunakan bahasa yang berbeda-beda. Untuk dapat berkomunikasi diperlukan suatu kesepakatan dahulu, yaitu bahasa apakah yang akan dipakai sehingga masing-masing pihak mengerti apa maksud yang ingin disampaikan. Untuk menyelesaikan permasalahan ini maka dibuatlah solusi yaitu mesin penerjemah bahasa. Mesin ini nantinya diharapkan dapat menghasilkan terjemahan yang mendekati dengan hasil terjemahan manusia. Adapun cabang ilmu informatika yang mempelajari tentang bagaimana membuat sebuah mesin penerjemah bahasa yaitu Pengolahan Bahasa Alami. Dalam pengolahan bahasa alami dipelajari bagaimana mengkomputerisasi suatu bahasa sehingga memiliki kecerdasan berbahasa layaknya seperti kecerdasan manusia sendiri. Pengolahan Bahasa Alami juga memiliki komponen dasar yaitu aturan-aturan (grammar) dan daftar kosa kata. Mesin penerjemah bahasa yang akan dibuat disini yaitu dari bahasa Inggris diterjemahkan ke dalam bahasa Indonesia. Hal ini dikarenakan bahasa Inggris memiliki pola struktur yang sistematis, sehingga sangat memungkin untuk dibuat mesin penerjemahnya. Komponen dasar dalam pengolahan bahasa alami yaitu penentuan grammar dan kosa kata (lexicon) yang akan dibuat. Rancangan dua komponen ini akan sangat mempengaruhi hasil terjemahan dari mesin penerjemah. Adapun metode yang digunakan untuk merancang grammar, lexicon, dan membuat mesin penerjemah yaitu Augmented Transition Network (ATN). Metode ATN tidak hanya berfungsi untuk menolak atau menerima suatu struktur kalimat saja, tetapi juga dapat menganalisis struktur kalimat. Metode ini memperbolehkan adanya pengulangan atau rekursif pada jaringan grammarnya. Hal ini akan berfungsi menyederhanakan jaringan grammar dan membuat kombinasi jaringan grammar semakin banyak. Selain itu, metode ini juga memiliki suatu fitur yang disebut register. Register ini menyimpan data dari suatu frase yang cocok dengan struktur kalimat yang telah ditelusuri. Register tersebut merupakan hasil dari penggabungan dan pengirisan dari data property yang dimiliki oleh kata-kata yang tersimpan di dalam lexicon. 11
1.2 Perumusan Masalah Tugas Akhir ini membahas masalah bagaimana hasil terjemahan suatu kalimat bahasa Inggris ke kalimat bahasa Indonesia dari mesin penerjemah yang menggunakan metode Augmented Transition Network. Untuk menjaga agar Tugas Akhir ini tidak meluas, maka perlu batasanbatasan sebagai berikut. Mesin penerjemah tidak menangani masalah kebenaran makna dari suatu kalimat. Kalimat kompleks yang ditangani yaitu kalimat yang terdiri dari satu induk kalimat dan satu anak kalimat. Kalimat yang dikenali yaitu kalimat dalan bahasa tulisan (bukan lisan). Inputan berupa satu kalimat bahasa Inggris yang diakhir dengan tanda baca titik., tanda tanya?, dan tanda seru!. Frase yang dikenali yaitu frase yang kurang dari 4 kata. Ambuguitas kata yang ditangani yaitu homonymy. Kalimat yang dikenali yaitu kalimat yang sesuai dengan struktur tata bahasa Inggris[2]. Bentuk tense yang dikenali yaitu 12 tenses, hal ini dikarenakan 4 bentuk tense yang lain pada kenyataannya jarang sekali dipergunakan dalam berbahasa. 1.3 Tujuan Tujuan yang ingin dicapai dari Tugas Akhir ini yaitu mengaplikasikan metode Augmented Transtion Network dalam mesin penerjemah bahasa Inggris ke bahasa Indonesia, sehingga menghasilkan terjemahan yang mirip dengan terjemahan manusia. 1.4 Metodologi Penyelesaian Masalah Metodologi yang digunakan dalam penyelesaian masalah adalah gabungan antara studi literatur, analisis, perancangan, implementasi, dan pengujian, dengan detil sebagai berikut. 1. Studi Literatur Mempelajari pengertian dan konsep kecerdasan buatan, mempelajari pengertian dan konsep pemrosesan bahasa alami, mempelajari metode Augmented Transition Network, mempelajari tata bahasa Inggris. 2. Analisis Masalah Menganalisa struktur bahasa Inggris yang meliputi: bentuk dan macam kalimat, bentuk dan macam frase, bentuk dan macam kata, Perubahan bentuk kata, ambiguitas kata dalam bahasa Inggris. Menganalisa grammar bahasa Inggris dan bahasa Indonesia yang dapat menangani struktur bahasa Inggris. Menganalisis lexicon yang dapat menangani struktur bahasa Inggris. 12
3. Perancangan Merancang grammar bahasa Inggris ke dalam bentuk jaringan grammar. Mendapatkan rancangan grammar bahasa Indonesia dari hasil rancangan grammar bahasa Inggris. Merancang lexicon yang cocok untuk setiap jenis kelas kata. Merancang sistem yang dimodelkan dalam bentuk diagram UML. 4. Implementasi Mengimplementasikan grammar bahasa Inggris dan grammar bahasa Indonesia ke dalam file text. Mengimplementasikan lexicon untuk tiap kelas kata ke dalam file text. Mengimplementasikan mesin penerjemah ke dalam bahasa pemrograman. 5. Pengujian Melakukan pengujian terhadap mesin penerjemah dengan menginputkan sebuah kalimat, kemudian mencatat hasil pengujian untuk dievaluasi. 6. Laporan Membuat laporan dari apa yang telah dilakukan mulai dari tahap studi literatur sampai dengan tahap pengujian dalam bentuk buku laporan. 13
5 Kesimpulan dan Saran 5.1 Kesimpulan Metode ATN berhasil diaplikasikan pada mesin penerjemah bahasa dari bahasa Inggris ke bahasa Indonesia dan menghasilkan terjemahan sesuai dengan yang diharapkan tanpa mengubah maksud dari kalimat [6]. Permasalahan homonymy dalam word-sense disambiguity dapat diselesaikan dengan menggunakan metode ATN. ATN dapat menggunakan struktur lexicon yang berbeda untuk masingmasing kelas kata. Untuk frase kata benda yang terdiri dari article the dan kata benda, contoh the book, masih sulit untuk diterjemahkan. Hal ini dikarenakan frase the book dalam suatu kalimat dapat diterjemahkan sebagai buku dan sebagai buku itu. Hal ini dikarenakan belum adanya keseragaman atau standarisasi terjemahan jenis frase the book itu sendiri dan tidak adanya informasi yang jelas dalam kalimat yang menunjukkan frase the book diterjemahkan sebagai buku atau buku itu. 5.2 Saran Adapun saran-saran untuk penyempurnaan sistem penerjemah bahasa ini yaitu : Sistem penerjemah sebaiknya mampu untuk menerjemahkan bentuk kalimat kompleks yang terdiri dari satu induk kalimat dan dua atau lebih anak kalimat Sistem penerjemah sebaiknya mampu untuk menerjemahkan kalimat kompleks gabungan Sistem penerjemah sebaiknya mampu menangani permasalahan morphology dalam NLP. 62
6 Daftar Pustaka [1] Chin-Liang Chan, 1990, Pengantar Teknik Kecerdasan Buatan, Erlangga [2] Daniel Jurafsky, James H. Martin, 1999, Speech and Language Processing, Prentice Hall [3] Donny Hariyanto, Drs. Rudy Hariyono, 2003, English Garmmar for General Application, Gitamedia Press [4] Eko Sediyono, 2005, Teknik Kompilasi Teori dan Praktik, Andi Yogyakarta [5] George F Luger,William A. Stubblefield, 1993, ARTIFICIAL INTELLIGENCE Structures and Strategies for Complex Problem Solving, The Benjamin / Cummings Publishing Company, Inc. [6] Hotben D. Lingga, S.S dan Lim Ali Utomo, 2006, Intisari Tata Bahasa Inggris Kontemporer, Kesaint Blanc [7] James Allen, 1991, Natural Language Understanding, Benjamin- Cummings Publishing Company. [8] James Suciadi, 2001, Studi Analisis Metode-Metode Parsing dan Interpretasi Semantik Pada Natural Language Processing. JURNAL INFORMATIKA Vol. 2, No. 1, Mei 2001: 13-22 [9] Max Dennis Luesebrink, Natural Language Semantics, 2006, http://www.answers.com/topic/semantics, di download pada 1 desember 2006. [10] Oki Purwantiningsih, 2005, Perangkat Lunak Kamus Berintelegensia Untuk Bahasa Indonesia Untuk Menentukan Kelas Kata Berdasarkan Kelas Akar Kata Dan Imbuhan, Indonesia: STTTelkom. [11] Prof. Drs. S. Wojowasito,1995, Kamus Umum Lengkap Inggris- Indonesia dan Indonesia-Inggris, Pengarang [12] Robert C. Berwick, 2003, Natural Language Processing, Lecture 20 : Machine Translation 4, http://ocw.mit.edu/nr/rdonlyres/electrical- Engineering-and-Computer-Science/6-863JSpring2003/F82D361B- 8E4B-4045-BA66-4E8BE53F0907/0/lecture2003.pdf di donwload tanggal 1 Desember 2006 [13] Tan Chin Tuck, Techniques used in Natural Language Processing, 2006, http://www.doc.ic.ac.uk/~nd/surprise_97/journal/vol2/ctt/#reference, di download tanggal 19 desember 2006 63