SENTENCE ANALYSIS WITH ARTIFICIAL INTELLIGENCE MACHINE LEARNING USING FINITE STATE AUTOMATA

dokumen-dokumen yang mirip
PERTEMUAN II. Finite State Automata (FSA) Deterministic Finite Automata (DFA) Non Deterministic Finite Automata (NFA)

FINITE STATE MACHINE / AUTOMATA

TEORI BAHASA DAN AUTOMATA

TEKNIK KOMPILASI Bahasa Regular

Teori Bahasa Formal dan Automata

Aplikasi Simulator Mesin Turing Pita Tunggal

BAB 1 PENDAHULUAN. sederhana adalah kelas bahasa reguler (regular languages). Bahasa reguler dapat dengan

NonDeterministic Finite Automata. B.Very Christioko, S.Kom

FINITE STATE AUTOMATA

1. Pendahuluan. 2. Tinjauan Pustaka

Penerapan Finite State Automata Pada Proses Peminjaman Buku di Perpustakaan Universitas Kristen Satya Wacana Artikel Ilmiah

FTIK / PRODI TEKNIK INFORMATIKA

PENDEKATAN TEORI AUTOMATA UNTUK MENYELESAIKAN APLIKASI-APLIKASI DI BIDANG ILMU KECERDASAN BUATAN

Teori Bahasa dan Otomata

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

Pendahuluan [6] FINITE STATE AUTOMATA. Hubungan RE & FSA [5] Finite State Diagram [6] 4/27/2011 IF-UTAMA 1

Pengembangan Algoritma Mow dan Generalisasi Bahasa Automata untuk Proses Pembuatan Minuman Serta Pengembalian Uang pada Desain Mesin Kopi Otomatis

Perancangan dan Implementasi Finite Automata pada Simulasi Vending Machine

Penerapan Konsep Finite State Automata (FSA) pada Mesin Pembuat Minuman Kopi Otomatis

TEORI BAHASA DAN AUTOMATA

NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER

Pengenalan Konsep Bahasa dan

SATUAN ACARA PERKULIAHAN (SAP) TEORI BAHASA DAN OTOMATA

PEMODELAN PERANGKAT LUNAK UNTUK PENGERTIAN DETERMINISTIC FINITE AUTOMATA DAN NON-DETERMINISTIC FINITE AUTOMATA

PENERAPAN KONSEP FINITE STATE AUTOMATA (FSA) PADA MESIN PEMBUAT MINUMAN KOPI OTOMATIS

TEORI BAHASA DAN AUTOMATA

TEORI BAHASA DAN OTOMATA PENGANTAR

Penelitian Kelompok LAPORAN PENELITIAN RANCANG BANGUN SISTEM INFORMASI PENILAIAN JAWABAN SOAL ESSAY OLEH

TEORI BAHASA DAN AUTOMATA

Teori Bahasa Formal dan Automata

VIRTUAL PARALLEL ENVIRONMENT USING PVM CASE STUDY BUBBLE SORT ALGORITHM

PENDAHULUAN. Terdapat tiga topik utama di teori otomata yaitu:

UNIVERSITAS GADJAH MADA FMIPA/DIKE/ILMU KOMPUTER Gedung SIC Lantai 1, Sekip, Bulaksumur, 55281, Yogyakarta

TEORI BAHASA DAN OTOMATA [TBO]

Lecture Notes Teori Bahasa dan Automata

ABSTRAK Kata kunci : Universitas Kristen Maranatha

ABSTRAK. Universitas Kristen Maranatha

Mesin Turing. Pertemuan Ke-14. Sri Handayaningsih, S.T., M.T. Teknik Informatika

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM. dirancang dan selanjutnya dapat diketahui gambaran dan kemampuan sistem secara

EKSPRESI REGULAR PADA SUATU DETERMINISTIC FINITE STATE AUTOMATA

TEORI BAHASA & AUTOMATA

INTELLIGENT DECISION SUPPORT SYSTEM DALAM MENDETEKSI BEHAVIOUR SIRKUIT LOGIKA

Regina Malvinasrani Gitasari¹, -². ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

SISTEM PARSING PERKATAAN BAHASA INDONESIA

Overview. Pendahuluan. Pendahuluan. Pendahuluan. Pendahuluan. Pendahuluan

Penerapan Graf Transisi dalam Mendefinisikan Bahasa Formal

Non-deterministic Finite Automata Dengan -Move

PEMBUATAN NPC DALAM SIMULATOR GAME SANG PEDJOEANG DENGAN IMPLEMENTASI ARTIFICIAL INTELLIGENCE MDP (MARKOV DECISION PROCESS) Laporan Tugas Akhir

BAB I PENDAHULUAN. Dengan menggunakan kecerdasan buatan maka tidaklah mustahil akan ada mesin yang benar-benar mampu berpikir layaknya manusia.

Sumarni Adi TEKNIK INFORMATIKA STMIK AMIKOM YOGYAKARTA 2013

ABSTRAK. Kata kunci: Artifficial Intelligence (AI), Finite State Machine (FSM), video game

ABSTRAK. Kata kunci: Sistem Tanya Jawab, Semantic Web, Ontology, domain terbatas. v Universitas Kristen Maranatha

Lecture Notes Teori Bahasa dan Automata

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

LEMBAR PENGESAHAN PROSEDUR PELAKSANAAN KULIAH

ABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA

Teori Komputasi 11/2/2016. Bab 5: Otomata (Automata) Hingga. Otomata (Automata) Hingga. Otomata (Automata) Hingga

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

PENGENALAN WAJAH DENGAN MENERAPKAN ALGORITMA ADAPTIF K MEANS

ABSTRAK. Kata kunci: chatbot, information state, mixture-language model. v Universitas Kristen Maranatha

TEORI BAHASA DAN OTOMATA [TBO]

ABSTRAK. vi Universitas Kristen Maranatha

RENCANA PEMBELAJARAN SEMESTER

PENGGUNAAN FRASA BAHASA INDONESIA DALAM KARANGAN SISWA KELAS VII MTsN RENGEL TAHUN PELAJARAN 2014/2015

TEORI BAHASA DAN AUTOMATA

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

1, 2, 3

IF-UTAMA 1. Definisi. Grammar. Definisi

FIRDAUS SOLIHIN FAKULTAS TEKNIK UNIVERSITAS TRUNOJOYO

Penerapan Algoritma K-Means untuk Clustering

KOMPRESI DAN DEKOMPRESI DATA TEKSTUAL MENGGUNAKAN ALGORITMA DEFLATE. Valentinus Henry G /

Tanggal Revisi : Tanggal : SATUAN ACARA PERKULIAHAN

RINGKASAN PENELITIAN

BAB I PENDAHULUAN. Bahasa merupakan salah satu bagian terpenting dalam kehidupan sosial

TEORI BAHASA DAN OTOMATA [TBO]

Grammar dan Tingkat Bahasa

PENERAPAN MODIFIKASI ALGORITMA A* PATHFINDING DALAM GAME BALAP 3D BERBASIS MOBILE KOMPETENSI REKAYASA PERANGKAT LUNAK SKRIPSI

Sistem Redundant PLC (Studi Kasus Aplikasi Pengontrolan Plant Temperatur Air)

BAHASA BEBAS KONTEKS UNTUK KOMPLEMEN DARI STRING BERULANG CONTEXT FREE LANGUAGE FOR COMPLEMENT OF REPEATED STRING

BAB II MODEL KOMPUTASI FINITE STATE MACHINE. Pada Bab II akan dibahas teori dasar matematika yang digunakan

Teori Bahasa Formal dan Automata

PENERAPAN FUNGSI TRANDUCER DALAM MERANCANG SIMULASI VENDING MACHINE

PERANGKAT LUNAK PENGUCAPAN KATA BAHASA INDONESIA BERDASARKAN PEMENGGALAN KATA DENGAN FINITE STATE AUTOMATA

PERHITUNGAN KOMPLEKSITAS FUNCTION POINT UNTUK SUATU WEB

ABSTRAK. Kata Kunci : Artificial Neural Network(ANN), Backpropagation(BP), Levenberg Marquardt (LM), harga emas, Mean Squared Error(MSE), prediksi.

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Von Neumann

Penerapan Pewarnaan Titik pada Graf dalam Penyusunan Lokasi Duduk Menggunakan Algoritma Greedy Berbantuan Microsoft Visual Basic 6.

SIMULASI PENGENDALIAN KECEPATAN MOBIL OTOMATIS MENGGUNAKAN LOGIKA FUZZY DAN ALGORITMA GENETIKA

IDENTIFIKASI TANDA TANGAN MENGGUNAKAN ALGORITMA DOUBLE BACKPROPAGATION ABSTRAK

MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA DOSEN:

INTEROGATIF DALAM NOVEL HATIKU BUKAN PUALAM KARYA SAUT POLTAK TAMBUNAN (Interrogative in Novel Hatiku Bukan Pualam By Saut Poltak Tambunan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

2. MesinTuring (Bagian2)

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENGENALAN WAJAH DENGAN CITRA MASUKAN BERUPA CITRA SKETSA WAJAH SEBAGAI HASIL SINTESIS DENGAN TEKNIK MULTISCALE MARKOV RANDOM FIELD (MRF)

Turing and State Machines. Mesin Turing. Turing Machine. Turing Machines 4/14/2011 IF_UTAMA 1

Reduksi DFA [Deterministic Finite Automata]

SISTEM REKOMENDASI PENENTUAN JUDUL SKRIPSI MENGGUNAKAN ALGORITMA DECISION TREE

TRANSLASI KALIMAT BAHASA INGGRIS KE BAHASA INDONESIA MENGGUNAKAN METODE AUGMENTED TRANSITION NETWORK

Meeting 3_ADS. System Development Life Cycle (SDLC)

Transkripsi:

SENTENCE ANALYSIS WITH ARTIFICIAL INTELLIGENCE MACHINE LEARNING USING FINITE STATE AUTOMATA Yos Merry Raditya Putra Program Studi Teknik Informatika, Unika Soegijapranata Semarang truefalseboy@gmail.com Abstract Sentence pattern in Indonesian is very important. Incorrect pattern can cause misinterpretation and different meaning. The basic sentence pattern consists of subject, predicate, and object (SPO). To analyze the sentence, this project implements Finite State Automata (FSA) algorithm, which is useful to identify the class of words in a sentence. The given sentence processed through parsing process to break down the sentence into array of tokens. The program will then examine the tokens to determine the class of each word. The discovered pattern will be checked against existing vocabularies on the database. If the word exists, the program will return a response in accordance to the existing one. Otherwise, the program will store the word onto a temporary file until it find the class of the word. The Intelligence of the program depends on the number of vocabularies on the database. This program supports learning process, so the more sentences given, the more intelligent it gets. Keywords: finite state automata algorithm, sentence structure, word class, artificial intelligence, machine learning, sentence breaker Pendahuluan Pemrosesan bahasa adalah salah satu bidang ilmu kecerdasan buatan yang mempelajari komunikasi antara manusia dan komputer. Di Indonesia ada beberapa struktur kalimat dasar yang menjadi pedoman berdasarkan karakteristik SPO. Pemeriksaan SPO menjadi salah satu dasar untuk menulis kalimat bahasa Indonesia sesuai dengan aturan EYD. Untuk menentukan struktur SPO yang benar, maka pengetahuan yang diperlukan adalah mengetahui kelas kata, sebelum masuk ke dalam struktur SPO kalimat. Untuk mengatasi ini, algoritma finite state automata berguna untuk memeriksa kata berimbuhan yang akan dikategorikan dalam kelas kata. Dengan konsep yang jelas dari kelas kata akan mendapatkan struktur kalimat yang benar. Tujuan utama dari program ini adalah untuk menentukan struktur kalimat dengan pedoman kelas kata dan karakteristik SPO. Semakin banyak data yang diinputkan, program akan semakin cerdas dalam menentukan kelas kata karena ada proses pembelajaran di dalamnya. 1

Penelitian tentang struktur SPO kalimat dan kata kelas telah banyak diteliti. Banyak metode dan berbagai algoritma yang digunakan untuk memecahkan dan merumuskannya. Metode dengan penyelesaian finite state automata yang belum pernah digunakan atau dilakukan dalam penelitian sebelumnya untuk menyelesaikan dan menentukan struktur kalimat dan kata kelas dan menggunakan metode meletakkan file sementara untuk proses pembelajaran dalam penentuan program kelas kata. Ada tiga kelas untuk mendefinisikan kata dalam program, yaitu kata benda, kata sifat dan kata kerja. Dalam tiga kelas kata-kata berikut, program ini dapat menentukan struktur kalimat subjek, frase subjek, predikat dan frase predikat dalam kalimat.menentukan kelas kata menggunakan algoritma finite state automata dan metode pembelajaran dari file sementara, semakin program ini akan lebih canggih, dan dapat menentukan banyak kelas kata. Dengan begitu banyak kelas kata yang dapat didefinisikan oleh program, struktur kalimat dapat diketahui. Landasan Teori Algoritma Finite State Atomata Finite state automata adalah mesin abstrak berupa sistem model matematika dengan masukan dan keluaran diskrit yang dapat mengenali bahasa paling sederhana (bahasa reguler) dan dapat diimplementasikan secara nyata. Finite State Automata (FSA) adalah model matematika yang dapat menerima input dan mengeluarkan output yang memiliki state yang berhingga banyaknya dan dapat berpindah dari satu state ke state lainnya berdasarkan input dan fungsi transisi. Finite state automata tidak memiliki tempat penyimpanan/memory, hanya bisa mengingat state terkini. Finite State Automata dinyatakan oleh pasangan 5 tuple, yaitu: M=(Q, Σ, δ, S, F ) Q = himpunan state Σ = himpunan simbol input δ = fungsi transisi δ : Q Σ S = state awal / initial state, S Q F = state akhir, F Q 2

Salah satu contoh diagram finite state automata yang program ini buat adalah kata benda seperti di bawah ini: Gambar 1: Diagram FSA Kata Benda Metodologi Penelitian Dalam pelaksanaan program ini, ada beberapa langkah yang harus diambil. Berikut adalah beberapa langkah. 1. Data Finding: Mengumpulkan data referensi yang dapat digunakan dalam program ini termasuk algoritma dan struktur data yang harus digunakan. Membandingkan algoritma yang sama dan mencari keuntungan dan kerugian dari masing-masing algoritma. 2. Analysis and learning: Menganalisis masalah yang akan terjadi dan bagaimana mengatasinya untuk tetap menjalankan projek. Belajar tata bahasa Indonesia dan membuat percobaan yang mungkin dibuat dalam program, membuat rumus yang diperlukan. 3. Implementing: Menerapkan struktur data, algoritma dan user interface. Pelaksanaan proses pembelajaran di program ini berjalan atau tidak. Analisis dari setiap kata menggunakan rasio dari brain file yang ada dan menggunakan algoritma FSA. Memperbaiki bugs selama proses program. Penggunaan pembelajaran yang tepat dan mencari celah untuk setiap rumus yang akan dibuat. 3

4. Testing: Menguji semua proses dari langkah pertama sampai terakhir. Semua metode pengujian harus berfungsi tanpa bugs. Ketika ada bugs, akan kembali ke langkah kedua untuk memperbaiki program. Hasil dan Pembahasan Seperti yang terlihat pada gambar, program ini akan mendapatkan input dari user. Input harus kalimat bahasa Indonesia. Setelah kalimat dimasukkan, program akan memproses input dengan menganalisis pola yang ada. Setelah mendapatkan hasil, data akan disimpan. Selanjutnya hasil analisis akan ditampilkan kepada user. Gambar 2: Use Case Diagram Program akan menganalisis kalimat dan kemudian menampilkan hasilnya. Karena hasil analisis program bergantung pada kalimat yang user inputkan, maka ada beberapa tes untuk menguji bagaimana program kerja dengan memasukkan kalimat yang memiliki kelas kata berbeda. Analisis struktur kalimat yang mengandung kelas kata tertentu di beberapa bagian dalam kalimat, kata-kata tertentu yang mingkin dikenali oleh program. 4

Tabel 1: Daftar Percobaan Kalimat No 1 2 3 4 5 6 7 8 9 10 11 Sentence Subject/ Predicate/ Information Subject Phrase Predicate Phrase lukisan bergerak lukisan bergerak Predikat verbal hidupnya hidupnya menyenangkan menyenangkan Predikat verbal Predikat belum terdefinisi, Predikat adjektival ayahnya petani ayahnya petani Predikat nominal budi telah pergi budi telah pergi predikat verbal hanry masih hanry masih tidur lelap tidur lelap predikat verbal, tidur lelap adalah frase verbal kita akan pergi kita akan pergi jauh jauh predikat verbal, pergi jauh adalah frase verbal penari itu berlari penari itu berlari predikat verbal pesulap itu pesulap itu predikat adjektival hidup ini indah hidup ini predikat belum terdefinisi Tabel 2: Percobaan untuk Pembelajaran Program Input Sentence 1 2 3 4 5 Define Undefined Information Predikat belum terdefinisi Gambarnya, Predikat adjektival putrinya cantik putrinya cantik Predikat belum terdefinisi putrinya sangat cantik Putrinya, cantik predikat adjektival putrinya cantik Putrinya, cantik Predikat adjektival 5

Kesimpulan Algoritma finite state automata dapat menentukan kelas kata kerja dan kelas kata benda berdasarkan konteks kalimat. Menggunakan rumus preposisi untuk menentukan kata sifat membuat program dapat belajar kata baru yang diinputkan oleh user. Proses pembelajaran di program ini dapat membantu untuk menentukan subjek, frase subjek, predikat dan frase predikat yang masih belum diketahui program. Dengan ini, program dapat menentukan kelas kata dari setiap kata dalam kalimat inputan oleh user dan untuk mengetahui struktur kalimat. Semakin banyak kata-kata yang telah disimpan oleh program, program semakin cerdas dalam menentukan kelas kata dan struktur kalimat. Program ini dapat menganalisis tiga kelas kata, yaitu kata sifat, kata kerja dan kata benda dan struktur kalimat hanya subjek, frase subjek, predikat dan frase predikat. Selanjutnya, program ini dapat dikembangkan dengan kelas kata yang lebih lengkap dan begitu juga dengan struktur kalimatnya. Daftar Pustaka [1] Gopalakrishnan, Computation Engineering : Applied Automata Theory and Logic, Ganesh, New York : Springer, 2006. [2] Gorys, Tata Bahasa Rujukan Bahasa Indonesia, Jakarta: PT Gramedia. [3] Hopcroft, John E. et al, Introduction to Automata Theory, Languages, and Computation, 2nd Edition, New York: Addison-Wesley, 2001. [4] Kosasih, Dr.E., Kompetensi Ketatabahasaan dan Kesusastraan, Bandung: CV YramaWidya, 2003. [5] Kusno, B.S., Tata Bahasa Indonesia, Bandung: CV Rosda. 1985. [6] Ramlan, M., Sintaksis. Yogyakarta: CV Karyono. 1987. [7] Sudaryanto, Predikat Objek dalam Bahasa Indonesia, Yogyakarta: Djambatan. [8] Sugono, Dendy, Berbahasa Indonesia dengan Benar. Jakarta: Puspa Swara. 1994. [9] Tarigan, Henry Guntur, Prinsip-prinsip Dasar Sintaksis, Bandung: Angkasa. 1983. [10] HeruCahyaRustamadji, Teori Bahasa dan Otomata, Fakultas Teknik Industri Universitas Pembangunan Nasional, 2004. 6