Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia

dokumen-dokumen yang mirip
SKRIPSI. Triastuti Chandrawati

EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL

UKDW BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

1. PENDAHULUAN 1.1 Latar belakang Masalah

Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi

BAB I PENDAHULUAN 1.1 Latar Belakang

TUGAS AKHIR. Disusun oleh : SUSI SETYOWATI

PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM.

BAB I PENDAHULUAN! 1.1 Latar Belakang

PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL

PREDIKSI JEDA PADA UCAPAN BAHASA MELAYU PONTIANAK DENGAN MENGGUNAKAN METODE SHALLOW PARSING

IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING

BAB I PENDAHULUAN. dan bukan suatu khayalan yang tidak tampak (Language may be form and not

Analisis Sentimen pada Opini Mahasiswa Menggunakan Natural Language Processing

PART-OF-SPEECH TAGGING UNTUK BAHASA INDONESIA MENGGUNAKAN STANFORD POS-TAGGING

BAB I PENDAHULUAN. Manusia sebagai mahluk sosial yang senantiasa harus berkomunikasi

PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA

PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA

Implementasi Opinion Mining (Analisis Sentimen) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi

APLIKASI PENENTUAN JENIS PART OF SPEECH MENGGUNAKAN METODE N-GRAM DAN STRING MATCHING

DAFTAR ISI. ABSTRAK... i. KATA PENGANTAR... ii. UCAPAN TERIMA KASIH...iii. DAFTAR ISI... vi. DAFTAR TABEL... ix. DAFTAR GAMBAR...x

SENTENCE ANALYSIS WITH ARTIFICIAL INTELLIGENCE MACHINE LEARNING USING FINITE STATE AUTOMATA

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

POS Tagger Tweet Bahasa Indonesia

Pengantar Kecerdasan Buatan (AK045218) Bahasa Alami 1

NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan)

PELESAPAN FUNGSI SINTAKTIK DALAM KALIMAT MAJEMUK BAHASA INDONESIA THE ELLIPIS OF THE SYNTACTIC IN THE INDONESIAN LANGUANGE COMPOUND SENTENCE

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

BABI PENDAHULUAN. 1.1 Latar Belakang

2.5 Context-Free Grammar (CFG) LALR Parser Bab 3 Metodologi Penelitian Studi Literatur Desain Sistem P

BAB I PENDAHULUAN. sendiri, menyatakan makna yang lengkap dan mengungkapkan suatu

Penggunaan Named Entity Recognition dan Artificial Intelligence Markup Language untuk Penerapan Chatbot Berbasis Teks

APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING

KONSTRUKSI ATURAN PENGGABUNGAN DUA GRAF KALIMAT (The Construction of a Rule to Combine Two Sentence Graphs)

Sistem Wawancara Virtual untuk Penerimaan Mahasiswa Jurusan Teknik Informatika di ITHB dengan Metode Natural Language Processing

PENENTUAN KELAS KATA PADA PART OF SPEECH TAGGING KATA AMBIGU BAHASA INDONESIA

BAB I PENDAHULUAN 1.1 Latar Belakang

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN :

Natural Language Processing

BAB I PENDAHULUAN. Inggris bahasa Madura Enggi Bunten. Madura yang digunakan untuk berkomunikasi dalam kehidupan seharihari.

PERBANDINGAN KLAUSA INTI DAN KLAUSA SEMATAN BAHASA INDONESIA DAN BAHASA INGGRIS. Oleh. Suci Sundusiah

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

PEMBELAJARAN SINTAKSIS BAGI PEMBELAJAR ASING YANG BERBAHASA PERTAMA BAHASA INGGRIS

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

BAB I PENDAHULUAN. gramatikal dalam bahasa berkaitan dengan telaah struktur bahasa yang berkaitan. dengan sistem kata, frasa, klausa, dan kalimat.

BAB I PENDAHULUAN. Di dalam bahasa Inggris terdapat kelas kata yang disebut part of speech.

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA

Penguraian Dependensi Kalimat Bahasa Jepang dengan Penerapan Kendala pada Algoritma Exhaustive Search

ANALISIS KLAUSA DALAM SURAT KABAR HARIAN MEDIA INDONESIA. Oleh: Rismalasari Dalimunthe ABSTRAK

ANALISIS SINTAKTIS DAN SEMANTIS MOTO IKLAN ROKOK BERBAHASA INGGRIS SKRIPSI

PENGGUNAAN FRASA DAN KLAUSA BAHASA INDONESIA DALAM KARANGAN SISWA SEKOLAH DASAR

BAB I PENDAHULUAN. I.1 Latar Belakang

BAB 3 ANALISIS DAN PERANCANGAN

ANALISIS KESALAHAN PENGGUNAAN BAHASA INDONESIA OLEH SISWA ASING Oleh Rika Widawati

PEMBUATAN MODEL NAMED ENTITY RECOGNITION UNTUK TWITTER BAHASA INDONESIA DENGAN MENGGUNAKAN STANFORD NER

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

PENERJEMAHAN DOKUMEN INGGRIS-INDONESIA MENGGUNAKAN MESIN PENERJEMAH STATISTIK DENGAN WORD REORDERING DAN PHRASE REORDERING

ANALISIS RAGAM KALIMAT DAN LEVEL KEMAHIRAN MENULIS BAHASA INDONESIA DALAM KARANGAN MAHASISWA JURUSAN ASEAN STUDIES WALAILAK UNIVERSITY THAILAND

Penerapan Metode Left Corner Parsing dalam Aplikasi Terjemahan Bahasa Indonesia ke Bahasa Bima

BAB 3 METODOLOGI PENELITIAN

BAB II KAJIAN PUSTAKA

RANCANG BANGUN APLIKASI PENERJEMAH BAHASA INDONESIA BAHASA INGGRIS MENGGUNAKAN METODE RULE BASED

Outline. IKI 40931: Topik Khusus: NLP Kuliah 7: Parsing CFG. Parsing. Contoh parsing. Ruli Manurung. 10 Maret (Bab Jurafsky & Martin)

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Bahasa merupakan salah satu bagian terpenting dalam kehidupan sosial

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. 1.1 Latar belakang

V.1 Tujuan Pengujian. V.2 Perancangan Pengujian

DESKRIPSI LEARNING OUTCOME MATA KULIAH BAHASA INGGRIS TPB 108 PROGRAM MATA KULIAH DASAR UMUM ( MKDU ) INSTITUT PERTANIAN BOGOR 2012

BAB I PENDAHULUAN. klausa bukanlah kalimat karena klausa harus tergabung dengan klausa lainnya

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

KLAUSA KOMPLEMEN DALAM KALIMAT TRANSFORMASI SEMATAN

GARIS-GARIS BESAR PROGRAM PENGAJARAN PROGRAM STUDI : DIII KOMPUTERISASI PERKANTORAN DAN KESEKRETARIATAN Semester : 1

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang dan Permasalahan

PERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA

Gambar 1. Komponen Mesin Translasi Berbasis Statistik

BAB V P E N U T UP. adverbia dalam bahasa Inggris dan bahasa Arab berdasarkan pada tinjauan

BAB I PENDAHULUAN. Manusia sebagai mahkluk sosial yang senantiasa harus berkomunikasi dengan

Parsing dan Konversi Kalimat Tanya Konfirmatif Menjadi Query Sparql Menggunakan Pendekatan Top-Down Parsing

VARIASI KALIMAT DAN JENIS KLAUSA PADA TEKS BIOGRAFI SISWA KELAS VIII DI SMP NEGERI 2 SIDOHARJO SRAGEN

Identifikasi Fitur Laptop beserta Orientasinya dengan Metode Apriori dan Lexicon-Based

BAB I PENDAHULUAN. melakukan suatu komunikasi dan kontak sosial menggunakan bahasa. Bahasa

Algoritma Ekstraksi Informasi Berbasis Aturan

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. yang belum mengecap ilmu pengetahuan di sekolah atau perguruan tinggi

BAB I PENDAHULUAN. menyampaikan suatu informasi yang bermutu atau berinteraksi dengan

Oleh: Denis Ahmad G ( ) Pembimbing:

Analisis Sentimen Twitter untuk Teks Berbahasa Indonesia dengan Maximum Entropy dan Support Vector Machine

Transkripsi:

Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia Abd Wahab Syahroni 1), Joan Santoso 2), Endang Setyati 3) 1,2,3) Teknologi Informasi - Sekolah Tinggi Teknik Surabaya 1) Teknik Informatika - Universitas Madura Surabaya, Indonesia roney@unira.ac.id, joan@stts.edu, endang@stts.edu Abstrak Penelitian yang dilakukan dalam paper ini adalah pembentukan klausa sebuah kalimat Bahasa Indonesia, dengan memanfaatkan teknik chunking RegexpParser dari Natural Language Toolkit dan Rule Based System. Langkah pertama yang dilakukan dalam penelitian ini adalah mengubah level kata hasil part of speech menjadi 5 level frasa, yaitu: NP (Noun Phrase), VP (Verb Phrase), PP (Preposition Phrase), AP (Adjective Phrase) dan ADVP (Adverb Phrase). Mengingat klausa merupakan bagian kalimat yang minimal memiliki unsur Subjek dan Predikat, maka langkah kedua adalah merubah 5 level frasa dengan melihat fungsi dan kedudukannya terhadap kalimat menjadi Subjek (Subj), Predikat (P), Objek (O), Keterangan (K) dan Pelengkap (PEL). Penelitian ini mencapai akurasi hingga 95,3% dan error 4,7% dari 100 kalimat (820 kata) yang telah di ujicoba dengan menggunakan 101 rule. Terjadinya error ini disebabkan tidak adanya rule yang tepat untuk memproses hasil part of speech. Kata kunci: Klausa, frase, chunking, rule based system, part of speech. 1. Pendahuluan Klausa merupakan satuan gramatik yang terdiri dari: Subjek (Subj), Predikat (P), baik disertai Objek (O), Pelengkap (PEL) dan Keterangan (KET) ataupun tidak. Dengan kata lain, klausa ialah Subj-P- (O)- (PEL)-(KET). Tanda kurung menandakan bahwa satuan gramatik yang terletak dalam kurung boleh ada atau tidak. Penentuan satuan gramatik Subjek, Predikat, Objek, Pelengkap dan Keterangan dalam sebuah kalimat membutuhkan frasa. Frasa merupakan merupakan satuan gramatik yang terdiri dari dua kata atau lebih. Frasa merupakan satuan yang tidak melebihi batas fungsi unsur klausa, maksudnya frasa itu selalu terdapat dalam satu fungsi unsur klausa, yaitu: Subj, P, O, PEL, atau KET. Dalam menentukan frasa dan klausa dalam sebuah kalimat Bahasa Indonesia dibutuhkan sebuah alat yang dapat memberi tag terhadap setiap kata dalam kalimat (POS tagger). Beberapa peneliti telah mengembangkan aplikasi POS tagger untuk Bahasa Indonesia, seperti: Wicaksono [1], Pisceldo [2], Triastuti [3], dan Sari [4]. Mengingat hasil akhir dari POS tagger berupa level kata sehingga untuk membuat sebuah frasa harus dilakukan penelitian lanjutan, demikian juga dengan klausa, mengingat klausa memiliki unsur subjek dan predikat, maka hasil dari frasa dapat dijadikan acuan untuk menentukan fungsi frasa tersebut apakah sebagai subjek, predikat, objek, keterangan atau pelengkap. Adapun penelitian mengenai frasa pernah dilakukan oleh Ali dalam Bahasa Inggris[5] dan Bahasa Urdu [6]. Oleh karena itu, dalam penelitian ini juga akan dilakukan pengolahan hasil dari POS tagger yang pernah dilakukan oleh Wicaksono [1] dengan menggunakan bantuan Teknik Chunking dari NLTK [7] dengan membuat rule handmade sehingga dapat menentukan frasa dan klausa dalam sebuah kalimat Bahasa Indonesia. 2. Metode Penelitian Frasa adalah gabungan dua kata atau lebih yang bersifat non predikatif atau lazim juga disebut gabungan kata yang mengisi salah satu fungsi sintaksis di dalam kalimat [8, 9]. Frasa tidak memiliki predikat dalam strukturnya. Frasa merupakan satuan linguistik yang lebih besar dari kata dan lebih kecil dari klausa dan kalimat. Klausa adalah satuan sintaksis berupa runtunan kata-kata berkonstruksi predikatif, artinya, di dalam konstruksi itu ada komponen berupa kata atau frasa yang berfungsi sebagai predikat dan yang lain berfungsi sebagai subjek, objek, dan sebagai keterangan. Klausa merupakan bagian dari kalimat. Klausa memiliki unsur subjek dan predikat. Klausa merupakan unsur kalimat yang mewajibkan adanya dua 598

fungsi sintaksis, yakni subjek (Subj) dan predikat (P) sedang yang lainnya yaitu objek (O), pelengkap (PEL), dan keterangan (K) tidak wajib ada. Berikut ini diberikan 2 contoh kalimat, yang terdiri dari: (1) contoh frasa dan (2) contoh klausa. (1) a. Para guru b. Dosen itu c. Kedua orang itu d. Sedang mengajar e. di kelas (2) Para wanita cantik sedang mengikuti lomba Kalimat (1) memiliki satuan bahasa Para guru, Dosen itu, Kedua orang itu, sedang mengajar, di kelas adalah frasa, karena satuan bahasa tersebut tidak membentuk hubungan subjek dan predikat. Kalimat (2) diatas merupakan klausa dari para wanita cantik sedang mengikuti lomba, yang terdiri dari tiga unsur fungsional, yaitu: unsur para wanita cantik menduduki fungsi subjek (Subj), sedang mengikuti menduduki fungsi predikat (P), dan lomba menduduki fungsi objek (O). 2.1. Penentuan Frasa Frasa dapat ditentukan dengan mengolah output POS tagger menggunakan teknik phrase chunking dengan membuat rule handmade. Rule handmade akan membuat tagset baru dari hasil POS tagger. Tagset baru yang dibentuk adalah sebagai berikut: Tabel 1. Tagset Baru Hasil Rule Hand Made Tagset Arti NP Noun Phrase VP Verb Phrase PP Preposition Phrase AP Adjective Phrase ADVP Adverb Phrase Adapun alur proses penentuan frasa dapat dilihat pada flowchart yang tersedia di Gambar 1. Gambar 1. Proses Penentuan Frasa Pada Gambar 1, input kalimat Bahasa Indonesia akan di proses oleh POS tagger yang menghasilkan output level kata, kemudian phrase chunker akan merubah level kata menjadi level frasa. Jika input kalimat seperti contoh kalimat (2), maka POS tagger menghasilkan output sebagai berikut: para/dt wanita/nn cantik/jj sedang/rb mengikuti/vbt lomba/nn 599

Phrase chunker akan memproses output level kata menjadi level frasa dengan mencocokkan rule handmade yang telah dibuat dengan memanfaatkan teknik chunking RegexpParser dari Natural Language Toolkit[7]. Di bawah ini contoh rule handmade: Rule NP : {<DT><NN><JJ>} Kalimat : para/dt wanita/nn cantik/jj sedang/rb mengikuti/vbt lomba/nn Frasa : para_wanita_cantik/np Rule VP : {<RB><VBT>} Kalimat : para/dt wanita/nn cantik/jj sedang/rb mengikuti/vbt lomba/nn Frasa : sedang_mengikuti/vp Rule NP: {<NN>} Kalimat : para/dt wanita/nn cantik/jj sedang/rb mengikuti/vbt lomba/nn Frasa : lomba/np Sehingga output level frasa dari level kata pada kalimat (2) adalah sebagai berikut: para_wanita_cantik/np sedang_mengikuti/vp lomba/np dan bentuk tree dari hasil level frasa dapat dilihat pada Gambar 2. Gambar 2. Struktur Tree Frasa 2.2. Penentuan Klausa Klausa ditentukan dengan mengolah output level frasa dengan cara menentukan terlebih dahulu posisi subjek, predikat, objek, pelengkap dan keterangan yang dapat dilihat pada flowchart Gambar 3. Gambar 3. Proses Penentuan Klausa 600

Pada Gambar 3, langkah pertama yang dilakukan adalah mencari VP dari input level frasa, jika kalimat mengandung VP, maka kenali tag sebelum VP, ubah NP sebelum VP menjadi Subjek, jika ada PP sebelum VP, ubah PP menjadi keterangan, ubah VP menjadi predikat. Jika setelah VP masih ada tag, maka kenali tag setelah VP, ubah NP setelah VP menjadi Objek, jika ada PP ubah menjadi Keterangan, jika ada AP dan ADVP ubah menjadi Pelengkap. Jika VP sudah tidak ditemukan lagi, susun klausa berdasarkan rule klausa yang telah dibuat. Maka hasil klausa berdasarkan output level frasa di atas adalah sebagai berikut: Input level frasa : para_wanita_cantik/np sedang_mengikuti/vp lomba/np Proses IF-THEN: para_wanita_cantik/subj sedang_mengikuti/p lomba/o Rule KLAUSA: {(<K>+)?<Subj>(<K PEL>+)?<P>(<O PEL K>+)?} dan bentuk tree dari hasil klausa dapat dilihat pada Gambar 4. Gambar 4. Struktur Tree Klausa 2.3. Kategori Kalimat Dalam penelitian ini, kategori kalimat dalam Bahasa Indonesia yang dibahas meliputi: 1. kalimat yang terdiri dari Subj-P Subj-P-O Subj-P-PEL Subj-P-K Subj-P-O-PEL Subj-P-O-PEL-K Subj-P-O-K Subj-P-PEL-K 2. Kalimat fakta/berita 3. Kalimat yang terdiri dari lebih satu kata kerja dan kata benda (kompleks). 4. Kalimat yang memiliki lebih dari satu klausa. 5. Kalimat yang telah di uji sebanyak 100 kalimat (820 kata). Data kalimat yang digunakan bisa didapatkan dari berbagai sumber seperti buku atau berita yang menggunakan bahasa baku. 2.4. Metode Evaluasi Adapun metode evaluasi yang digunakan adalah metode accuracy, yakni mencocokkan antara hasil dari pakar atau buku dengan hasil program mengenai susunan klausa, seperti pada Persamaan (1). Rumus Accuracy = (sum(program benar/ pakar benar) / n Kalimat)) * 100 % (1) Tabel 2. Contoh Perhitungan Metode Accuracy Kalimat Pakar/Buku Program Program benar / Pakar benar Roney makan Subj-P Subj-P 2/2 = 1 Ayah membaca koran Subj-P-O Subj-P-O 3/3 = 1 Budi menyanyi merdu Subj-P-PEL Subj-P-K 2/3 = 0.67 Jumlah 2.67 Banyak Kalimat 3 Accuracy 89 % 3. Hasil dan Pembahasan Algoritma dalam penelitian ini di implementasikan menggunakan bahasa pemrograman Python dengan bantuan Natural Language Toolkit (NLTK) [7]. Algoritma ini diujikan pada kalimat Bahasa Indonesia dengan memberi tag secara manual ke dalam 5 level frasa yaitu NP, VP, PP, AP dan ADVP. Kemudian menentukan kedudukan fungsi sintaksisnya, yaitu: subjek, predikat, objek, keterangan dan pelengkap. 601

Algoritma mencapai rata-rata sukses 95,3%. Algorithma rule handmade untuk frasa Bahasa Indonesia ini bergantung pada hasil identifikasi dari tagset part of speech. Jika part of speech tidak akurat mengidentifikasi input teks atau kalimat, maka artinya akan mempengaruhi efisiensi dan akurasi dari rule handmade yang telah dibuat. Pada awalnya, rule yang sangat terbatas digunakan untuk memproses hasil part of speech menjadi bentuk frasa. Oleh karena itu, akurasi yang diperoleh menjadi rendah, namun ketika jumlah rule di tambah, maka level akurasi menjadi meningkat. Setelah rule mencapai hingga 101 rule, akurasi menjadi 95,3%. Hasil uji coba rule dapat di lihat pada Tabel 3 dibawah ini. Tabel 3. Hasil Rule Akurasi No Jumlah Rule Akurasi (%) 1 20 50 2 30 60 3 50 70 4 101 95,3 Dari Tabel 3 di atas, menunjukkan bahwa tingkat akurasi terus meningkat seiring dengan meningkatnya jumlah rule handmade yang dibuat untuk memproses hasil part of speech menjadi bentuk frasa. Algoritma ini mendapatkan 4,7% error. Error ini disebabkan tidak adanya rule yang tepat untuk memproses hasil part of speech sehingga mempengaruhi hasil selanjutnya. Daftar beberapa hasil rule handmade dapat dilihat pada Lampiran 1. 4. Simpulan Penelitian ini menyajikan sebuah algorithma rule handmade untuk mengolah hasil part of speech tagging kalimat Bahasa Indonesia yang masih berupa level kata menjadi 5 level frasa, yaitu: NP, VP, PP, AP dan ADVP. Algoritma rule handmade untuk frasa Bahasa Indonesia ini bergantung pada hasil identifikasi dari tagset part of speech. Jika part of speech tidak akurat mengidentifikasi input teks atau kalimat, maka artinya akan mempengaruhi efisiensi dan akurasi dari rule handmade yang telah dibuat. Langkah selanjutnya menentukan kedudukan fungsi sintaksis dari 5 level frasa terhadap kalimat menjadi subjek (Subj), predikat (P), objek (O), keterangan (K) dan pelengkap (PEL). Algoritma ini mencapai akurasi hingga 95,3%. Untuk penelitian selanjutnya dapat menggunakan sebuah proses penentuan level frasa yang lebih baik dari rule based system seperti dependency parsing. Daftar Pustaka [1] A.F. Wicaksono and A. Purwarianti. HMM Based Part-of-Speech Tagger for Bahasa Indonesia. On Proceedings of 4th International MALINDO (Malay and Indonesian Language) Workshop, 2nd August 2010. [2] Femphy Pisceldo, Manurung, R., Adriani, Mirna. Probabilistic Part-of- Speech Tagging for Bahasa Indonesia. Third International MALINDO Workshop, Colocated Event ACL-IJCNLP 2009, Singapore, August 1, 2009. [3] Chandrawati, Triastuti. 2008. "Indonesian Part-of-Speech Tagger based on Conditional Random Fields and Transformation based Learning Methods". Undergraduate Thesis. Depok: Fasilkom University of Indonesia, 2008. [4] Sari, Syandra, Herika Hayurani, Mirna Adriani, and Stephane Bressan. Developing Part-of-Speech Tagger for Bahasa Indonesia Using Brill Tagger. The International Second MALINDO Workshop, 2008. [5] A. Ali and M. A. Khan, "Selecting Predicate Logic for Knowledge Representation by Comparative Study of Knowledge Representation Schemes", 2009 International Conference on Emerging Technologies. [6] A. Ali and M. A. Khan, " Knowledge Representation of Urdu Text Using Predicate Logic", 2010 6th International Conference on Emerging Technologies (ICET). [7] S. Bird, E. Klein, and E. Loper, Natural Language Processing with Python. USA: O Reilly Media, Inc., 2009. [8] Ramlan. M., Ilmu Bahasa Indonesia : Sintaksis, CV. Karyono, Yogyakarta. 2005. [9] Supriyadi, Dr. M.Pd. Sintaksis Bahasa Indonesia. UNG Press. Gorontalo. 2014. 602

Lampiran 1 Tabel 4. Daftar Beberapa Hasil Rule Handmade No POS Tagging Frasa Klausa 1 Para/DT guru/nn sedang/rb berkumpul/vbt./. 2 para/dt wanita/nn cantik/jj sedang/rb mengikuti/vbt lomba/nn./. 3 semua/cdi murid/nn berkumpul/vbt di/in lapangan/nn./. 4 Mereka/PRP berjualan/vbi bakmi/jj di/in pasar/nn./. 5 aku/prp sudah/md menghadap/vbt komandan/nnp tadi/rb./. 6 saya/prp memerintahkan/vbt murid/nn untuk/in mengerjakan/vbt tugas/nn fisika/nn di/in halaman/nn 36/CDP./. 7 Petugas/NN bendera/nn mengibarkan/vbt bendera/nn merah/jj putih/jj./. 8 tukang/nn kayu/nn sedang/rb memotong/vbt kayu/nn dengan/in mesin/nn gergaji/nn./. 9 si/rp anton/nnp membantu/vbt menulis/vbt surat/nn./. 10 guru/nn dan/ murid/nn telah/md meninggalkan/vbt sekolah/nn./. 11 semua/cdi anak-anak/nn dan/ guru/nn di/in sekolah/nn berkumpul/vbt di/in aula/nn./. 12 roni/nn makan/vbt dan/ minum/vbt dan/ anton/nnp melihat/vbt televisi/nn dan/ ubed/fw belajar/vbt komputer/nn dan/ jaringan/nn./. NP=Para/DT guru/nn VP=sedang/RB berkumpul/vbt NP=para/DT wanita/nn cantik/jj VP=sedang/RB mengikuti/vbt NP=lomba/NN NP=semua/CDI murid/nn VP=berkumpul/VBT PP=di/IN lapangan/nn NP=Mereka/PRP VP=berjualan/VBI AP=bakmi/JJ PP=di/IN pasar/nn NP=aku/PRP VP=sudah/MD menghadap/vbt NP=komandan/NNP ADVP=tadi/RB NP=saya/PRP VP=memerintahkan/VBT NP=murid/NN VP=untuk/IN mengerjakan/vbt NP=tugas/NN fisika/nn PP=di/IN (NP halaman/nn 36/CDP) NP=Petugas/NN bendera/nn VP=mengibarkan/VBT NP=bendera/NN merah/jj putih/jj NP=tukang/NN kayu/nn VP=sedang/RB memotong/vbt NP=kayu/NN PP=dengan/IN mesin/nn gergaji/nn NP= si/rp anton/nnp VP=membantu/VBT menulis/vbt NP=surat/NN NP=guru/NN dan/ murid/nn VP=telah/MD meninggalkan/vbt NP=sekolah/NN NP=semua/CDI anak-anak/nn dan/ guru/nn PP=di/IN sekolah/nn VP=berkumpul/VBT PP=di/IN aula/nn NP=roni/NN VP=((VP makan/vbt) dan/ (VP minum/vbt)) dan/ NP anton/nnp VP melihat/vbt NP televisi/nn dan/ NP=ubed/FW VP=belajar/VBT NP=komputer/NN dan/ jaringan/nn NP VP NP VP PP NP VP AP PP ADVP VP NP PP PP NP PP VP PP CLAUSE: NP VP CLAUSE: NP VP NP CLAUSE:NP VP NP Subj P Subj P K Subj P PEL K PEL P O K K Subj K P K KLAUSA: Subj P KLAUSA: KLAUSA: 603