ANALISIS PEMBENTUKAN WORD GRAPH KATA KERJA MENGGUNAKAN METODE KNOWLEDGE GRAPH AKHMAD MUSLIK SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini saya menyatakan bahwa tesis dengan judul Analisis Pembentukan Word Graph Kata Kerja Menggunakan Metode Knowledge Graph adalah karya saya dengan arahan dari komisi pembimbing dan belum pernah diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan oleh penulis lain telah disebutkan dalam teks dan dicantumkan dalam daftar pustaka di bagian tesis ini. Bogor, Agustus 2009 Akhmad Muslik NRP G551070561
ABSTRACT AKHMAD MUSLIK. An Analysis On Word Graph Formation Of Verb Using Knowledge Graph Method. Under supervision of SRI NURDIATI and FARIDA HANUM. Knowledge graph is a method which used to understand a natural language. Knowledge graph method systematically represents relations of words that explain many objects to be constructed in a graph pattern. In knowledge graph every word has a corresponding word graph, expressing the meaning of the word. The aim of this research is to analyze the structure of Indonesian verbs, to construct the formation rule of word graph of verb, and to test its rule. In this research, verbs had been analyzed using Indonesian grammar. The result of this project shows that every Indonesian verb has different systematic pattern, which represented in word graph. Finally, the systematic pattern that had been tested was used to produce a kind of a word graph for any Indonesian verb. Keywords : knowledge graph, word graph, and verb
RINGKASAN AKHMAD MUSLIK. Analisis Pembentukan Word Graph Kata Kerja Menggunakan Metode Knowledge Graph. Dibimbing oleh SRI NURDIATI dan FARIDA HANUM. Pada saat ini telah berkembang cabang ilmu bahasa komputasi berupa teknologi Natural Language Processing (NLP). Teknologi NLP adalah teknologi yang memungkinkan untuk melakukan transaksi bahasa alami, yaitu bahasa yang biasa disampaikan oleh manusia. Salah satu metode baru dalam NLP yang sedang diteliti adalah knowledge graph (KG). Metode ini mencoba melakukan tinjauan dalam menggambarkan atau menjelaskan bahasa dengan cara menganalisis teks secara harfiah dan diperkaya dengan latar belakang pengetahuannya sehingga menghasilkan sebuah pengetahuan baru (Zhang 2002). Pada penelitian selanjutnya, metode knowledge graph menjadi objek pembahasan yang penting, karena cara menganalisisnya memperhatikan teks berdasarkan semantik (arti kata). Beberapa penelitian tentang KG terutama yang berkaitan dengan bahasa Indonesia sudah pernah dilakukan tetapi belum sepenuhnya menyentuh secara spesifik aturan bagaimana kata benda, kata kerja, kata sifat, maupun preposisi dirumuskan word graphnya. Perancangan aturan untuk semua jenis kata agar terbangun word graph bukanlah sesuatu yang mudah dan cepat, melainkan perlu waktu yang relatif lama dan kerja keras. Oleh karena itu, penulis tertarik melakukan penelitian tentang KG dan membatasinya pada aturan pembentukan word graph kata kerja. Tujuan dari penelitian ini adalah pertama, menganalisis struktur kata kerja dalam bahasa Indonesia, kedua merancang aturan pembentukan word graph kata kerja, dan ketiga menguji aturan pembentukan word graph kata kerja Kelas kata dalam bahasa Indonesia yang dikaji dalam tulisan ini adalah kata kerja (verba). Kata kerja (bahasa Latin: verbum, "kata") atau verba adalah kelas kata yang menyatakan suatu tindakan, keberadaan, pengalaman, atau pengertian dinamis lainnya. Menurut Keraf (1984), kata kerja adalah segala macam kata yang dapat diperluas dengan kelompok kata dengan + kata sifat. Jenis kata ini biasanya menjadi predikat dalam suatu frasa atau kalimat. Berdasarkan objeknya, kata kerja dapat dibagi menjadi dua: kata kerja transitif yang membutuhkan pelengkap atau objek seperti memukul (bola), serta kata kerja intransitif yang tidak membutuhkan pelengkap seperti lari. Dalam graf, konsep diinterpretasikan dengan node. Menurut van den Berg (1993), konsep dapat dinyatakan dalam bentuk token (simbol, tanda, karakteristik, dsb), type, dan name. Token adalah konsep yang dipahami oleh seseorang menurut cara pandangnya masing-masing, hal ini berakibat adanya unsur subjektivitas. Misalnya ketika berhadapan dengan kata rambutan maka akan muncul dalam pikiran masing-masing orang bisa rasa, bentuk, warna, dan sebagainya. Token dalam KG dilambangkan dengan, yang menandakan adanya sebuah konsep dan dapat disejajarkan dengan fungsi argumen dalam logika. Adapun type dan name memiliki kondisi yang hampir sama, keduanya dapat dibedakan dari relasi yang menghubungkannya dengan token. Type merupakan konsep yang berupa
informasi umum dan bersifat objektif karena ada kesepakatan sebelumnya, sedangkan name adalah sesuatu yang bersifat individual. Dalam teori KG terdapat aspek ontologi sebagai gambaran beberapa konsep dan relasi antarkonsep yang dimaksudkan untuk mendefinisikan ide-ide yang merepresentasikan konsep, relasi, dan logikanya. Dengan cara seperti ini sebuah model dapat dibangun untuk memahami bahasa alami. Teori KG memperkenalkan ontologi word graph berupa token yang dinyatakan dengan node, 9 binary relationships, dan 4 frame relationships. Sembilan relasi itu adalah relasi kesamaan (ALIKENESS/ALI), relasi kausalitas (CAUSALITY/CAU), relasi kesederajatan (EQUALITY/EQU), relasi yang bertautan (SUBSET/SUB), relasi perbedaan (DISPARATENESS/DIS), relasi yang berurutan (ORDERING/ORD), relasi atribut (ATTRIBUTE/PAR), relasi ketergantungan informasi (SKOLEM/SKO), dan ontologi FOCUS (F). Kemudian 4 frame relationshipnya yaitu: FPAR, NEGPAR, POSPAR, dan NECPAR. Pada penelitian ini awalnya penulis melakukan kajian literatur bahasa Indonesia, yakni mengumpulkan teks-teks yang menitikberatkan pada tema pertanian, kemudian melakukan kodifikasi kata kerja yang digunakan dalam penulisan teks tersebut. Tahap selanjutnya penulis menganalisis struktur kata kerja tersebut dengan melakukan tinjauan menggunakan kamus dan tata bahasa Indonesia. Dari hasil analisis itu, ada beberapa aturan struktur kata kerja yang masing-masing memiliki perbedaan pola. Dari sini, dimulai membuat aturan pembentukan word graph kata kerja. Pembentukan word graph kata kerja ini berdasarkan pada pola-pola yang sudah dianalisis di atas. Hasil pembentukan word graph ini diakhiri dengan melakukan pengujian atas word graph yang sudah dibentuk agar didapat aturan word graph yang umum. Langkah ini sebagai langkah terakhir pada penelitian ini. Hasil penelitian menunjukkan bahwa setiap kata kerja mempunyai aturan tersendiri dalam merumuskan pembentukan word graph meskipun tidak menutup kemungkinan hasilnya ada yang sama, pembentukan word graph kata kerja bertolak pada aturan afiksasi yang melingkupinya, pada proses pembentukan word graph kata kerja dapat dibuat pola umum pembentukan word graph kata kerja tersebut berdasarkan kelompok afiksasinya yang berjumlah 10 pola. Dari hasil pengujian didapat pola umum pembentukan word graph kata kerja yang menjadi dasar pembentukan word graph kata kerja lain yang strukturnya sama. Kata Kunci: natural language processing, knowledge graph, word graph, kata kerja
ANALISIS PEMBENTUKAN WORD GRAPH KATA KERJA MENGGUNAKAN METODE KNOWLEDGE GRAPH AKHMAD MUSLIK Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Departemen Matematika SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009
PRAKATA Segala puji bagi Allah SWT, Tuhan semesta alam, atas segala rahmat dan karunia-nya sehingga karya ilmiah ini dapat diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan pada bulan Juni 2009 ini adalah masalah Pembentukan Word Graph Kata Kerja dengan Menggunakan Metode Knowledge Graph. Penulis mengucapkan terima kasih kepada Ibu Dr. Ir. Sri Nurdati, M.Sc dan Ibu Dra. Farida Hanum, M.Si, atas bimbingannya dalam penulisan karya ilmiah ini. Terima kasih penulis sampaikan kepada Bapak Drs. Prapto Tri Supriyo, M.Kom yang telah memberikan banyak saran selaku penguji luar komisi. Tidak lupa pula penulis sampaikan ucapan terima kasih kepada Departemen Agama Republik Indonesia yang telah memberikan beasiswa. Akhirnya ucapan terima kasih penulis sampaikan kepada ibu tercinta atas doa yang tak letih, keluarga, serta pihak lain yang telah membantu baik moril maupun materil sehingga karya ilmiah ini dapat diselesaikan. Semoga karya ilmiah ini bermanfaat. Bogor, Agustus 2009 Akhmad Muslik
Judul Tesis Nama NRM : Analisis Pembentukan Word Graph Kata Kerja Menggunakan Metode Knowledge Graph : Akhmad Muslik : G551070561 Disetujui Komisi Pembimbing Dr. Ir. Sri Nurdiati, M.Sc. Ketua Dra. Farida Hanum, M.Si. Anggota Diketahui Ketua Program Studi Matematika Terapan Dekan Sekolah Pascasarjana IPB Dr. Ir. Endar H. Nugrahani, M.S. Prof. Dr. Ir. Khairil A. Notodiputro, M.S. Tanggal Ujian: 28 Agustus 2009 Tanggal Lulus:
RIWAYAT HIDUP Akhmad Muslik, lahir di Brebes 27 tahun lalu, tepatnya 16 Mei 1981, adalah putra bungsu dari pasangan Bapak Murdi (alm) dan Ibu Hasanah. Menyelesaikan studinya pada tingkat dasar (SD) di SDN 01 Kaligangsa Kulon Brebes tahun 1994, kemudian MTs RU Tegal lulus 1998, dan melanjutkan MA (SMA) di Kaliwungu Semarang tamat tahun 2000. Rampung dari MA, hijrah ke Jakarta untuk kuliah di jurusan pendidikan matematika Universitas Islam Negeri (UIN) Syarif Hidayatullah. Selesai dari UIN Jakarta (2004), mengajar di MTs Nurul Hidayah Cilandak Timur Jakarta Selatan hingga sekarang. Pada tahun 2006, melanjutkan studi Magister Penelitian dan Evaluasi Pendidikan Program Pascasarjana UHAMKA, lulus 2008. Selain itu, di tahun 2007 mendapatkan beasiswa Departemen Agama melanjutkan studi S2 di Institut Pertanian Bogor (IPB) pada departemen Matematika, FMIPA, lulus 2009. Saat ini, aktivitas sehari-hari mengajar di MTs Nurul Hidayah Jakarta serta memegang jabatan wakil kepala sekolah bidang kurikulum di sekolah yang sama.
Hak Cipta milik Institut Pertanian Bogor, tahun 2009 Hak Cipta dilindungi Undang-undang 1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber a Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah. b Pengutipan tidak merugikan kepentingan yang wajar Institut Pertanian Bogor. 2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis dalam bentuk apapun tanpa izin Institut Pertanian Bogor.