BAB II TINJAUAN PUSTAKA
|
|
- Deddy Salim
- 7 tahun lalu
- Tontonan:
Transkripsi
1 BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Empiris Pada penelitian ini, ada beberapa penelitian terkait yang peneliti gunakan sebagai tinjauan studi. Berikut merupakan penelitian penelitian terkait yang pernah dilakukan oleh peneliti lain : a. HMM Based Part-of-Speech Tagger for Bahasa Indonesia (Wicaksono dan Purwarianti, 2010) Pada penelitian ini, ada beberapa metode digabungkan untuk meningkatkan akurasi POS-Tagging untuk Bahasa Indonesia menggunakan metode HMM. Metode pertama adalah menggunakan pohon afiks yang mencakup akhiran kata dan awalan. Metode kedua adalah menggunakan succeeding POS-tag sebagai salah satu fitur untuk HMM. Metode terakhir dengan menggunakan leksikon tambahan (dari KBBI- Kateglo) untuk membatasi tag yang dihasilkan oleh pohon afiks. Model HMM menggunakan token data corpus. Dalam percobaan, menggunakan 15% OOV tes corpus, akurasi terbaik adalah 96,50% dengan 99,4% untuk kata yang terdapat pada kamus dan 80,4% untuk OOV (out of vocabulary) atau kata yang tidak ada dalam kamus. Penelitian menunjukkan bahwa pohon afiks dan leksikon tambahan efektif dalam meningkatkan akurasi POS-Tagger, sedangkan penggunaan succeeding POS-tag tidak memberikan banyak perbaikan pada penanganan OOV. b. POS Tagging Bahasa Indonesia Dengan HMM dan Rule Based (Kathryn Widhiyanti dan Agus Harjoko, 2012) Pelabelan kelas kata bahas Indonesia menggunakan metode Hidden Markov Model dan Rule Based memiliki keakuratan yang tinggi yaitu 100% untuk teks yang ada di dalam corpus. Hasil ini lebih baik daripada hanya menggunakan metode HMM saja yang menghasilkan akurasi 99,29% untuk corpus yang sama. Namun, penelitian ini masih memiliki kekurangan, yaitu belum dapat membedakan kata yang memiliki makna ambigu atau kelas kata ganda. 7
2 8 c. Implementasi Brill Tagger untuk Memberikan POS-Tagging Pada Dokumen Bahasa Indonesia (Viny Christanti, 2012) Program Brill Tagger dapat diimplementasikan dengan baik untuk memberikan kelas kata pada dokumen bahasa Indonesia. Aturan leksikal dan kontekstual yang dihasilkan oleh Brill Tagger dapat digunakan sebagai aturan untuk memberikan kelas kata untuk kalimat bahasa Indonesia dengan nilai akurasi 98,65%. Namun masih terdapat kesalahan aturan sehingga menghasilkan kelas kata yang tidak tepat. Setelah memperbaiki aturan leksikal dan kontekstual akurasi meningkat menjadi 99,75%. Penerapan aturan leksikal dan kontesktual yang tepat dapat meningkatkan keakuratan pelabelan kelas kata. 2.2 Tinjauan Teoritis Part-of-SpeechTagging Part-of-Speech tagging (atau disingkat tagging) merupakan suatu proses memberi tanda (mark) kelas kata pada setiap kata dalam korpus (Jurafsky,2000). Tagging dapat dimanfaatkan pada aplikasi Natural Language Processing seperti : Question and Answering (Q&A), Machine Translation, Text Summarization dll. Penelitian mengenai Part-of-Speech Tagging sudah banyak dilakukan menggunakan berbagai metode seperti : Genetic Brill Tagger (W Joose,2006) dengan nilai akurasi 97% untuk dokumen bahasa Belanda, Hidden Markov Models dan Rule Based (Kathryn & Agus, 2012) dengan nilai akurasi 92,2% untuk dokumen bahasa Indonesia, dan Brill Tagger (Viny,dkk.,2012) dengan nilai akurasi 99,75% untuk dokumen bahasa Indonesia Penentuan Kelas Kata Proses part-of-speech tagging memerlukan kamus/leksikon untuk dapat digunakan dalam penentuan kelas kata. Leksikon merupakan kumpulan kata dasar disertai dengan tag atau kelas katanya. Leksikon dalam bahasa Bali hingga saat ini masih terbatas keberadaannya, sehingga digunakan kumpulan kata dasar yang didapatkan dari dataset sebagai leksikon dalam penelitian. Bentuk penulisan leksikon adalah sebagai berikut :
3 9 Tabel 2. 1 Contoh Lexicon Word Most Frequent Tag Other Possible Tags Bisa NN RB... L1 Lima NN CD... L2 Gunting NN VB... L2 Deretan L1 menunjukkan bahwa kata bisa memiliki most frequent tag NN dan pada suatu kondisi juga dapat diberi tag RB. Deretan L2 menunjukkan bahwa kata lima memiliki most frequent tag NN dan pada suatu kondisi juga dapat diberi tag CD. L3 menunjukkan bahwa kata aji memiliki most frequent tag NN dan pada suatu kondisi juga dapat diberi tag VB. Begitu selanjutnya untuk setiap kata yang terdapat dalam leksikon Morfologi Tata Bahasa Bali Morfologi merupakan bagian dari ilmu bahasa (linguistik) khususnya tata bahasa. Objek analisisnya meliputi satuan gramatikal pada tingkat morfem dan kata. Bagaimana tata bentuk, struktur, dan klasifikasi kata kata adalah merupakan masalah pokok kajian morfologi. Oleh karena itu morfologi juga diperlukan untuk memprediksi kelas kata yang tidak ada di dalam kamus Kelas Kata Menurut (Granoka,dkk.,1984), kata dasar maupun kata turunan dapat dikelompokkan atas suatu kategori atau kelas. Penggolongan kata seperti itu disebut kategori kata atau kelas kata. Penggolongan kategori kata atau kelas kata seperti itu dapat dilakukan dengan melihat prilaku satuan tersebut secara gramatikal dalam tataran yang lebih kompleks yaitu pada tingkat frase maupun kalimat. Secara garis besar, terdapat sejumlah kata yang dapat menduduki fungsi objek dalam suatu kalimat, di samping terdapat pula sejumlah kata yang tidak dapat menduduki fungsi objek, tetapi dapat menduduki fungsi predikat. Untuk kedua kelas kata di atas, diberikan istilah yaitu, kelas kata yang pertama disebut nominal, dan yang kedua disebut adjektiva. Sedangkan kata kata yang lainnya yang tidak dapat digolongkan ke dalam kelas nominal maupun adjektiva dimasukkan dalam suatu kelas kata yang disebut partikel.
4 10 Ketiga kategori atau kelas kata di atas dapat diperinci lagi menjadi beberapa sub kategori. Kelas kata nominal dibedakan menjadi tiga sub kategori, yaitu : kata benda, kata ganti, dan kata bilangan. Kelas kata adjektiva dibedakan menjadi dua sub kategori, yaitu : kata kerja dan kata sifat. Sedangkan kelas kata partikel dapat diperinci menjadi enam sub kategori, yaitu : kata penjelas, kata keterangan, kata penanda, kata perangkai, kata tanya, dan kata seru. Namun, kelas kata yang digunakan dalam penelitian ini disesuaikan dengan kelas kata yang saat ini lebih banyak digunakan dalam bahasa Bali. Sehingga kelas kata penjelas dan penanda tidak digunakan dalam penelitian ini. Penentuan kelas kata menggunakan tagset pada Penn Treebank (Santorini,1991). Kelas kata dalam bahasa Bali jika disesuaikan dengan tag pada Penn Treebank, maka diperoleh kelas kata sifat (JJ), kata keterangan (RB), kata perangkai yang dibagi menjadi konjungtor koordinatif (CC) dan konjungtor subordinatif (CS), kata ganti (PR), kata Tanya (WH), kata benda (NN), kata bilangan (CD), kata seru (UH), dan kata kerja (VB). Ada beberapa kelas kata yang ditambahkan peneliti, yaitu : kelas kata sandang (AR), kata benda khusus (NNP), kata depan (IN), kata asing (FW), tanda baca (TB), dan simbol (SYM). Sehingga total kelas kata yang digunakan dalam kelas kata ini sebanyak 16 kelas kata. Berikut merupakan daftar kelas kata yang dilengkapi dengan deskripsi dan contohnya: Tabel 2. 2 Daftar Kelas Kata yang Digunakan dalam Penelitian Tag Kelas Kata Deskripsi Contoh JJ Adjectiva Kata sifat; kata yang memberi Gede, putih, miik penjelasan tentang suatu benda RB Adverbia Kata Keterangan Teken, olih, lakar AR Artikula Kata Sandang I, Ni, Ipun CC Konjungtor Kata perangkai yang menghubungkan Lan, tur, muah Koordinatif klausa pada kalimat majemuk setara CS Konjungtor Kata hubung pada kalimat majemuk Sawireh, Sane Subordinatif bertingkat PR Pronomina Kata ganti; kata yang dipakai untuk Tiang, ragane, cai, menggantikan kata atau yang ento, ia, niki
5 11 dibendakan WH Kata Tanya Kata yang digunakan untuk Sire, kenapi menanyakan sesuatu NN Nomina Kata benda; kata yang menyebut Sate, umah, gegaen benda atau yang dibendakan NNP Kata Benda Kata benda khusus adalah kata benda Jawa, Jakarta, Ani Khusus yang mewakili suatu entitas tertentu CD Numeralia Kata bilangan; kata yang menyatakan jumlah benda atau jumlah kumpulan Abesik, dadua, seket, karo belah. nama benda IN Preposisi Kata depan; kata yang merangkaikan kata kata atau bagian bagian di, ke, uli, ring, saking kalimat UH Interjeksi Kata seru Ih, beh, aduh, aruh VB Verba Kata kerja; kata yang bermakna melakukan aktivitas atau kegiatan atau Adep, meli, melaib, dingeh lebih jelas kalau dikatakan melakukan pekerjaan FW Kata asing Kata asing Online, handphone TB Tanda baca Tanda baca.,,, ;, (, ),, SYM Simbol Matematika Simbol matematika +, #, $ Kata Berimbuhan Menurut (Granoka,dkk.,1984), kata berimbuhan adalah kata turunan yang dihasilkan melalui proses morfologis dengan penambahan imbuhan. Imbuhan adalah berupa morfem terikat yang dapat dibedakan, menurut tempatnya melekat pada kata dasar, yaitu : prefiks (awalan), infiks (sisipan), sufiks (akhiran), dan konfiks atau disebut juga simulfiks. 1. Prefiks (awalan) Prefiks atau awalan yaitu imbuhan yang terletak di depan kata dasar. Dalam bahasa Bali disebut pengater. Pengater dalam bahasa Bali, yaitu :N-, ma-, ka-, pa-, sa-, a-, pra-, pari-, pati-, maka-, saka-, kuma-.
6 12 Dari penjelasan di atas, akan dibuat aturan imbuhan prefiks yang dirangkum pada tabel berikut : Tabel 2. 3 Aturan Imbuhan Prefiks (Awalan) No Pola Imbuhan Kelas Kata Contoh 1 N- + kata dasar Kata Kerja Ngidih, Ngalih, Ngwangun 2 ma- + kata dasar Kata Kerja Makarya, maburuh, madagang 3 ka- + kata dasar Kata Kerja Kacrita, katulung, kakaplug 4 pa- + kata dasar Kata Benda, Kata Kerja Patakon, pangrasa, padengok 5 sa- + kata dasar Kata Keterangan Sawai, sapeteng, sarahina 6 a-+ kata dasar Kata Benda,Kata Apeteng, adiri, aukud Bilangan 7 pra-+ kata dasar Kata Benda Prabekel, prajani 8 pari- + kata dasar Kata Benda Paribahasa, pariboya 9 pati-+ kata dasar Kata Kerja Patigrape, patijemak 10 maka-+ kata dasar Kata Bilangan Sakaukud, sakabungkul 11 saka- + kata dasar Kata Bilangan Sakabesik, sakatugel 11 kuma-+ kata dasar Kata Benda Kumajaum, kumalipan 2. Infiks (sisipan) Infiks adalah imbuhan yang terletak di tengah kata dasar. Dalam bahasa Bali disebut seselan. Jika sebuah kata dasar memiliki huruf vokal, maka seselan yang ditambahkan sebelum huruf vocal. Sedangkan, jika sebuah kata dasar memiliki huruf konsonan, maka seselan terletak di akhir huruf konsonan pertama pada kata dasar tersebut. Seselan dalam bahasa Bali, seperti :-in-, -um-, -el-, daner-.
7 13 Tabel 2. 4 Aturan Imbuhan Infiks (Sisipan) No Pola Imbuhan Kelas Kata Contoh 1 kata dasar + -in- Kata Kerja Sinurat, tinulung 2 kata dasar + -um- Kata Kerja Tumurun, sumeken 3 kata dasar + -el- Kata Benda Telapak, telusuk 4 kata dasar + -er- Kata Benda Gerudug 3. Sufiks (akhiran) Sufiks adalah imbuhan yang terletak di akhir kata dasar. Dalam bahasa Bali disebut pengiring, yang termasuk pengiring yaitu :-ang,-in, -an, -a, -n, -ing, - é, -né. Tabel 2. 5 Aturan Imbuhan Sufiks (Akhiran) No Pola Imbuhan Kelas Kata Contoh 1 kata dasar + -ang Kata Kerja Nyemakang, alihang, suratang 2 kata dasar + -in Kata Kerja Jagurin, tanemin, tegakin 3 kata dasar + -an Kata Benda Diwangan, ketekan 4 kata dasar + -a Kata Kerja, Kata Abana, batisa Benda 5 kata dasar + -e Kata Benda Temboke, dagange, payuke 6 kata dasar + -ne Kata Benda Umahne, tanahne, gigine Akhiran n dan ing tidak memiliki pola yang pasti karena kedua akhiran ini bukan pembentuk kata. Akhiran n dan ing digunakan sebagai alat untuk menyatakan hubungan antara dua kata dalam bentuk frase secara nyata (eksplesit). Terutama akhiran n diikuti dengan unsur kepemilikan. Berikut adalah contoh akhiran n dan ing : Akhiran n : liman tiange. Akhiran ing : kalaning purnama. 4. Konfiks (awalan dan akhiran) Konfiks adalah gabungan imbuhan terdiri dari dua buah imbuhan yaitu (pangater dan pengiring). Gabungan imbuhan dalam bahasa Bali, seperti : pa-an, ma-an, ka-an, bra-an, dan n-ang.
8 14 Tabel 2. 6 Aturan Imbuhan Konfiks No Pola Imbuhan Kelas Kata Contoh 1 pa + kata dasar + an Kata Benda pasirepan, panyemuhan 2 ma + kata dasar + an Kata Kerja mangkidan, majemakan 3 ka + kata dasar + an Kata Benda kalacuran, karahayuan 4 bra + kata dasar + an Kata Sifat brakapakan, bramahan 5 N + kata dasar + ang Kata Kerja nyenikang, ngamaelang Proses Morfofonemis Sebagai akibat pertemuan sebuah morfem dengan morfem lainnya dapat terjadi suatu perubahan bentuk morfem. Misalnya, morfem N- apabila dipasangkan dengan morfem gae yang berarti kerja, jagur yang berarti pukul sebagai kata dasarnya dapat menghasilkan bentuk baru menjadi ngae yang berarti membuat, nyagur yang berarti memukul. Berikut merupakan daftar perubahan morfem dalam Bahasa Bali (Kamus Bahasa Bali, 1990) : Tabel 2. 7 Daftar Proses Hilangnya Fonem No Bentuk Dasar Berawalan Menjadi Contoh 1 k,g ng kutang ngutang gambar ngambar 2 c,j,s ny cacad nyacad jaring nyaring sampat nyampat 3 t,d n tegul negul dandan nandan 4 p,b m papag mapag batek matek 5 ny,n,m nga + (ny,n,m) nyanggluh nganyanggluh nengneng nganengneng maling ngamaling 6 y,r,l,w ng + (y,r,l,w) yasaang ngyasaang rasa ngrasa lawan nglawan wangun ngwangun 7 vokal ng + vokal alih ngalih ibing ngibing ubuh ngubuh ebet ngebet olah ngolah ejuk ngejuk
9 15 Pada tabel di atas dapat dilihat pembubuhan morfem terhadap bentuk kata dasar berawalan fonem konsonan diikuti dengan meluluhnya fonem konsonan tersebut, sehingga diperoleh rumusan kaidah di atas dengan penjelasan sebagai berikut : 1. Fonem k,g yang mengawali bentuk kata dasar hilang, diluluhkan oleh fonem ng, sebagai akibat pertemuan morfem N- dengan bentuk dasarnya. 2. Fonem c,j,s yang mengawali bentuk kata dasar hilang, diluluhkan oleh fonem ny, sebagai akibat pertemuan morfem N- dengan bentuk dasarnya. 3. Fonem t,d yang mengawali bentuk kata dasar hilang, diluluhkan oleh fonem n, sebagai akibat pertemuan morfem N- dengan bentuk dasarnya. 4. Fonem p,b yang mengawali bentuk kata dasar hilang, diluluhkan oleh fonem m, sebagai akibat pertemuan morfem N- dengan bentuk dasarnya Brill Tagger Brill Tagger diperkenalkan pertama kali oleh Eric Brill pada tahun Algoritma ini mencapai tingkat akurasi 95% pada tagging bahasa inggris (Bjerva,2013). Secara umum Brill Tagger disebut juga Transformation-based Error-driven Learning (TEL). Faktanya Tagger adalah dasar transformation atau rules dan belajar dari mendeteksi nilai errors. Pada gambar 2.1 deskripsi dari TEL yaitu pertama input merupakan unannotated text kemudian diberi tag inisialisasi dan keluaran dari inisialisasi adalah inisialisasi pada temporary corpus (TC) yang akan dibandingkan dengan corpus tujuan (training corpus). Temporary corpus menghasilkan rule baru dan rule dihasilkan secara berurutan. Brill Tagger melakukan pemberian anotasi pada corpus dengan duaaturan, yaitu :Aturan leksikal untuk memberi tag pada unknown word dan aturan kontekstual untuk memperoleh aturan yang meningkatkan akurasi dari perbaikan skor. Kedua aturan ini menggunakan dua jenis corpus, yaitu corpus tujuan (training corpus) dan corpus sementara (Temporary ) untuk meningkatkan akurasi rule yang dihasilkan tahap demi tahap. Brill Tagger dengan metode rule based banyak dilatih untuk berbagai macam bahasa, seperti Inggis, Belanda, dan Indonesia. Dalam bahasa Indonesia telah tersedia rule based Tagger-nya, tetapi untuk bahasa Bali belum tersedia. Oleh karena itu, pada penelitian ini akan dilakukan proses training terlebih dahulu
10 16 sehingga aturan seperti aturan leksikal sebagai rule based Tagger untuk bahasa Bali dapat terbentuk. Algoritma Brill Tagger terdiri dari (Christanti,2012) : 1. Proses Inisialisasi a. Known words (di dalam kosakata) : menentukan tag yang paling sering diberikan ke suatu bentuk kata. b. Uknown word (di luar kosakata) : Kata benda umum (NNP) jika diawali dengan huruf kapital dan kata benda lainnya (NN) jika sebaliknya. 2. Fase Pembelajaran a. Pengulangan dalam menghitung nilai kesalahan dari setiap calon aturan (perbedaan antara jumlah kesalahan sebelum dan sesudah menerapkan aturan). b. Pilih aturan yang terbaik (skor yang lebih tinggi). c. Tambahkan dalam daftar aturan dan diterapkan pada teks. d. Ulangi sampai tidak ada aturan yang memiliki skor di atas ambang tertentu atau yang telah diberikan (jika ambang yang dipilih adalah nol). Unannotated corpus Initial state annotator Temporary corpus Lexical / Contextual Learner Goal corpus Rules Gambar 2. 1 Error-driven learning module(brill,1995) Pada aturan leksikal, corpus tujuan adalah daftar kata yang terdiri dari informasi mengenai frekuensi tag pada training corpus. Kemudian corpus
11 17 sementara (temporary corpus) adalah daftar kata yang sama dengan corpus tujuan. Pada aturan kontekstual, corpus tujuan adalah training corpus yang di tag secara manual dan copus sementara menampung perbaikan jika masih terjadi error atau skor belum mencapai threshold. Berikut merupakan contoh dari Transformationbased Error Driven Learning(Brill,1995). Pada gambar 2.2 diasumsikan ada 4 transformasi (T) yang mungkin, yaitu T1 T4. Training corpus yang belum di tag diproses pada tahap inisialisasi dan menghasilkan errors = 5,100, diperoleh dari membandingkan keluaran dari inisialisasi dengan tag manual corpus. Selanjutnya, transformasi yang mungkin yang digunakan, yaitu T2 yang mengalami reduksi error tertinggi pada pembelajaran pertama dan pembelajaran selanjutnya T3 yang mengalami reduksi error tertinggi. Transformasi berhenti saat nilai skor sudah mencapai threshold. Unannotated Errors = 5,100 T1 Errors = 3,310 Errors = 1,410 Initial State Annotator T1 T2 Errors = 3,145 T2 T3 Errors = 2,110 T1 T2 Errors = 1,251 Errors = 5,100 T3 T4 Errors = 3,910 Errors = 6,300 T4 Errors = 1,231 Errors = 4,255 T3 T4 Errors = 1,231 Errors = 1,231 Gambar 2. 2 Contoh Transformation-based Error Driven Learning(Brill,1995) Pembelajaran Aturan Leksikal Pada aturan leksikal adalah menemukan aturan (rule) untuk memberi tag pada kata dengan most likely tag pada training corpus. Contohnya adalah tag kata dengan tag yang memiliki nilai probabilitas tertinggi atau frekuensi tertinggi. Permasalahan yang muncul adalah menentukan tag pada unknown word.
12 18 Dalam mempelajari aturan leksikal, diperlukan smallwordtaglist yang terdiri dari kata-kata pada small corpus yang sudah diberi tag secara manual, berfungsi sebagai goal corpus dan mengandung frekuensi setiap word. Freq (W, T) digunakan untuk menghitung most likely tag T untuk word W. P(T W) = Freq(W,T) / Freq(W) 2.1 Selain smallwordtaglist, dalam aturan leksikal juga digunakan bigwordlist dan bigbigramlist. Bigwordlist mengandung semua word yang muncul pada corpus yang belum diberi tag (unannotated corpus). Sedangkan, bigbigramlist adalah list yang berisi semua pasangan word (bigram) dalam unannotated corpus. Pada fase training, pertama-tama dibuat word list dari smallwordtaglist yang sudah dibuat, namun kali ini tagnya dihilangkan. Tag setiap kata di-assign dengan inisialisasi default most likely tag (NNP untuk kata yang diawali dengan huruf kapital dan NN untuk kata yang tidak diawali dengan huruf kapital). Word list yang didapat dari initial temporary corpus TC 0 dinamakan WL 0. Setelah itu, generate Permissable Rules (PR) dari semua kemungkinan instansiasi dari lexical template (smallwordtaglist) yang sudah ditentukan, lalu hitung skor untuk setiap rule R pada PR. Rule dengan skor tertinggi menjadi rule nomor satu pada output. Dengan mengaplikasikan rule tersebut, WL 0 sekarang menjadi WL 1.Lanjutkan dengan menghitung skor semua rule pada PR, kemudian pilih satu rule dengan skor tertinggi, outputkan rule ini sebagai rule nomor dua dan aplikasikan pada WL 1 untuk memperoleh WL 2. Proses ini terus diulangi sampai tidak ada lagi rule yang dapat dipilih yang skornya lebih besar dari nilai threshold. Menghitung skor pada rule: Misalkan terdapat rule R dengan template: if Trigger then change X to tag Y, dan w adalah word pada WL i dengan tag sebelumnya X yang memenuhi kondisi rule R. Maka, skor R adalah P(Y w) - P(X w) untuk word w. Total skor R diperoleh dari menjumlahkan semua skor word. skor(r) = 2.2 Misalkan terdapat rule R dengan template: if Trigger than change current tag to tag Y,
13 19 dan w adalah word pada WL i yang memenuhi kondisi rule R, maka skor R adalah P(Y w) - P(current tag of w w) untuk word w. Total skor R diperoleh dari menjumlahkan semua skor word. skor(r) = 2.3 Skor yang diperoleh R akan selalu berbentuk P(new tag w) - P(old tag w). Skor positif menunjukkan tag yang baru more likely dibandingkan tag sebelumnya, sedangkan skor negatif menunjukkan tag yang baru less likely dibanding tag sebelumnya. Kondisi triggernya dites dengan menggunakan bigwordlist dan bigbigramlist, dan perhitungan probabilitas digunakan frekuensi pada smallwordtaglist. Lexical rule yang didapatkan dari modul pembelajaran leksikal ini akan digunakan untuk memberi tag pada unknown words pada contextual training corpus Pembelajaran Aturan Kontekstual Saat Tagger telah mempelajari most likely tag untuk setiap word pada corpus yang diberi tag secara manual dan metode untuk memprediksi most likely tag untuk unknown words, aturan kontekstual dipelajari untuk disambiguation. Dicari rule sebagai basis konteks dari token-token word. Proses pembelajaran kontekstual ini memerlukan initially annotated text. Input pada initial state annotator adalah corpus yang belum diberi tag. List traininglexicon digunakan untuk menampung list word dengan beberapa tag yang melabeli setiap word. Tag-tag tersebut didapat dari modul leksikal. Tag pertama adalah most likely tag. word tag 1, tag 2,, tag n Dengan bantuan traininglexicon, bigbigramlist, dan lexical rules, most likely tag dilabelkan pada setiap known word pada corpus yang belum diberi tag (untagged corpus). Known word yang dimaksud adalah word-word pada traininglexicon dengan most frequent tag. Sedangkan, untuk unknown words diberi tag dengan lexical rules. Input dari pembelajaran kontekstual ini adalah goal corpus, initial temporary corpus RT 0, dan traininglexicon. Pertama, digenerate semua Permissable Rules(PR) dari semua kemungkinan instansiasi dari semua template kontekstual yang sudah ditetapkan. PR pada modul kontekstual dengan PR pada leksikal modul adalah berbeda karena kedua modul
14 20 menggunakan template transformasi yang berbeda. Berikut ini trigger-trigger pada template transformasi kontekstual: change taga to tag b when : 1. Jika kata sebelumnya ditag z. 2. Jika dua kata sebelumnya ditag z. 3. Salah satu dari dua kata sebelumnyaditag z. 4. Salah satu dari tiga kata sebelumnyaditag z. 5. Kata sebelumnya ditag z dan kata berikut ditag w. 6. Jika kata sebelumnyaditag z dan dua kata sebelumnya ditag w. Keterangan : a, b, z dan w adalah variabel part-of-speech. Setiap rule pada PR dengan kondisi trigger yang terpenuhi, skor temporary corpus RT 0 dihitung. Diambil rule dengan skor tertinggi R 1 yang kemudian ditempatkan pada output list. Lalu aplikasikan R 1 pada RT 0 dan menghasilkan RT 1, dan seterusnya. Jika R merupakan rule pada PR, maka skor dihitung dengan membandingkan tag pada kata di RTdengan correct tag pada goal corpus. Setelah rule diaplikasikan ada word w score rule dihitung dengan menjumlahkan frekuensi semua tag yang sebelumnya salah menjadi benar (fixed) dikurangi dengan jumlah tag yang sebelumnya benar menjadi salah (broken) atau dapat dirumuskan sebagai berikut : Skor = Fixed Broken 2.4
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Memasuki era big data, pertumbuhan data berbentuk dokumen teks semakin tinggi. Sehingga diperlukan text processing untuk pengolahan data yang sangat besar. Dokumen
Lebih terperinciPENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA
BAB IV PENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA Pada Bab IV ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses penentuan jenis kata (part of speech tagging)
Lebih terperinciPART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM.
PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM. 1208605026 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN ILMU KOMPUTER
Lebih terperinciUKDW BAB 1 PENDAHULUAN Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Dengan perkembangan teknologi yang semakin pesat, setiap orang dituntut untuk bisa memanfaatkan dengan baik perkembangan teknologi dan dapat menggunakan di dalam kehidupan
Lebih terperinciPART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL
PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL Eka Rahayu Setyaningsih Teknik Informatika, Sekolah Tinggi Teknik Surabaya (1) e-mail: eka@stts.edu ABSTRAK Dalam penelitian
Lebih terperinciIKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan)
IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan) (Bab 8.5-8.8 Jurafsky & Martin) Ruli Manurung Fakultas Ilmu Komputer Universitas Indonesia 25 Februari 2008 Outline Stochastic POS Tagging
Lebih terperinciPENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA
BAB III PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA Pada Bab III ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses awal (preprocessing) membentuk file masukan untuk pengurai
Lebih terperinciBAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI
BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat
Lebih terperinci1. PENDAHULUAN 1.1 Latar belakang Masalah
1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.
Lebih terperinciBAB II KAJIAN PUSTAKA, KONSEP, DAN TEORI
BAB II KAJIAN PUSTAKA, KONSEP, DAN TEORI 2.1 Kajian Pustaka Kajian pustaka memuat uraian sistematis tentang teori-teori dasar dan konsep atau hasil-hasil penelitian yang ditemukan oleh peneliti terdahulu
Lebih terperinciPENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S
PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA Oleh: M Karibun H S G64101053 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciPart-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi
IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN: 1978-1520 1 Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi Nitin Sabloak 1, Bebeto Agung Hardono 2, Derry Alamsyah 3 1,2 STMIK GI
Lebih terperinciBAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA
BAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA 2.1 Konsep Dalam penelitian ini peneliti menggunakan beberapa konsep seperti pemerolehan bahasa, morfologi, afiksasi dan prefiks, penggunaan konsep ini
Lebih terperinciBAB I PENDAHULUAN. lain dapat berbeda bergantung pada aliran linguistik apa yang mereka anut.
BAB I PENDAHULUAN 1.1 Latar Belakang Kata merupakan salah satu unsur penting dalam pembetukan suatu bahasa salah satunya dalam suatu proses pembuatan karya tulis. Kategori kata sendiri merupakan masalah
Lebih terperinciSKRIPSI. Triastuti Chandrawati
Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning SKRIPSI Triastuti Chandrawati 1204000866 UNIVERSITAS INDONESIA FAKULTAS
Lebih terperinciBAB 11 KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA. bahasa yang digunakan akal budi memahami hal-hal lain ( KBBI,2007:588).
BAB 11 KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA 2.1 Konsep Konsep merupakan gambaran mental dari objek, proses, atau apapun yang ada di luar bahasa yang digunakan akal budi memahami hal-hal lain (
Lebih terperinciPENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL
Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2013 PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL I Wayan Hendra Maha Putra¹, Imelda Atastina², Alfian Akbar Gozali³ ¹Teknik
Lebih terperinciIMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING
IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING Imam Fahrur Rozi 3 Permasalahan yang pertama dihadapi dalam mengembangkan sistem opinion mining adalah menentukan apakah suatu teks
Lebih terperinciPENDAHULUAN. kelaziman penggunaannya dalam komunikasi sering terdapat kesalahan-kesalahan dianggap
BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa memainkan peranan penting dalam kehidupan manusia. Terkait dengan kelaziman penggunaannya dalam komunikasi sering terdapat kesalahan-kesalahan dianggap sebagai
Lebih terperinciBAB1 PENDAHULUAN. Perkembangan ilmu pengetahuan berpengaruh terhadap sistem atau kaidah
BAB1 PENDAHULUAN 1.1 Latar Belakang Perkembangan ilmu pengetahuan berpengaruh terhadap sistem atau kaidah suatu bahasa. Sesuai dengan sifat bahasa yang dinamis, ketika pengetahuan pengguna bahasa meningkat,
Lebih terperinciPENENTUAN KELAS KATA PADA PART OF SPEECH TAGGING KATA AMBIGU BAHASA INDONESIA
JISKa (Jurnal Informatika Sunan Kalijaga), Vol. 2, No. 3, Januari, 2018, Pp. 157 166 ISSN 2527-5836 PENENTUAN KELAS KATA PADA PART OF SPEECH TAGGING KATA AMBIGU BAHASA INDONESIA Ahmad Subhan Yazid (1),
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah
Lebih terperinciBAB 1 PENDAHULUAN. mengkonversikan tulisan / teks ke dalam bentuk ucapan dengan menggunakan
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Aplikasi Text-to-Speech ( TTS ) merupakan suatu aplikasi yang digunakan untuk mengkonversikan tulisan / teks ke dalam bentuk ucapan dengan menggunakan pemodelan
Lebih terperinciBAB I PENDAHULUAN. Bahasa sebagai sarana untuk berkomunikasi memunyai peranan yang sangat
1 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa sebagai sarana untuk berkomunikasi memunyai peranan yang sangat penting bagi kehidupan manusia. Pengguna bahasa selalu menggunakan bahasa lisan saat
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Natural Language Processing Natural language processing (NLP), merupakan salah satu pendekatan terkomputerisasi untuk menganalisa teks berdasarkan aspek teori dan teknologi. Menurut
Lebih terperinciBAB II KAJIAN PUSTAKA. Kajian tentang afiks dalam bahasa Banggai di Kecamatan Labobo
BAB II KAJIAN PUSTAKA 2.1 Penelitian yang Relevan Kajian tentang afiks dalam bahasa Banggai di Kecamatan Labobo Kabupaten Banggai Kepulauan Provinsi Sulawesi Tengah belum pernah dilakukan sebelumnya. Oleh
Lebih terperinciBUKU AJAR. Bahasa Indonesia. Azwardi, S.Pd., M.Hum
i BUKU AJAR Bahasa Indonesia Azwardi, S.Pd., M.Hum i ii Buku Ajar Morfologi Bahasa Indonesia Penulis: Azwardi ISBN: 978-602-72028-0-1 Editor: Azwardi Layouter Rahmad Nuthihar, S.Pd. Desain Sampul: Decky
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa merupakan salah satu komponen yang paling penting dalam kehidupan manusia. Dalam bentuk tulisan, bahasa menyimpan pengetahuan dari satu generasi ke generasi
Lebih terperinciBAB 2 LANDASAN TEORI. Dalam bab ini akan dipaparkan landasan-landasan teori yang telah ada dan menjadi pijakan dalam pelaksanaan penelitian ini.
BAB 2 LANDASAN TEORI Dalam bab ini akan dipaparkan landasan-landasan teori yang telah ada dan menjadi pijakan dalam pelaksanaan penelitian ini. 2.1 Morfologi Sebelum melihat lebih jauh tentang pengurai
Lebih terperinciTATA KATA DAN TATA ISTILAH BAHASA INDONESIA
TATA KATA DAN TATA ISTILAH BAHASA INDONESIA Tata bentukan dan tata istilah berkenaan dengan kaidah pembentukan kata dan kaidah pembentukan istilah. Pembentukan kata berkenaan dengan salah satu cabang linguistik
Lebih terperinciANALISIS KESALAHAN PENGGUNAAN BAHASA INDONESIA OLEH SISWA ASING Oleh Rika Widawati
ANALISIS KESALAHAN PENGGUNAAN BAHASA INDONESIA OLEH SISWA ASING Oleh Rika Widawati Abstrak. Penelitian ini menggambarkan kesalahan penggunaan bahasa Indonesia terutama dalam segi struktur kalimat dan imbuhan
Lebih terperinciPROSES MORFOLOGIS PEMBENTUKAN KATA RAGAM BAHASA WALIKA
Arkhais, Vol. 07 No. 1 Januari -Juni 2016 PROSES MORFOLOGIS PEMBENTUKAN KATA RAGAM BAHASA WALIKA Wahyu Dwi Putra Krisanjaya Lilianan Muliastuti Abstrak. Penelitian ini bertujuan untuk mengetahui pola pembentukan
Lebih terperinciAlat Sintaksis. Kata Tugas (Partikel) Intonasi. Peran. Alat SINTAKSIS. Bahasan dalam Sintaksis. Morfologi. Sintaksis URUTAN KATA 03/01/2015
SINTAKSIS Pengantar Linguistik Umum 26 November 2014 Morfologi Sintaksis Tata bahasa (gramatika) Bahasan dalam Sintaksis Morfologi Struktur intern kata Tata kata Satuan Fungsi Sintaksis Struktur antar
Lebih terperinciSKRIPSI. Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik Informatika. Disusun Oleh :
SKRIPSI PENERAPAN ANALISIS MORFOLOGI UNTUK PENANGANAN KATA BERIMBUHAN PADA POS TAGGER BAHASA INDONESIA BERBASIS STATISTIK IMPLEMENTING MORPHOLOGICAL ANALYZER FOR AFFIXES HANDLING IN STATISTIC BASED INDONESIAN
Lebih terperinciBAB V TEKS ULASAN FILM/DRAMA
MODUL BAHASA INDONESIA KELAS XI SEMESTER 2 BAB V TEKS ULASAN FILM/DRAMA OLEH NI KADEK SRI WEDARI, S.Pd. A. Pengertian Teks Ulasan Film/Drama Teks ulasan yaitu teks yang berisi ulasan atau penilaian terhadap
Lebih terperinciBAB I PENDAHULUAN. Jika kita membaca berbagai macam karya sastra Jawa, maka di antaranya ada
BAB I PENDAHULUAN 1.1 Latar Belakang Jika kita membaca berbagai macam karya sastra Jawa, maka di antaranya ada karya sastra berbentuk puisi yang dikenal sebagai těmbang macapat atau disebut juga těmbang
Lebih terperinciBAB I PENDAHULUAN A. Latar Belakang Penelitian Imas Siti Nurlaela, 2015
1 BAB I PENDAHULUAN A. Latar Belakang Penelitian Pada umumnya, beberapa bahasa di dunia, dalam penggunaannya pasti mempunyai kata dasar dan kata yang terbentuk melalui suatu proses. Kata dasar tersebut
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang Bahasa adalah suatu alat komunikasi pada manusia untuk menyatakan
BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa adalah suatu alat komunikasi pada manusia untuk menyatakan tanggapannya terhadap alam sekitar atau peristiwa-peristiwa yang dialami secara individual atau secara
Lebih terperinciBAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah Analisis Kebutuhan Analisis Masalah
BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah 3.1.1 Analisis Kebutuhan Ada banyak hal yang berhubungan dengan sastra atau ilmu bahasa yang dapat diterapkan di dalam teknologi, seperti penerjemahan
Lebih terperinciDAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi.
DAFTAR ISI ABSTRAK...i ABSTRACT... ii KATA PENGANTAR... iii DAFTAR ISI... v DAFTAR GAMBAR...vii DAFTAR TABEL... viii DAFTAR ISTILAH... ix BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah...
Lebih terperinciBAB I PENDAHULUAN. A. Latar Belakang Masalah
BAB I PENDAHULUAN A. Latar Belakang Masalah Manusia diberikan akal dan pikiran yang sempurna oleh Tuhan. Dalam berbagai hal manusia mampu melahirkan ide-ide kreatif dengan memanfaatkan akal dan pikiran
Lebih terperinciPREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha
PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL Adhitya Teguh Nugraha Program Studi Teknik Informatika Jurusan Teknik Elektro Fakultas Teknik Universitas Tanjungpura ituteguh@gmail.com
Lebih terperinciBAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA
BAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA 2.1 Konsep dan Landasan Teori 2.1.1 Konsep Morfologi adalah ilmu yang mempelajari seluk-beluk bentuk kata serta fungsi perubahan-perubahan bentuk kata
Lebih terperinciBAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
Lebih terperinciBENTUKAN KATA DALAM KARANGAN BAHASA INDONESIA YANG DITULIS PELAJAR THAILAND PROGRAM DARMASISWA CIS-BIPA UM TAHUN
BENTUKAN KATA DALAM KARANGAN BAHASA INDONESIA YANG DITULIS PELAJAR THAILAND PROGRAM DARMASISWA CIS-BIPA UM TAHUN 2010-2011 Vania Maherani Universitas Negeri Malang E-mail: maldemoi@yahoo.com Pembimbing:
Lebih terperinciPEMAKAIAN PREFIKS DALAM CERITA PENDEK DI MAJALAH ANEKA SKRIPSI
PEMAKAIAN PREFIKS DALAM CERITA PENDEK DI MAJALAH ANEKA SKRIPSI Disusun Sebagai Persyaratan Guna Mencapai Derajat Sarjana S-1 Jurusan Pendidikan Bahasa Sastra Indonesia dan Daerah Disusun Oleh LISDA OKTAVIANTINA
Lebih terperinci5 Universitas Indonesia
BAB 2 LANDASAN TEORI Bab ini terdiri dari dua bagian utama, yaitu penjelasan tentang teori Lexical Functional Grammar (subbab 2.1) dan penjelasan tentang struktur kalimat dalam bahasa Indonesia (subbab
Lebih terperinciLINGUISTIK UMUM TATARAN LINGUISTIK (2) : MORFOLOGI
Nama : TITIS AIZAH NIM : 1402408143 LINGUISTIK UMUM TATARAN LINGUISTIK (2) : MORFOLOGI I. MORFEM Morfem adalah bentuk terkecil berulang dan mempunyai makna yang sama. Bahasawan tradisional tidak mengenal
Lebih terperinciBab 1. Pendahuluan. Setiap negara memiliki ciri khas masing-masing yang membedakannya
Bab 1 Pendahuluan 1.1 Latar Belakang Setiap negara memiliki ciri khas masing-masing yang membedakannya dengan negara lain. Adapun yang menjadi ciri khas tersebut antara lain adalah adat istiadat, budaya,
Lebih terperinciBAB 5 TATARAN LINGUISTIK
Nama : Wara Rahma Puri NIM : 1402408195 BAB 5 TATARAN LINGUISTIK 5. TATARAN LINGUISTIK (2): MORFOLOGI Morfem adalah satuan gramatikal terkecil yang mempunyai makna. 5.1 MORFEM Tata bahasa tradisional tidak
Lebih terperinciPendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia
Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia Abd Wahab Syahroni 1), Joan Santoso 2), Endang Setyati
Lebih terperinciAnalisis Sentimen pada Opini Mahasiswa Menggunakan Natural Language Processing
Analisis Sentimen pada Opini Mahasiswa Menggunakan Natural Language Processing Aldi Nurzahputra 1, Much Aziz Muslim 2 1,2 Jurusan Ilmu Komputer, FMIPA, Universitas Negeri Semarang Email: 1 aldinurzah96@gmail.com,
Lebih terperinciPENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika)
PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh ROSA ARIANI SUKAMTO NIM
Lebih terperinciKALIMAT. Menu SK DAN KD. Pengantar: Bahasa bersifat Hierarki 01/08/2017. Oleh: Kompetensi Dasar: 3. Mahasiwa dapat menjelaskan kalimat
KELOMPOK 5 MATA KULIAH: BAHASA INDONESIA Menu KALIMAT Oleh: A. SK dan KD B. Pengantar C. Satuan Pembentuk Bahasa D. Pengertian E. Karakteristik F. Unsur G. 5 Pola Dasar H. Ditinjau Dari Segi I. Menurut
Lebih terperinciBAB I PENDAHULUAN. A. Latar Belakang Masalah. Kemampuan berkomunikasi merupakan hal yang sangat diperlukan saat
BAB I PENDAHULUAN A. Latar Belakang Masalah Kemampuan berkomunikasi merupakan hal yang sangat diperlukan saat ini. Kemampuan ini hendaknya dilatih sejak usia dini karena berkomunikasi merupakan cara untuk
Lebih terperinciBAB I PENDAHULUAN. perhatian khusus dari pengamat bahasa. Hal ini dikarenakan nominalisasi mempunyai
BAB I PENDAHULUAN 1.1 Latar Belakang Nominalisasi sebagai salah satu fenomena kebahasaan, mesti mendapatkan perhatian khusus dari pengamat bahasa. Hal ini dikarenakan nominalisasi mempunyai peran yang
Lebih terperinciKATA PENGANTAR. memberikan rahmat dan juga karunia-nya sehingga penulis dapat menyelesaikan
KATA PENGANTAR Puji syukur penulis panjatkan ke hadirat Tuhan Yang Maha Esa yang telah memberikan rahmat dan juga karunia-nya sehingga penulis dapat menyelesaikan penyusunan skripsi ini. Skripsi yang berjudul
Lebih terperinciPART-OF-SPEECH TAGGING UNTUK BAHASA INDONESIA MENGGUNAKAN STANFORD POS-TAGGING
PART-OF-SPEECH TAGGING UNTUK BAHASA INDONESIA MENGGUNAKAN STANFORD POS-TAGGING 1) Viny Christanti M., M.Kom, 2) Ir. Jeanny Pragantha, M.Eng dan 3) Victor 1,2,3) Teknik Informatika, Fakultas Teknologi Informasi,
Lebih terperinciBAB I PENDAHULUAN. Novel adalah sebuah karya fiksi prosa yang ditulis secara naratif; biasanya
1 BAB I PENDAHULUAN 1.1 Latar Belakang Novel adalah sebuah karya fiksi prosa yang ditulis secara naratif; biasanya dalam bentuk cerita (sumber: wikipedia.com). Penulis novel disebut novelis. Kata novel
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Bahasa merupakan mediator utama dalam mengekspresikan segala bentuk gagasan, ide, visi, misi, maupun pemikiran seseorang. Bagai sepasang dua mata koin yang selalu beriringan,
Lebih terperinciBAB I PENDAHULUAN. aturan-aturan yang berlaku dalam bahasa tersebut. Sebuah kata dalam suatu bahasa dapat berupa simple word seperti table, good,
BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa baik lisan maupun tulisan merupakan alat yang berfungsi untuk menyampaikan suatu ide, gagasan, pikiran, perasaan, pengalaman dan pendapat. Oleh karena itu bahasa
Lebih terperinciBAB I PENDAHULUAN. yang ada di wilayah Sulawesi Tenggara, tepatnya di Pulau Buton. Pada masa
1 BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Wolio yang selanjutnya disingkat BW adalah salah satu bahasa daerah yang ada di wilayah Sulawesi Tenggara, tepatnya di Pulau Buton. Pada masa Kerajaan Kesultanan
Lebih terperinciJurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN :
Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN : 2089-9033 Analisis Perbandingan Algoritma LCP (Left-Corner-Parsing) Dan Algoritma CYK (Cocke-Younger-Kasami) Untuk Memeriksa
Lebih terperinciPengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas Maximum Entropy untuk Bahasa Jawa Krama
Pramudita, Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas Maximum Entropy untuk Bahasa Jawa Krama 235 Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa alami adalah bahasa yang biasa digunakan untuk berkomunikasi antarmanusia, misalnya bahasa Indonesia, Sunda, Jawa, Inggris, Jepang, dan sebagainya. Bahasa
Lebih terperinciBAB I PENDAHULUAN. A. Latar Belakang
BAB I PENDAHULUAN A. Latar Belakang Dalam linguistik bahasa Jepang (Nihon go-gaku) dapat dikaji mengenai beberapa hal, seperti kalimat, kosakata, atau bunyi ujaran, bahkan sampai pada bagaimana bahasa
Lebih terperinciKATA BERSUFIKS PADA TAJUK RENCANA SUARA MERDEKA DAN IMPLIKASINYA TERHADAP PEMBELAJARAN
KATA BERSUFIKS PADA TAJUK RENCANA SUARA MERDEKA DAN IMPLIKASINYA TERHADAP PEMBELAJARAN Naskah Publikasi Disusun sebagai salah satu syarat menyelesaikan Program Studi Strata I pada Jurusan Pendidikan Bahasa
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
1 BAB 1 PENDAHULUAN Bab ini berisi tentang latar belakang (subbab 1.1), tujuan penelitian (subbab 1.2), perumusan dan pembatasan masalah (subbab 1.3), metodologi penelitian (subbab 1.4), serta penjelasan
Lebih terperinciBAB I PENDAHULUAN. manusia. Dalam arti, bahasa mempunyai kedudukan yang penting bagi
BAB I PENDAHULUAN A. Latar Belakang Masalah Bahasa merupakan alat yang digunakan manusia dalam berkomunikasi. Bahasa mempunyai hubungan yang erat dalam komunikasi antar manusia, yakni dalam berkomunikasi
Lebih terperinciBAB VI PENUTUP. dirumuskan tersebut berdasarkan rumusan masalah yang telah ditetapkan. Variabel
BAB VI PENUTUP 6.1 Simpulan Dengan maksud merangkum seluruh uraian yang terdapat pada bagian pembahasan, pada bagian ini dirumuskan berbagai simpulan. Simpulan yang dirumuskan tersebut berdasarkan rumusan
Lebih terperinciKATA JAHAT DENGAN SINONIMNYA DALAM BAHASA INDONESIA: ANALISIS STRUKTURAL
KATA JAHAT DENGAN SINONIMNYA DALAM BAHASA INDONESIA: ANALISIS STRUKTURAL Rahmi Harahap Program Studi S-1 Sastra Indonesia Fakultas Ilmu Budaya Universitas Diponegoro Abstract Research on the structural
Lebih terperinciBAB 2 LANDASAN TEORI DAN TINJAUAN PUSTAKA
BAB 2 LANDASAN TEORI DAN TINJAUAN PUSTAKA 2.1 Pengantar Penggunaan afiks dalam ragam informal, terutama dalam situs Friendster, menarik untuk diteliti karena belum banyak penelitian yang membahas hal tersebut.
Lebih terperinciBAB 3 METODOLOGI PENELITIAN
BAB 3 METODOLOGI PENELITIAN 3.1 Metode Penelitian Metode yang digunakan dalam penelitian ini, yaitu metode penelitian deskriptif analitik. Metode deskriptif merupakan metode penelitian yang bertujuan untuk
Lebih terperinciNama : Irine Linawati NIM : BAB V TATARAN LINGUISTIK (2) = MORFOLOGI
Nama : Irine Linawati NIM : 1402408306 BAB V TATARAN LINGUISTIK (2) = MORFOLOGI Fonem adalah satuan bunyi terkecil dari arus ujaran. Satuanfonem yang fungsional itu ada satuan yang lebih tinggi yang disebut
Lebih terperinciNASKAH PUBLIKASI KELAS KATA DAN BENTUK KALIMAT DALAM KALIMAT MUTIARA BERBAHASA INDONESIA SERTA TATARAN PENGISINYA
NASKAH PUBLIKASI KELAS KATA DAN BENTUK KALIMAT DALAM KALIMAT MUTIARA BERBAHASA INDONESIA SERTA TATARAN PENGISINYA Untuk Memenuhi Sebagian Persyaratan Guna Mencapai Derajat Sarjana S-1 Jurusan Pendidikan
Lebih terperinciBAB II KAJIAN PUSTAKA DAN KERANGKA PIKIR. A. Tinjauan Studi Terdahulu
BAB II KAJIAN PUSTAKA DAN KERANGKA PIKIR A. Tinjauan Studi Terdahulu Penelitian dalam bidang morfologi memang telah banyak dilakukan oleh para linguis. Hal ini membantu penelitian ini sehingga dapat membuka
Lebih terperinciBAB 1 PENDAHULUAN. Masuknya istilah-istilah asing, terutama dari bahasa Inggris ke dalam
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masuknya istilah-istilah asing, terutama dari bahasa Inggris ke dalam bahasa Indonesia sudah tidak bisa ditahan lagi. Arus komunikasi kian global seiring berkembangnya
Lebih terperinciBAB V SIMPULAN DAN SARAN
BAB V SIMPULAN DAN SARAN A. Simpulan Setiap bahasa di dunia memiliki sistem kebahasaan yang berbeda. Perbedaan sistem bahasa itulah yang menyebabkan setiap bahasa memiliki ciri khas dan keunikan, baik
Lebih terperinciV.1 Tujuan Pengujian. V.2 Perancangan Pengujian
BAB V PENGUJIAN V.1 Tujuan Pengujian Pengujian dilakukan untuk menguji hasil kumpulan file masukan hasil pemrosesan awal (preprocessing) dari tesis ini. Pengujian juga dilakukan untuk mengetahui kinerja
Lebih terperinciBAB 4 UNSUR-UNSUR BAHASA INGGRIS YANG MUNCUL DALAM CAMPUR KODE
BAB 4 UNSUR-UNSUR BAHASA INGGRIS YANG MUNCUL DALAM CAMPUR KODE 4.1 Pengantar Bagian ini akan membicarakan analisis unsur-unsur bahasa Inggris yang masuk ke dalam campur kode dan membahas hasilnya. Analisis
Lebih terperinciBAB I PENDAHULUAN. wilayah Indonesia lainnya. Menurut Wedhawati dkk (2006: 1-2), Bahasa Jawa
BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Jawa adalah bahasa yang digunakan oleh penduduk suku Jawa di antaranya Jawa Tengah, Jawa Timur, Daerah Istimewa Yogyakarta, dan sebagian wilayah Indonesia lainnya.
Lebih terperinciBAB II LANDASAN TEORI
7 BAB II LANDASAN TEORI A. Penelitian Relevan 1. Penelitian yang berjudul Bentuk Fungsi Makna Afiks men- dalam Pengajaran Bahasa Indonesia di Sekolah Dasar disusun oleh Rois Sunanto NIM 9811650054 (2001)
Lebih terperinci2 LANDASAN TEORI 2.1 Knowledge Graph (KG) Concept Relations
2 LANDASAN TEORI 2.1 Knowledge Graph (KG) Knowledge graph adalah suatu metode yang digunakan untuk menganalisis teks dan merepresentasikannya ke dalam bentuk graf (Zhang dan Hoede 2000). Menurut Zhang
Lebih terperinciTUGAS AKHIR. Disusun oleh : SUSI SETYOWATI
POS TAGGER TWITTER BAHASA INDONESIA MENGGUNAKAN STANFORD NLP TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Disusun
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Banyak sekali penelitian yang telah dilakukan dalam bidang bahasa dan teknologi, namun tidak semua bahasa mampu diintegrasikan ke dalam semua teknologi yang telah diciptakan
Lebih terperinciBAB 5 PENUTUP. Campur code..., Annisa Ramadhani, FIB UI, Universitas Indonesia
BAB 5 PENUTUP 5.1 Simpulan Penelitian jenis proses campur kode menunjukkan hasil yang berbeda-beda antara bahasa yang satu dan bahasa yang lain karena subjek penelitian mereka pun berbeda-beda, baik dari
Lebih terperinciBAB 3 ANALISIS DAN PERANCANGAN
BAB 3 ANALISIS DAN PERANCANGAN 3.1 Analisis Masalah Penelitian yang sudah pernah membuat sistem ini berhasil menciptakan pembangkitan pertanyaan non-factoid secara otomatis dengan menggunakan tiga jenis
Lebih terperinciINTERFERENSI GRAMATIKAL BAHASA KOREA KE DALAM BAHASA INDONESIA
121 INTERFERENSI GRAMATIKAL BAHASA KOREA KE DALAM BAHASA INDONESIA Leeeunjung Abstrak. Penelitian ini bertujuan untuk mendapatkan pemahaman yang mendalam tentang interferensi gramatikal bahasa Korea ke
Lebih terperinciBAB I PENDAHULUAN. Manusia sebagai mahluk sosial yang senantiasa harus berkomunikasi
BAB I PENDAHULUAN 1. 1 Latar Belakang Masalah Manusia sebagai mahluk sosial yang senantiasa harus berkomunikasi dengan sesamanya memerlukan sarana untuk menyampaikan kehendaknya. Salah satu sarana komunikasi
Lebih terperinciBAB I PENDAHULUAN. bahasa manusia. Sebagai alat komunikasi manusia, bahasa adalah suatu sistem
1 BAB I PENDAHULUAN 1.1 Latar Belakang Secara populer orang sering menyatakan bahwa linguistik adalah ilmu tentang bahasa; atau ilmu yang menjadikan bahasa sebagai objek kajiannya; atau lebih tepat lagi,
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
Lebih terperinciBAB 2 LANDASAN TEORI. Dalam penelitian ini, dijelaskan konsep bentuk, khususnya afiksasi, dan
BAB 2 LANDASAN TEORI 2.1 Pengantar Dalam penelitian ini, dijelaskan konsep bentuk, khususnya afiksasi, dan makna gramatikal. Untuk menjelaskan konsep afiksasi dan makna, penulis memilih pendapat dari Kridalaksana
Lebih terperinciJurnal Sasindo Unpam, Volume 2, Nomor 2, Juli Afiksasi Dalam Bahasa Indonesia dan Bahasa Sunda (Studi Kontrastif)
Afiksasi Dalam Bahasa Indonesia dan Bahasa Sunda (Studi Kontrastif) Muhamad Romli, S.S. 1 M. Wildan, S.S., M.A. 2 ABSTRAK Penelitian ini merupakan penelitian tentang persamaan dan perbedaan afikasasi yang
Lebih terperinciBAB I PENDAHULUAN. Kata-kata Bahasa Indonesia kaya akan imbuhan. Kurang lebih ada sekitar
BAB I PENDAHULUAN 1.1. LATAR BELAKANG Kata-kata Bahasa Indonesia kaya akan imbuhan. Kurang lebih ada sekitar 35 imbuhan resmi yang disebutkan dalam Kamus Besar Bahasa Indonesia. Imbuhan-imbuhan ini dapat
Lebih terperinciBAB I PENDAHULUAN. untuk pemersatu antarsuku, bangsa dan budaya, sehingga
BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Indonesia merupakan bahasa yang digunakan sebagai alat komunikasi untuk pemersatu antarsuku, bangsa dan budaya, sehingga perkembangan bahasa Indonesia saat ini
Lebih terperinciIndonesian Part-of-Speech Tag
Indonesian Part-of-Speech Tag Fam Rashel, Andry Luthfi, Arawinda Dinakaramani, and Ruli Manurung Faculty of Computer Science, Universitas Indonesia Email: fam.rashel@ui.ac.id, andry.luthfi@ui.ac.id, ard51@ui.ac.id,
Lebih terperinciBAB I PENDAHULUAN. kriya. (Nurhayati, 2001: 69) menyatakan bahwa verba atau tembung kriya
1 BAB I PENDAHULUAN A. Latar Belakang Masalah Kata kerja (verba) dalam bahasa Jawa disebut dengan istilah tembung kriya. (Nurhayati, 2001: 69) menyatakan bahwa verba atau tembung kriya merupakan kata yang
Lebih terperinciBAB I PENDAHULUAN. menengah. Di antara keempat kegiatan berbahasa tersebut, menulis
BAB I PENDAHULUAN A. Latar Belakang Masalah Kegiatan berbahasa meliputi mendengar, berbicara, membaca, menulis. Keempat kegiatan tersebut merupakan kegiatan yang diterapkan dalam melaksanakan pembelajaran
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Pemrosesan Bahasa Alami (Natural Language Processing) Pemrosesan bahasa alami (Natual Language Processing - NLP) merupakan salah satu bidang ilmu Kecerdasan Buatan (Artificial
Lebih terperinciPENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S
PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA Oleh: M Karibun H S G64101053 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinci