BAB II TINJAUAN PUSTAKA

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II TINJAUAN PUSTAKA"

Transkripsi

1 BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Empiris Pada penelitian ini, ada beberapa penelitian terkait yang peneliti gunakan sebagai tinjauan studi. Berikut merupakan penelitian penelitian terkait yang pernah dilakukan oleh peneliti lain : a. HMM Based Part-of-Speech Tagger for Bahasa Indonesia (Wicaksono dan Purwarianti, 2010) Pada penelitian ini, ada beberapa metode digabungkan untuk meningkatkan akurasi POS-Tagging untuk Bahasa Indonesia menggunakan metode HMM. Metode pertama adalah menggunakan pohon afiks yang mencakup akhiran kata dan awalan. Metode kedua adalah menggunakan succeeding POS-tag sebagai salah satu fitur untuk HMM. Metode terakhir dengan menggunakan leksikon tambahan (dari KBBI- Kateglo) untuk membatasi tag yang dihasilkan oleh pohon afiks. Model HMM menggunakan token data corpus. Dalam percobaan, menggunakan 15% OOV tes corpus, akurasi terbaik adalah 96,50% dengan 99,4% untuk kata yang terdapat pada kamus dan 80,4% untuk OOV (out of vocabulary) atau kata yang tidak ada dalam kamus. Penelitian menunjukkan bahwa pohon afiks dan leksikon tambahan efektif dalam meningkatkan akurasi POS-Tagger, sedangkan penggunaan succeeding POS-tag tidak memberikan banyak perbaikan pada penanganan OOV. b. POS Tagging Bahasa Indonesia Dengan HMM dan Rule Based (Kathryn Widhiyanti dan Agus Harjoko, 2012) Pelabelan kelas kata bahas Indonesia menggunakan metode Hidden Markov Model dan Rule Based memiliki keakuratan yang tinggi yaitu 100% untuk teks yang ada di dalam corpus. Hasil ini lebih baik daripada hanya menggunakan metode HMM saja yang menghasilkan akurasi 99,29% untuk corpus yang sama. Namun, penelitian ini masih memiliki kekurangan, yaitu belum dapat membedakan kata yang memiliki makna ambigu atau kelas kata ganda. 7

2 8 c. Implementasi Brill Tagger untuk Memberikan POS-Tagging Pada Dokumen Bahasa Indonesia (Viny Christanti, 2012) Program Brill Tagger dapat diimplementasikan dengan baik untuk memberikan kelas kata pada dokumen bahasa Indonesia. Aturan leksikal dan kontekstual yang dihasilkan oleh Brill Tagger dapat digunakan sebagai aturan untuk memberikan kelas kata untuk kalimat bahasa Indonesia dengan nilai akurasi 98,65%. Namun masih terdapat kesalahan aturan sehingga menghasilkan kelas kata yang tidak tepat. Setelah memperbaiki aturan leksikal dan kontekstual akurasi meningkat menjadi 99,75%. Penerapan aturan leksikal dan kontesktual yang tepat dapat meningkatkan keakuratan pelabelan kelas kata. 2.2 Tinjauan Teoritis Part-of-SpeechTagging Part-of-Speech tagging (atau disingkat tagging) merupakan suatu proses memberi tanda (mark) kelas kata pada setiap kata dalam korpus (Jurafsky,2000). Tagging dapat dimanfaatkan pada aplikasi Natural Language Processing seperti : Question and Answering (Q&A), Machine Translation, Text Summarization dll. Penelitian mengenai Part-of-Speech Tagging sudah banyak dilakukan menggunakan berbagai metode seperti : Genetic Brill Tagger (W Joose,2006) dengan nilai akurasi 97% untuk dokumen bahasa Belanda, Hidden Markov Models dan Rule Based (Kathryn & Agus, 2012) dengan nilai akurasi 92,2% untuk dokumen bahasa Indonesia, dan Brill Tagger (Viny,dkk.,2012) dengan nilai akurasi 99,75% untuk dokumen bahasa Indonesia Penentuan Kelas Kata Proses part-of-speech tagging memerlukan kamus/leksikon untuk dapat digunakan dalam penentuan kelas kata. Leksikon merupakan kumpulan kata dasar disertai dengan tag atau kelas katanya. Leksikon dalam bahasa Bali hingga saat ini masih terbatas keberadaannya, sehingga digunakan kumpulan kata dasar yang didapatkan dari dataset sebagai leksikon dalam penelitian. Bentuk penulisan leksikon adalah sebagai berikut :

3 9 Tabel 2. 1 Contoh Lexicon Word Most Frequent Tag Other Possible Tags Bisa NN RB... L1 Lima NN CD... L2 Gunting NN VB... L2 Deretan L1 menunjukkan bahwa kata bisa memiliki most frequent tag NN dan pada suatu kondisi juga dapat diberi tag RB. Deretan L2 menunjukkan bahwa kata lima memiliki most frequent tag NN dan pada suatu kondisi juga dapat diberi tag CD. L3 menunjukkan bahwa kata aji memiliki most frequent tag NN dan pada suatu kondisi juga dapat diberi tag VB. Begitu selanjutnya untuk setiap kata yang terdapat dalam leksikon Morfologi Tata Bahasa Bali Morfologi merupakan bagian dari ilmu bahasa (linguistik) khususnya tata bahasa. Objek analisisnya meliputi satuan gramatikal pada tingkat morfem dan kata. Bagaimana tata bentuk, struktur, dan klasifikasi kata kata adalah merupakan masalah pokok kajian morfologi. Oleh karena itu morfologi juga diperlukan untuk memprediksi kelas kata yang tidak ada di dalam kamus Kelas Kata Menurut (Granoka,dkk.,1984), kata dasar maupun kata turunan dapat dikelompokkan atas suatu kategori atau kelas. Penggolongan kata seperti itu disebut kategori kata atau kelas kata. Penggolongan kategori kata atau kelas kata seperti itu dapat dilakukan dengan melihat prilaku satuan tersebut secara gramatikal dalam tataran yang lebih kompleks yaitu pada tingkat frase maupun kalimat. Secara garis besar, terdapat sejumlah kata yang dapat menduduki fungsi objek dalam suatu kalimat, di samping terdapat pula sejumlah kata yang tidak dapat menduduki fungsi objek, tetapi dapat menduduki fungsi predikat. Untuk kedua kelas kata di atas, diberikan istilah yaitu, kelas kata yang pertama disebut nominal, dan yang kedua disebut adjektiva. Sedangkan kata kata yang lainnya yang tidak dapat digolongkan ke dalam kelas nominal maupun adjektiva dimasukkan dalam suatu kelas kata yang disebut partikel.

4 10 Ketiga kategori atau kelas kata di atas dapat diperinci lagi menjadi beberapa sub kategori. Kelas kata nominal dibedakan menjadi tiga sub kategori, yaitu : kata benda, kata ganti, dan kata bilangan. Kelas kata adjektiva dibedakan menjadi dua sub kategori, yaitu : kata kerja dan kata sifat. Sedangkan kelas kata partikel dapat diperinci menjadi enam sub kategori, yaitu : kata penjelas, kata keterangan, kata penanda, kata perangkai, kata tanya, dan kata seru. Namun, kelas kata yang digunakan dalam penelitian ini disesuaikan dengan kelas kata yang saat ini lebih banyak digunakan dalam bahasa Bali. Sehingga kelas kata penjelas dan penanda tidak digunakan dalam penelitian ini. Penentuan kelas kata menggunakan tagset pada Penn Treebank (Santorini,1991). Kelas kata dalam bahasa Bali jika disesuaikan dengan tag pada Penn Treebank, maka diperoleh kelas kata sifat (JJ), kata keterangan (RB), kata perangkai yang dibagi menjadi konjungtor koordinatif (CC) dan konjungtor subordinatif (CS), kata ganti (PR), kata Tanya (WH), kata benda (NN), kata bilangan (CD), kata seru (UH), dan kata kerja (VB). Ada beberapa kelas kata yang ditambahkan peneliti, yaitu : kelas kata sandang (AR), kata benda khusus (NNP), kata depan (IN), kata asing (FW), tanda baca (TB), dan simbol (SYM). Sehingga total kelas kata yang digunakan dalam kelas kata ini sebanyak 16 kelas kata. Berikut merupakan daftar kelas kata yang dilengkapi dengan deskripsi dan contohnya: Tabel 2. 2 Daftar Kelas Kata yang Digunakan dalam Penelitian Tag Kelas Kata Deskripsi Contoh JJ Adjectiva Kata sifat; kata yang memberi Gede, putih, miik penjelasan tentang suatu benda RB Adverbia Kata Keterangan Teken, olih, lakar AR Artikula Kata Sandang I, Ni, Ipun CC Konjungtor Kata perangkai yang menghubungkan Lan, tur, muah Koordinatif klausa pada kalimat majemuk setara CS Konjungtor Kata hubung pada kalimat majemuk Sawireh, Sane Subordinatif bertingkat PR Pronomina Kata ganti; kata yang dipakai untuk Tiang, ragane, cai, menggantikan kata atau yang ento, ia, niki

5 11 dibendakan WH Kata Tanya Kata yang digunakan untuk Sire, kenapi menanyakan sesuatu NN Nomina Kata benda; kata yang menyebut Sate, umah, gegaen benda atau yang dibendakan NNP Kata Benda Kata benda khusus adalah kata benda Jawa, Jakarta, Ani Khusus yang mewakili suatu entitas tertentu CD Numeralia Kata bilangan; kata yang menyatakan jumlah benda atau jumlah kumpulan Abesik, dadua, seket, karo belah. nama benda IN Preposisi Kata depan; kata yang merangkaikan kata kata atau bagian bagian di, ke, uli, ring, saking kalimat UH Interjeksi Kata seru Ih, beh, aduh, aruh VB Verba Kata kerja; kata yang bermakna melakukan aktivitas atau kegiatan atau Adep, meli, melaib, dingeh lebih jelas kalau dikatakan melakukan pekerjaan FW Kata asing Kata asing Online, handphone TB Tanda baca Tanda baca.,,, ;, (, ),, SYM Simbol Matematika Simbol matematika +, #, $ Kata Berimbuhan Menurut (Granoka,dkk.,1984), kata berimbuhan adalah kata turunan yang dihasilkan melalui proses morfologis dengan penambahan imbuhan. Imbuhan adalah berupa morfem terikat yang dapat dibedakan, menurut tempatnya melekat pada kata dasar, yaitu : prefiks (awalan), infiks (sisipan), sufiks (akhiran), dan konfiks atau disebut juga simulfiks. 1. Prefiks (awalan) Prefiks atau awalan yaitu imbuhan yang terletak di depan kata dasar. Dalam bahasa Bali disebut pengater. Pengater dalam bahasa Bali, yaitu :N-, ma-, ka-, pa-, sa-, a-, pra-, pari-, pati-, maka-, saka-, kuma-.

6 12 Dari penjelasan di atas, akan dibuat aturan imbuhan prefiks yang dirangkum pada tabel berikut : Tabel 2. 3 Aturan Imbuhan Prefiks (Awalan) No Pola Imbuhan Kelas Kata Contoh 1 N- + kata dasar Kata Kerja Ngidih, Ngalih, Ngwangun 2 ma- + kata dasar Kata Kerja Makarya, maburuh, madagang 3 ka- + kata dasar Kata Kerja Kacrita, katulung, kakaplug 4 pa- + kata dasar Kata Benda, Kata Kerja Patakon, pangrasa, padengok 5 sa- + kata dasar Kata Keterangan Sawai, sapeteng, sarahina 6 a-+ kata dasar Kata Benda,Kata Apeteng, adiri, aukud Bilangan 7 pra-+ kata dasar Kata Benda Prabekel, prajani 8 pari- + kata dasar Kata Benda Paribahasa, pariboya 9 pati-+ kata dasar Kata Kerja Patigrape, patijemak 10 maka-+ kata dasar Kata Bilangan Sakaukud, sakabungkul 11 saka- + kata dasar Kata Bilangan Sakabesik, sakatugel 11 kuma-+ kata dasar Kata Benda Kumajaum, kumalipan 2. Infiks (sisipan) Infiks adalah imbuhan yang terletak di tengah kata dasar. Dalam bahasa Bali disebut seselan. Jika sebuah kata dasar memiliki huruf vokal, maka seselan yang ditambahkan sebelum huruf vocal. Sedangkan, jika sebuah kata dasar memiliki huruf konsonan, maka seselan terletak di akhir huruf konsonan pertama pada kata dasar tersebut. Seselan dalam bahasa Bali, seperti :-in-, -um-, -el-, daner-.

7 13 Tabel 2. 4 Aturan Imbuhan Infiks (Sisipan) No Pola Imbuhan Kelas Kata Contoh 1 kata dasar + -in- Kata Kerja Sinurat, tinulung 2 kata dasar + -um- Kata Kerja Tumurun, sumeken 3 kata dasar + -el- Kata Benda Telapak, telusuk 4 kata dasar + -er- Kata Benda Gerudug 3. Sufiks (akhiran) Sufiks adalah imbuhan yang terletak di akhir kata dasar. Dalam bahasa Bali disebut pengiring, yang termasuk pengiring yaitu :-ang,-in, -an, -a, -n, -ing, - é, -né. Tabel 2. 5 Aturan Imbuhan Sufiks (Akhiran) No Pola Imbuhan Kelas Kata Contoh 1 kata dasar + -ang Kata Kerja Nyemakang, alihang, suratang 2 kata dasar + -in Kata Kerja Jagurin, tanemin, tegakin 3 kata dasar + -an Kata Benda Diwangan, ketekan 4 kata dasar + -a Kata Kerja, Kata Abana, batisa Benda 5 kata dasar + -e Kata Benda Temboke, dagange, payuke 6 kata dasar + -ne Kata Benda Umahne, tanahne, gigine Akhiran n dan ing tidak memiliki pola yang pasti karena kedua akhiran ini bukan pembentuk kata. Akhiran n dan ing digunakan sebagai alat untuk menyatakan hubungan antara dua kata dalam bentuk frase secara nyata (eksplesit). Terutama akhiran n diikuti dengan unsur kepemilikan. Berikut adalah contoh akhiran n dan ing : Akhiran n : liman tiange. Akhiran ing : kalaning purnama. 4. Konfiks (awalan dan akhiran) Konfiks adalah gabungan imbuhan terdiri dari dua buah imbuhan yaitu (pangater dan pengiring). Gabungan imbuhan dalam bahasa Bali, seperti : pa-an, ma-an, ka-an, bra-an, dan n-ang.

8 14 Tabel 2. 6 Aturan Imbuhan Konfiks No Pola Imbuhan Kelas Kata Contoh 1 pa + kata dasar + an Kata Benda pasirepan, panyemuhan 2 ma + kata dasar + an Kata Kerja mangkidan, majemakan 3 ka + kata dasar + an Kata Benda kalacuran, karahayuan 4 bra + kata dasar + an Kata Sifat brakapakan, bramahan 5 N + kata dasar + ang Kata Kerja nyenikang, ngamaelang Proses Morfofonemis Sebagai akibat pertemuan sebuah morfem dengan morfem lainnya dapat terjadi suatu perubahan bentuk morfem. Misalnya, morfem N- apabila dipasangkan dengan morfem gae yang berarti kerja, jagur yang berarti pukul sebagai kata dasarnya dapat menghasilkan bentuk baru menjadi ngae yang berarti membuat, nyagur yang berarti memukul. Berikut merupakan daftar perubahan morfem dalam Bahasa Bali (Kamus Bahasa Bali, 1990) : Tabel 2. 7 Daftar Proses Hilangnya Fonem No Bentuk Dasar Berawalan Menjadi Contoh 1 k,g ng kutang ngutang gambar ngambar 2 c,j,s ny cacad nyacad jaring nyaring sampat nyampat 3 t,d n tegul negul dandan nandan 4 p,b m papag mapag batek matek 5 ny,n,m nga + (ny,n,m) nyanggluh nganyanggluh nengneng nganengneng maling ngamaling 6 y,r,l,w ng + (y,r,l,w) yasaang ngyasaang rasa ngrasa lawan nglawan wangun ngwangun 7 vokal ng + vokal alih ngalih ibing ngibing ubuh ngubuh ebet ngebet olah ngolah ejuk ngejuk

9 15 Pada tabel di atas dapat dilihat pembubuhan morfem terhadap bentuk kata dasar berawalan fonem konsonan diikuti dengan meluluhnya fonem konsonan tersebut, sehingga diperoleh rumusan kaidah di atas dengan penjelasan sebagai berikut : 1. Fonem k,g yang mengawali bentuk kata dasar hilang, diluluhkan oleh fonem ng, sebagai akibat pertemuan morfem N- dengan bentuk dasarnya. 2. Fonem c,j,s yang mengawali bentuk kata dasar hilang, diluluhkan oleh fonem ny, sebagai akibat pertemuan morfem N- dengan bentuk dasarnya. 3. Fonem t,d yang mengawali bentuk kata dasar hilang, diluluhkan oleh fonem n, sebagai akibat pertemuan morfem N- dengan bentuk dasarnya. 4. Fonem p,b yang mengawali bentuk kata dasar hilang, diluluhkan oleh fonem m, sebagai akibat pertemuan morfem N- dengan bentuk dasarnya Brill Tagger Brill Tagger diperkenalkan pertama kali oleh Eric Brill pada tahun Algoritma ini mencapai tingkat akurasi 95% pada tagging bahasa inggris (Bjerva,2013). Secara umum Brill Tagger disebut juga Transformation-based Error-driven Learning (TEL). Faktanya Tagger adalah dasar transformation atau rules dan belajar dari mendeteksi nilai errors. Pada gambar 2.1 deskripsi dari TEL yaitu pertama input merupakan unannotated text kemudian diberi tag inisialisasi dan keluaran dari inisialisasi adalah inisialisasi pada temporary corpus (TC) yang akan dibandingkan dengan corpus tujuan (training corpus). Temporary corpus menghasilkan rule baru dan rule dihasilkan secara berurutan. Brill Tagger melakukan pemberian anotasi pada corpus dengan duaaturan, yaitu :Aturan leksikal untuk memberi tag pada unknown word dan aturan kontekstual untuk memperoleh aturan yang meningkatkan akurasi dari perbaikan skor. Kedua aturan ini menggunakan dua jenis corpus, yaitu corpus tujuan (training corpus) dan corpus sementara (Temporary ) untuk meningkatkan akurasi rule yang dihasilkan tahap demi tahap. Brill Tagger dengan metode rule based banyak dilatih untuk berbagai macam bahasa, seperti Inggis, Belanda, dan Indonesia. Dalam bahasa Indonesia telah tersedia rule based Tagger-nya, tetapi untuk bahasa Bali belum tersedia. Oleh karena itu, pada penelitian ini akan dilakukan proses training terlebih dahulu

10 16 sehingga aturan seperti aturan leksikal sebagai rule based Tagger untuk bahasa Bali dapat terbentuk. Algoritma Brill Tagger terdiri dari (Christanti,2012) : 1. Proses Inisialisasi a. Known words (di dalam kosakata) : menentukan tag yang paling sering diberikan ke suatu bentuk kata. b. Uknown word (di luar kosakata) : Kata benda umum (NNP) jika diawali dengan huruf kapital dan kata benda lainnya (NN) jika sebaliknya. 2. Fase Pembelajaran a. Pengulangan dalam menghitung nilai kesalahan dari setiap calon aturan (perbedaan antara jumlah kesalahan sebelum dan sesudah menerapkan aturan). b. Pilih aturan yang terbaik (skor yang lebih tinggi). c. Tambahkan dalam daftar aturan dan diterapkan pada teks. d. Ulangi sampai tidak ada aturan yang memiliki skor di atas ambang tertentu atau yang telah diberikan (jika ambang yang dipilih adalah nol). Unannotated corpus Initial state annotator Temporary corpus Lexical / Contextual Learner Goal corpus Rules Gambar 2. 1 Error-driven learning module(brill,1995) Pada aturan leksikal, corpus tujuan adalah daftar kata yang terdiri dari informasi mengenai frekuensi tag pada training corpus. Kemudian corpus

11 17 sementara (temporary corpus) adalah daftar kata yang sama dengan corpus tujuan. Pada aturan kontekstual, corpus tujuan adalah training corpus yang di tag secara manual dan copus sementara menampung perbaikan jika masih terjadi error atau skor belum mencapai threshold. Berikut merupakan contoh dari Transformationbased Error Driven Learning(Brill,1995). Pada gambar 2.2 diasumsikan ada 4 transformasi (T) yang mungkin, yaitu T1 T4. Training corpus yang belum di tag diproses pada tahap inisialisasi dan menghasilkan errors = 5,100, diperoleh dari membandingkan keluaran dari inisialisasi dengan tag manual corpus. Selanjutnya, transformasi yang mungkin yang digunakan, yaitu T2 yang mengalami reduksi error tertinggi pada pembelajaran pertama dan pembelajaran selanjutnya T3 yang mengalami reduksi error tertinggi. Transformasi berhenti saat nilai skor sudah mencapai threshold. Unannotated Errors = 5,100 T1 Errors = 3,310 Errors = 1,410 Initial State Annotator T1 T2 Errors = 3,145 T2 T3 Errors = 2,110 T1 T2 Errors = 1,251 Errors = 5,100 T3 T4 Errors = 3,910 Errors = 6,300 T4 Errors = 1,231 Errors = 4,255 T3 T4 Errors = 1,231 Errors = 1,231 Gambar 2. 2 Contoh Transformation-based Error Driven Learning(Brill,1995) Pembelajaran Aturan Leksikal Pada aturan leksikal adalah menemukan aturan (rule) untuk memberi tag pada kata dengan most likely tag pada training corpus. Contohnya adalah tag kata dengan tag yang memiliki nilai probabilitas tertinggi atau frekuensi tertinggi. Permasalahan yang muncul adalah menentukan tag pada unknown word.

12 18 Dalam mempelajari aturan leksikal, diperlukan smallwordtaglist yang terdiri dari kata-kata pada small corpus yang sudah diberi tag secara manual, berfungsi sebagai goal corpus dan mengandung frekuensi setiap word. Freq (W, T) digunakan untuk menghitung most likely tag T untuk word W. P(T W) = Freq(W,T) / Freq(W) 2.1 Selain smallwordtaglist, dalam aturan leksikal juga digunakan bigwordlist dan bigbigramlist. Bigwordlist mengandung semua word yang muncul pada corpus yang belum diberi tag (unannotated corpus). Sedangkan, bigbigramlist adalah list yang berisi semua pasangan word (bigram) dalam unannotated corpus. Pada fase training, pertama-tama dibuat word list dari smallwordtaglist yang sudah dibuat, namun kali ini tagnya dihilangkan. Tag setiap kata di-assign dengan inisialisasi default most likely tag (NNP untuk kata yang diawali dengan huruf kapital dan NN untuk kata yang tidak diawali dengan huruf kapital). Word list yang didapat dari initial temporary corpus TC 0 dinamakan WL 0. Setelah itu, generate Permissable Rules (PR) dari semua kemungkinan instansiasi dari lexical template (smallwordtaglist) yang sudah ditentukan, lalu hitung skor untuk setiap rule R pada PR. Rule dengan skor tertinggi menjadi rule nomor satu pada output. Dengan mengaplikasikan rule tersebut, WL 0 sekarang menjadi WL 1.Lanjutkan dengan menghitung skor semua rule pada PR, kemudian pilih satu rule dengan skor tertinggi, outputkan rule ini sebagai rule nomor dua dan aplikasikan pada WL 1 untuk memperoleh WL 2. Proses ini terus diulangi sampai tidak ada lagi rule yang dapat dipilih yang skornya lebih besar dari nilai threshold. Menghitung skor pada rule: Misalkan terdapat rule R dengan template: if Trigger then change X to tag Y, dan w adalah word pada WL i dengan tag sebelumnya X yang memenuhi kondisi rule R. Maka, skor R adalah P(Y w) - P(X w) untuk word w. Total skor R diperoleh dari menjumlahkan semua skor word. skor(r) = 2.2 Misalkan terdapat rule R dengan template: if Trigger than change current tag to tag Y,

13 19 dan w adalah word pada WL i yang memenuhi kondisi rule R, maka skor R adalah P(Y w) - P(current tag of w w) untuk word w. Total skor R diperoleh dari menjumlahkan semua skor word. skor(r) = 2.3 Skor yang diperoleh R akan selalu berbentuk P(new tag w) - P(old tag w). Skor positif menunjukkan tag yang baru more likely dibandingkan tag sebelumnya, sedangkan skor negatif menunjukkan tag yang baru less likely dibanding tag sebelumnya. Kondisi triggernya dites dengan menggunakan bigwordlist dan bigbigramlist, dan perhitungan probabilitas digunakan frekuensi pada smallwordtaglist. Lexical rule yang didapatkan dari modul pembelajaran leksikal ini akan digunakan untuk memberi tag pada unknown words pada contextual training corpus Pembelajaran Aturan Kontekstual Saat Tagger telah mempelajari most likely tag untuk setiap word pada corpus yang diberi tag secara manual dan metode untuk memprediksi most likely tag untuk unknown words, aturan kontekstual dipelajari untuk disambiguation. Dicari rule sebagai basis konteks dari token-token word. Proses pembelajaran kontekstual ini memerlukan initially annotated text. Input pada initial state annotator adalah corpus yang belum diberi tag. List traininglexicon digunakan untuk menampung list word dengan beberapa tag yang melabeli setiap word. Tag-tag tersebut didapat dari modul leksikal. Tag pertama adalah most likely tag. word tag 1, tag 2,, tag n Dengan bantuan traininglexicon, bigbigramlist, dan lexical rules, most likely tag dilabelkan pada setiap known word pada corpus yang belum diberi tag (untagged corpus). Known word yang dimaksud adalah word-word pada traininglexicon dengan most frequent tag. Sedangkan, untuk unknown words diberi tag dengan lexical rules. Input dari pembelajaran kontekstual ini adalah goal corpus, initial temporary corpus RT 0, dan traininglexicon. Pertama, digenerate semua Permissable Rules(PR) dari semua kemungkinan instansiasi dari semua template kontekstual yang sudah ditetapkan. PR pada modul kontekstual dengan PR pada leksikal modul adalah berbeda karena kedua modul

14 20 menggunakan template transformasi yang berbeda. Berikut ini trigger-trigger pada template transformasi kontekstual: change taga to tag b when : 1. Jika kata sebelumnya ditag z. 2. Jika dua kata sebelumnya ditag z. 3. Salah satu dari dua kata sebelumnyaditag z. 4. Salah satu dari tiga kata sebelumnyaditag z. 5. Kata sebelumnya ditag z dan kata berikut ditag w. 6. Jika kata sebelumnyaditag z dan dua kata sebelumnya ditag w. Keterangan : a, b, z dan w adalah variabel part-of-speech. Setiap rule pada PR dengan kondisi trigger yang terpenuhi, skor temporary corpus RT 0 dihitung. Diambil rule dengan skor tertinggi R 1 yang kemudian ditempatkan pada output list. Lalu aplikasikan R 1 pada RT 0 dan menghasilkan RT 1, dan seterusnya. Jika R merupakan rule pada PR, maka skor dihitung dengan membandingkan tag pada kata di RTdengan correct tag pada goal corpus. Setelah rule diaplikasikan ada word w score rule dihitung dengan menjumlahkan frekuensi semua tag yang sebelumnya salah menjadi benar (fixed) dikurangi dengan jumlah tag yang sebelumnya benar menjadi salah (broken) atau dapat dirumuskan sebagai berikut : Skor = Fixed Broken 2.4

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Memasuki era big data, pertumbuhan data berbentuk dokumen teks semakin tinggi. Sehingga diperlukan text processing untuk pengolahan data yang sangat besar. Dokumen

Lebih terperinci

PENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA

PENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA BAB IV PENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA Pada Bab IV ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses penentuan jenis kata (part of speech tagging)

Lebih terperinci

PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM.

PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM. PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM. 1208605026 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN ILMU KOMPUTER

Lebih terperinci

UKDW BAB 1 PENDAHULUAN Latar Belakang

UKDW BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Dengan perkembangan teknologi yang semakin pesat, setiap orang dituntut untuk bisa memanfaatkan dengan baik perkembangan teknologi dan dapat menggunakan di dalam kehidupan

Lebih terperinci

PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL

PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL Eka Rahayu Setyaningsih Teknik Informatika, Sekolah Tinggi Teknik Surabaya (1) e-mail: eka@stts.edu ABSTRAK Dalam penelitian

Lebih terperinci

IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan)

IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan) IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan) (Bab 8.5-8.8 Jurafsky & Martin) Ruli Manurung Fakultas Ilmu Komputer Universitas Indonesia 25 Februari 2008 Outline Stochastic POS Tagging

Lebih terperinci

PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA

PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA BAB III PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA Pada Bab III ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses awal (preprocessing) membentuk file masukan untuk pengurai

Lebih terperinci

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat

Lebih terperinci

1. PENDAHULUAN 1.1 Latar belakang Masalah

1. PENDAHULUAN 1.1 Latar belakang Masalah 1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.

Lebih terperinci

BAB II KAJIAN PUSTAKA, KONSEP, DAN TEORI

BAB II KAJIAN PUSTAKA, KONSEP, DAN TEORI BAB II KAJIAN PUSTAKA, KONSEP, DAN TEORI 2.1 Kajian Pustaka Kajian pustaka memuat uraian sistematis tentang teori-teori dasar dan konsep atau hasil-hasil penelitian yang ditemukan oleh peneliti terdahulu

Lebih terperinci

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA Oleh: M Karibun H S G64101053 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi

Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN: 1978-1520 1 Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi Nitin Sabloak 1, Bebeto Agung Hardono 2, Derry Alamsyah 3 1,2 STMIK GI

Lebih terperinci

BAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA

BAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA BAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA 2.1 Konsep Dalam penelitian ini peneliti menggunakan beberapa konsep seperti pemerolehan bahasa, morfologi, afiksasi dan prefiks, penggunaan konsep ini

Lebih terperinci

BAB I PENDAHULUAN. lain dapat berbeda bergantung pada aliran linguistik apa yang mereka anut.

BAB I PENDAHULUAN. lain dapat berbeda bergantung pada aliran linguistik apa yang mereka anut. BAB I PENDAHULUAN 1.1 Latar Belakang Kata merupakan salah satu unsur penting dalam pembetukan suatu bahasa salah satunya dalam suatu proses pembuatan karya tulis. Kategori kata sendiri merupakan masalah

Lebih terperinci

SKRIPSI. Triastuti Chandrawati

SKRIPSI. Triastuti Chandrawati Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning SKRIPSI Triastuti Chandrawati 1204000866 UNIVERSITAS INDONESIA FAKULTAS

Lebih terperinci

BAB 11 KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA. bahasa yang digunakan akal budi memahami hal-hal lain ( KBBI,2007:588).

BAB 11 KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA. bahasa yang digunakan akal budi memahami hal-hal lain ( KBBI,2007:588). BAB 11 KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA 2.1 Konsep Konsep merupakan gambaran mental dari objek, proses, atau apapun yang ada di luar bahasa yang digunakan akal budi memahami hal-hal lain (

Lebih terperinci

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2013 PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL I Wayan Hendra Maha Putra¹, Imelda Atastina², Alfian Akbar Gozali³ ¹Teknik

Lebih terperinci

IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING

IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING IMPLEMENTASI RULE-BASED DOCUMENT SUBJECTIVITY PADA SISTEM OPINION MINING Imam Fahrur Rozi 3 Permasalahan yang pertama dihadapi dalam mengembangkan sistem opinion mining adalah menentukan apakah suatu teks

Lebih terperinci

PENDAHULUAN. kelaziman penggunaannya dalam komunikasi sering terdapat kesalahan-kesalahan dianggap

PENDAHULUAN. kelaziman penggunaannya dalam komunikasi sering terdapat kesalahan-kesalahan dianggap BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa memainkan peranan penting dalam kehidupan manusia. Terkait dengan kelaziman penggunaannya dalam komunikasi sering terdapat kesalahan-kesalahan dianggap sebagai

Lebih terperinci

BAB1 PENDAHULUAN. Perkembangan ilmu pengetahuan berpengaruh terhadap sistem atau kaidah

BAB1 PENDAHULUAN. Perkembangan ilmu pengetahuan berpengaruh terhadap sistem atau kaidah BAB1 PENDAHULUAN 1.1 Latar Belakang Perkembangan ilmu pengetahuan berpengaruh terhadap sistem atau kaidah suatu bahasa. Sesuai dengan sifat bahasa yang dinamis, ketika pengetahuan pengguna bahasa meningkat,

Lebih terperinci

PENENTUAN KELAS KATA PADA PART OF SPEECH TAGGING KATA AMBIGU BAHASA INDONESIA

PENENTUAN KELAS KATA PADA PART OF SPEECH TAGGING KATA AMBIGU BAHASA INDONESIA JISKa (Jurnal Informatika Sunan Kalijaga), Vol. 2, No. 3, Januari, 2018, Pp. 157 166 ISSN 2527-5836 PENENTUAN KELAS KATA PADA PART OF SPEECH TAGGING KATA AMBIGU BAHASA INDONESIA Ahmad Subhan Yazid (1),

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah

Lebih terperinci

BAB 1 PENDAHULUAN. mengkonversikan tulisan / teks ke dalam bentuk ucapan dengan menggunakan

BAB 1 PENDAHULUAN. mengkonversikan tulisan / teks ke dalam bentuk ucapan dengan menggunakan BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Aplikasi Text-to-Speech ( TTS ) merupakan suatu aplikasi yang digunakan untuk mengkonversikan tulisan / teks ke dalam bentuk ucapan dengan menggunakan pemodelan

Lebih terperinci

BAB I PENDAHULUAN. Bahasa sebagai sarana untuk berkomunikasi memunyai peranan yang sangat

BAB I PENDAHULUAN. Bahasa sebagai sarana untuk berkomunikasi memunyai peranan yang sangat 1 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa sebagai sarana untuk berkomunikasi memunyai peranan yang sangat penting bagi kehidupan manusia. Pengguna bahasa selalu menggunakan bahasa lisan saat

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Natural Language Processing Natural language processing (NLP), merupakan salah satu pendekatan terkomputerisasi untuk menganalisa teks berdasarkan aspek teori dan teknologi. Menurut

Lebih terperinci

BAB II KAJIAN PUSTAKA. Kajian tentang afiks dalam bahasa Banggai di Kecamatan Labobo

BAB II KAJIAN PUSTAKA. Kajian tentang afiks dalam bahasa Banggai di Kecamatan Labobo BAB II KAJIAN PUSTAKA 2.1 Penelitian yang Relevan Kajian tentang afiks dalam bahasa Banggai di Kecamatan Labobo Kabupaten Banggai Kepulauan Provinsi Sulawesi Tengah belum pernah dilakukan sebelumnya. Oleh

Lebih terperinci

BUKU AJAR. Bahasa Indonesia. Azwardi, S.Pd., M.Hum

BUKU AJAR. Bahasa Indonesia. Azwardi, S.Pd., M.Hum i BUKU AJAR Bahasa Indonesia Azwardi, S.Pd., M.Hum i ii Buku Ajar Morfologi Bahasa Indonesia Penulis: Azwardi ISBN: 978-602-72028-0-1 Editor: Azwardi Layouter Rahmad Nuthihar, S.Pd. Desain Sampul: Decky

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa merupakan salah satu komponen yang paling penting dalam kehidupan manusia. Dalam bentuk tulisan, bahasa menyimpan pengetahuan dari satu generasi ke generasi

Lebih terperinci

BAB 2 LANDASAN TEORI. Dalam bab ini akan dipaparkan landasan-landasan teori yang telah ada dan menjadi pijakan dalam pelaksanaan penelitian ini.

BAB 2 LANDASAN TEORI. Dalam bab ini akan dipaparkan landasan-landasan teori yang telah ada dan menjadi pijakan dalam pelaksanaan penelitian ini. BAB 2 LANDASAN TEORI Dalam bab ini akan dipaparkan landasan-landasan teori yang telah ada dan menjadi pijakan dalam pelaksanaan penelitian ini. 2.1 Morfologi Sebelum melihat lebih jauh tentang pengurai

Lebih terperinci

TATA KATA DAN TATA ISTILAH BAHASA INDONESIA

TATA KATA DAN TATA ISTILAH BAHASA INDONESIA TATA KATA DAN TATA ISTILAH BAHASA INDONESIA Tata bentukan dan tata istilah berkenaan dengan kaidah pembentukan kata dan kaidah pembentukan istilah. Pembentukan kata berkenaan dengan salah satu cabang linguistik

Lebih terperinci

ANALISIS KESALAHAN PENGGUNAAN BAHASA INDONESIA OLEH SISWA ASING Oleh Rika Widawati

ANALISIS KESALAHAN PENGGUNAAN BAHASA INDONESIA OLEH SISWA ASING Oleh Rika Widawati ANALISIS KESALAHAN PENGGUNAAN BAHASA INDONESIA OLEH SISWA ASING Oleh Rika Widawati Abstrak. Penelitian ini menggambarkan kesalahan penggunaan bahasa Indonesia terutama dalam segi struktur kalimat dan imbuhan

Lebih terperinci

PROSES MORFOLOGIS PEMBENTUKAN KATA RAGAM BAHASA WALIKA

PROSES MORFOLOGIS PEMBENTUKAN KATA RAGAM BAHASA WALIKA Arkhais, Vol. 07 No. 1 Januari -Juni 2016 PROSES MORFOLOGIS PEMBENTUKAN KATA RAGAM BAHASA WALIKA Wahyu Dwi Putra Krisanjaya Lilianan Muliastuti Abstrak. Penelitian ini bertujuan untuk mengetahui pola pembentukan

Lebih terperinci

Alat Sintaksis. Kata Tugas (Partikel) Intonasi. Peran. Alat SINTAKSIS. Bahasan dalam Sintaksis. Morfologi. Sintaksis URUTAN KATA 03/01/2015

Alat Sintaksis. Kata Tugas (Partikel) Intonasi. Peran. Alat SINTAKSIS. Bahasan dalam Sintaksis. Morfologi. Sintaksis URUTAN KATA 03/01/2015 SINTAKSIS Pengantar Linguistik Umum 26 November 2014 Morfologi Sintaksis Tata bahasa (gramatika) Bahasan dalam Sintaksis Morfologi Struktur intern kata Tata kata Satuan Fungsi Sintaksis Struktur antar

Lebih terperinci

SKRIPSI. Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik Informatika. Disusun Oleh :

SKRIPSI. Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik Informatika. Disusun Oleh : SKRIPSI PENERAPAN ANALISIS MORFOLOGI UNTUK PENANGANAN KATA BERIMBUHAN PADA POS TAGGER BAHASA INDONESIA BERBASIS STATISTIK IMPLEMENTING MORPHOLOGICAL ANALYZER FOR AFFIXES HANDLING IN STATISTIC BASED INDONESIAN

Lebih terperinci

BAB V TEKS ULASAN FILM/DRAMA

BAB V TEKS ULASAN FILM/DRAMA MODUL BAHASA INDONESIA KELAS XI SEMESTER 2 BAB V TEKS ULASAN FILM/DRAMA OLEH NI KADEK SRI WEDARI, S.Pd. A. Pengertian Teks Ulasan Film/Drama Teks ulasan yaitu teks yang berisi ulasan atau penilaian terhadap

Lebih terperinci

BAB I PENDAHULUAN. Jika kita membaca berbagai macam karya sastra Jawa, maka di antaranya ada

BAB I PENDAHULUAN. Jika kita membaca berbagai macam karya sastra Jawa, maka di antaranya ada BAB I PENDAHULUAN 1.1 Latar Belakang Jika kita membaca berbagai macam karya sastra Jawa, maka di antaranya ada karya sastra berbentuk puisi yang dikenal sebagai těmbang macapat atau disebut juga těmbang

Lebih terperinci

BAB I PENDAHULUAN A. Latar Belakang Penelitian Imas Siti Nurlaela, 2015

BAB I PENDAHULUAN A. Latar Belakang Penelitian Imas Siti Nurlaela, 2015 1 BAB I PENDAHULUAN A. Latar Belakang Penelitian Pada umumnya, beberapa bahasa di dunia, dalam penggunaannya pasti mempunyai kata dasar dan kata yang terbentuk melalui suatu proses. Kata dasar tersebut

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Bahasa adalah suatu alat komunikasi pada manusia untuk menyatakan

BAB I PENDAHULUAN. 1.1 Latar Belakang Bahasa adalah suatu alat komunikasi pada manusia untuk menyatakan BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa adalah suatu alat komunikasi pada manusia untuk menyatakan tanggapannya terhadap alam sekitar atau peristiwa-peristiwa yang dialami secara individual atau secara

Lebih terperinci

BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah Analisis Kebutuhan Analisis Masalah

BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah Analisis Kebutuhan Analisis Masalah BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah 3.1.1 Analisis Kebutuhan Ada banyak hal yang berhubungan dengan sastra atau ilmu bahasa yang dapat diterapkan di dalam teknologi, seperti penerjemahan

Lebih terperinci

DAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi.

DAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi. DAFTAR ISI ABSTRAK...i ABSTRACT... ii KATA PENGANTAR... iii DAFTAR ISI... v DAFTAR GAMBAR...vii DAFTAR TABEL... viii DAFTAR ISTILAH... ix BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah...

Lebih terperinci

BAB I PENDAHULUAN. A. Latar Belakang Masalah

BAB I PENDAHULUAN. A. Latar Belakang Masalah BAB I PENDAHULUAN A. Latar Belakang Masalah Manusia diberikan akal dan pikiran yang sempurna oleh Tuhan. Dalam berbagai hal manusia mampu melahirkan ide-ide kreatif dengan memanfaatkan akal dan pikiran

Lebih terperinci

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL Adhitya Teguh Nugraha Program Studi Teknik Informatika Jurusan Teknik Elektro Fakultas Teknik Universitas Tanjungpura ituteguh@gmail.com

Lebih terperinci

BAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA

BAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA BAB II KONSEP, LANDASAN TEORI, DAN TINJAUAN PUSTAKA 2.1 Konsep dan Landasan Teori 2.1.1 Konsep Morfologi adalah ilmu yang mempelajari seluk-beluk bentuk kata serta fungsi perubahan-perubahan bentuk kata

Lebih terperinci

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

BENTUKAN KATA DALAM KARANGAN BAHASA INDONESIA YANG DITULIS PELAJAR THAILAND PROGRAM DARMASISWA CIS-BIPA UM TAHUN

BENTUKAN KATA DALAM KARANGAN BAHASA INDONESIA YANG DITULIS PELAJAR THAILAND PROGRAM DARMASISWA CIS-BIPA UM TAHUN BENTUKAN KATA DALAM KARANGAN BAHASA INDONESIA YANG DITULIS PELAJAR THAILAND PROGRAM DARMASISWA CIS-BIPA UM TAHUN 2010-2011 Vania Maherani Universitas Negeri Malang E-mail: maldemoi@yahoo.com Pembimbing:

Lebih terperinci

PEMAKAIAN PREFIKS DALAM CERITA PENDEK DI MAJALAH ANEKA SKRIPSI

PEMAKAIAN PREFIKS DALAM CERITA PENDEK DI MAJALAH ANEKA SKRIPSI PEMAKAIAN PREFIKS DALAM CERITA PENDEK DI MAJALAH ANEKA SKRIPSI Disusun Sebagai Persyaratan Guna Mencapai Derajat Sarjana S-1 Jurusan Pendidikan Bahasa Sastra Indonesia dan Daerah Disusun Oleh LISDA OKTAVIANTINA

Lebih terperinci

5 Universitas Indonesia

5 Universitas Indonesia BAB 2 LANDASAN TEORI Bab ini terdiri dari dua bagian utama, yaitu penjelasan tentang teori Lexical Functional Grammar (subbab 2.1) dan penjelasan tentang struktur kalimat dalam bahasa Indonesia (subbab

Lebih terperinci

LINGUISTIK UMUM TATARAN LINGUISTIK (2) : MORFOLOGI

LINGUISTIK UMUM TATARAN LINGUISTIK (2) : MORFOLOGI Nama : TITIS AIZAH NIM : 1402408143 LINGUISTIK UMUM TATARAN LINGUISTIK (2) : MORFOLOGI I. MORFEM Morfem adalah bentuk terkecil berulang dan mempunyai makna yang sama. Bahasawan tradisional tidak mengenal

Lebih terperinci

Bab 1. Pendahuluan. Setiap negara memiliki ciri khas masing-masing yang membedakannya

Bab 1. Pendahuluan. Setiap negara memiliki ciri khas masing-masing yang membedakannya Bab 1 Pendahuluan 1.1 Latar Belakang Setiap negara memiliki ciri khas masing-masing yang membedakannya dengan negara lain. Adapun yang menjadi ciri khas tersebut antara lain adalah adat istiadat, budaya,

Lebih terperinci

BAB 5 TATARAN LINGUISTIK

BAB 5 TATARAN LINGUISTIK Nama : Wara Rahma Puri NIM : 1402408195 BAB 5 TATARAN LINGUISTIK 5. TATARAN LINGUISTIK (2): MORFOLOGI Morfem adalah satuan gramatikal terkecil yang mempunyai makna. 5.1 MORFEM Tata bahasa tradisional tidak

Lebih terperinci

Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia

Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia Abd Wahab Syahroni 1), Joan Santoso 2), Endang Setyati

Lebih terperinci

Analisis Sentimen pada Opini Mahasiswa Menggunakan Natural Language Processing

Analisis Sentimen pada Opini Mahasiswa Menggunakan Natural Language Processing Analisis Sentimen pada Opini Mahasiswa Menggunakan Natural Language Processing Aldi Nurzahputra 1, Much Aziz Muslim 2 1,2 Jurusan Ilmu Komputer, FMIPA, Universitas Negeri Semarang Email: 1 aldinurzah96@gmail.com,

Lebih terperinci

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika)

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika) PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh ROSA ARIANI SUKAMTO NIM

Lebih terperinci

KALIMAT. Menu SK DAN KD. Pengantar: Bahasa bersifat Hierarki 01/08/2017. Oleh: Kompetensi Dasar: 3. Mahasiwa dapat menjelaskan kalimat

KALIMAT. Menu SK DAN KD. Pengantar: Bahasa bersifat Hierarki 01/08/2017. Oleh: Kompetensi Dasar: 3. Mahasiwa dapat menjelaskan kalimat KELOMPOK 5 MATA KULIAH: BAHASA INDONESIA Menu KALIMAT Oleh: A. SK dan KD B. Pengantar C. Satuan Pembentuk Bahasa D. Pengertian E. Karakteristik F. Unsur G. 5 Pola Dasar H. Ditinjau Dari Segi I. Menurut

Lebih terperinci

BAB I PENDAHULUAN. A. Latar Belakang Masalah. Kemampuan berkomunikasi merupakan hal yang sangat diperlukan saat

BAB I PENDAHULUAN. A. Latar Belakang Masalah. Kemampuan berkomunikasi merupakan hal yang sangat diperlukan saat BAB I PENDAHULUAN A. Latar Belakang Masalah Kemampuan berkomunikasi merupakan hal yang sangat diperlukan saat ini. Kemampuan ini hendaknya dilatih sejak usia dini karena berkomunikasi merupakan cara untuk

Lebih terperinci

BAB I PENDAHULUAN. perhatian khusus dari pengamat bahasa. Hal ini dikarenakan nominalisasi mempunyai

BAB I PENDAHULUAN. perhatian khusus dari pengamat bahasa. Hal ini dikarenakan nominalisasi mempunyai BAB I PENDAHULUAN 1.1 Latar Belakang Nominalisasi sebagai salah satu fenomena kebahasaan, mesti mendapatkan perhatian khusus dari pengamat bahasa. Hal ini dikarenakan nominalisasi mempunyai peran yang

Lebih terperinci

KATA PENGANTAR. memberikan rahmat dan juga karunia-nya sehingga penulis dapat menyelesaikan

KATA PENGANTAR. memberikan rahmat dan juga karunia-nya sehingga penulis dapat menyelesaikan KATA PENGANTAR Puji syukur penulis panjatkan ke hadirat Tuhan Yang Maha Esa yang telah memberikan rahmat dan juga karunia-nya sehingga penulis dapat menyelesaikan penyusunan skripsi ini. Skripsi yang berjudul

Lebih terperinci

PART-OF-SPEECH TAGGING UNTUK BAHASA INDONESIA MENGGUNAKAN STANFORD POS-TAGGING

PART-OF-SPEECH TAGGING UNTUK BAHASA INDONESIA MENGGUNAKAN STANFORD POS-TAGGING PART-OF-SPEECH TAGGING UNTUK BAHASA INDONESIA MENGGUNAKAN STANFORD POS-TAGGING 1) Viny Christanti M., M.Kom, 2) Ir. Jeanny Pragantha, M.Eng dan 3) Victor 1,2,3) Teknik Informatika, Fakultas Teknologi Informasi,

Lebih terperinci

BAB I PENDAHULUAN. Novel adalah sebuah karya fiksi prosa yang ditulis secara naratif; biasanya

BAB I PENDAHULUAN. Novel adalah sebuah karya fiksi prosa yang ditulis secara naratif; biasanya 1 BAB I PENDAHULUAN 1.1 Latar Belakang Novel adalah sebuah karya fiksi prosa yang ditulis secara naratif; biasanya dalam bentuk cerita (sumber: wikipedia.com). Penulis novel disebut novelis. Kata novel

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Bahasa merupakan mediator utama dalam mengekspresikan segala bentuk gagasan, ide, visi, misi, maupun pemikiran seseorang. Bagai sepasang dua mata koin yang selalu beriringan,

Lebih terperinci

BAB I PENDAHULUAN. aturan-aturan yang berlaku dalam bahasa tersebut. Sebuah kata dalam suatu bahasa dapat berupa simple word seperti table, good,

BAB I PENDAHULUAN. aturan-aturan yang berlaku dalam bahasa tersebut. Sebuah kata dalam suatu bahasa dapat berupa simple word seperti table, good, BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa baik lisan maupun tulisan merupakan alat yang berfungsi untuk menyampaikan suatu ide, gagasan, pikiran, perasaan, pengalaman dan pendapat. Oleh karena itu bahasa

Lebih terperinci

BAB I PENDAHULUAN. yang ada di wilayah Sulawesi Tenggara, tepatnya di Pulau Buton. Pada masa

BAB I PENDAHULUAN. yang ada di wilayah Sulawesi Tenggara, tepatnya di Pulau Buton. Pada masa 1 BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Wolio yang selanjutnya disingkat BW adalah salah satu bahasa daerah yang ada di wilayah Sulawesi Tenggara, tepatnya di Pulau Buton. Pada masa Kerajaan Kesultanan

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN :

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN : Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN : 2089-9033 Analisis Perbandingan Algoritma LCP (Left-Corner-Parsing) Dan Algoritma CYK (Cocke-Younger-Kasami) Untuk Memeriksa

Lebih terperinci

Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas Maximum Entropy untuk Bahasa Jawa Krama

Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas Maximum Entropy untuk Bahasa Jawa Krama Pramudita, Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas Maximum Entropy untuk Bahasa Jawa Krama 235 Pengaruh Part of Speech Tagging Berbasis Aturan dan Distribusi Probabilitas

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa alami adalah bahasa yang biasa digunakan untuk berkomunikasi antarmanusia, misalnya bahasa Indonesia, Sunda, Jawa, Inggris, Jepang, dan sebagainya. Bahasa

Lebih terperinci

BAB I PENDAHULUAN. A. Latar Belakang

BAB I PENDAHULUAN. A. Latar Belakang BAB I PENDAHULUAN A. Latar Belakang Dalam linguistik bahasa Jepang (Nihon go-gaku) dapat dikaji mengenai beberapa hal, seperti kalimat, kosakata, atau bunyi ujaran, bahkan sampai pada bagaimana bahasa

Lebih terperinci

KATA BERSUFIKS PADA TAJUK RENCANA SUARA MERDEKA DAN IMPLIKASINYA TERHADAP PEMBELAJARAN

KATA BERSUFIKS PADA TAJUK RENCANA SUARA MERDEKA DAN IMPLIKASINYA TERHADAP PEMBELAJARAN KATA BERSUFIKS PADA TAJUK RENCANA SUARA MERDEKA DAN IMPLIKASINYA TERHADAP PEMBELAJARAN Naskah Publikasi Disusun sebagai salah satu syarat menyelesaikan Program Studi Strata I pada Jurusan Pendidikan Bahasa

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang 1 BAB 1 PENDAHULUAN Bab ini berisi tentang latar belakang (subbab 1.1), tujuan penelitian (subbab 1.2), perumusan dan pembatasan masalah (subbab 1.3), metodologi penelitian (subbab 1.4), serta penjelasan

Lebih terperinci

BAB I PENDAHULUAN. manusia. Dalam arti, bahasa mempunyai kedudukan yang penting bagi

BAB I PENDAHULUAN. manusia. Dalam arti, bahasa mempunyai kedudukan yang penting bagi BAB I PENDAHULUAN A. Latar Belakang Masalah Bahasa merupakan alat yang digunakan manusia dalam berkomunikasi. Bahasa mempunyai hubungan yang erat dalam komunikasi antar manusia, yakni dalam berkomunikasi

Lebih terperinci

BAB VI PENUTUP. dirumuskan tersebut berdasarkan rumusan masalah yang telah ditetapkan. Variabel

BAB VI PENUTUP. dirumuskan tersebut berdasarkan rumusan masalah yang telah ditetapkan. Variabel BAB VI PENUTUP 6.1 Simpulan Dengan maksud merangkum seluruh uraian yang terdapat pada bagian pembahasan, pada bagian ini dirumuskan berbagai simpulan. Simpulan yang dirumuskan tersebut berdasarkan rumusan

Lebih terperinci

KATA JAHAT DENGAN SINONIMNYA DALAM BAHASA INDONESIA: ANALISIS STRUKTURAL

KATA JAHAT DENGAN SINONIMNYA DALAM BAHASA INDONESIA: ANALISIS STRUKTURAL KATA JAHAT DENGAN SINONIMNYA DALAM BAHASA INDONESIA: ANALISIS STRUKTURAL Rahmi Harahap Program Studi S-1 Sastra Indonesia Fakultas Ilmu Budaya Universitas Diponegoro Abstract Research on the structural

Lebih terperinci

BAB 2 LANDASAN TEORI DAN TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI DAN TINJAUAN PUSTAKA BAB 2 LANDASAN TEORI DAN TINJAUAN PUSTAKA 2.1 Pengantar Penggunaan afiks dalam ragam informal, terutama dalam situs Friendster, menarik untuk diteliti karena belum banyak penelitian yang membahas hal tersebut.

Lebih terperinci

BAB 3 METODOLOGI PENELITIAN

BAB 3 METODOLOGI PENELITIAN BAB 3 METODOLOGI PENELITIAN 3.1 Metode Penelitian Metode yang digunakan dalam penelitian ini, yaitu metode penelitian deskriptif analitik. Metode deskriptif merupakan metode penelitian yang bertujuan untuk

Lebih terperinci

Nama : Irine Linawati NIM : BAB V TATARAN LINGUISTIK (2) = MORFOLOGI

Nama : Irine Linawati NIM : BAB V TATARAN LINGUISTIK (2) = MORFOLOGI Nama : Irine Linawati NIM : 1402408306 BAB V TATARAN LINGUISTIK (2) = MORFOLOGI Fonem adalah satuan bunyi terkecil dari arus ujaran. Satuanfonem yang fungsional itu ada satuan yang lebih tinggi yang disebut

Lebih terperinci

NASKAH PUBLIKASI KELAS KATA DAN BENTUK KALIMAT DALAM KALIMAT MUTIARA BERBAHASA INDONESIA SERTA TATARAN PENGISINYA

NASKAH PUBLIKASI KELAS KATA DAN BENTUK KALIMAT DALAM KALIMAT MUTIARA BERBAHASA INDONESIA SERTA TATARAN PENGISINYA NASKAH PUBLIKASI KELAS KATA DAN BENTUK KALIMAT DALAM KALIMAT MUTIARA BERBAHASA INDONESIA SERTA TATARAN PENGISINYA Untuk Memenuhi Sebagian Persyaratan Guna Mencapai Derajat Sarjana S-1 Jurusan Pendidikan

Lebih terperinci

BAB II KAJIAN PUSTAKA DAN KERANGKA PIKIR. A. Tinjauan Studi Terdahulu

BAB II KAJIAN PUSTAKA DAN KERANGKA PIKIR. A. Tinjauan Studi Terdahulu BAB II KAJIAN PUSTAKA DAN KERANGKA PIKIR A. Tinjauan Studi Terdahulu Penelitian dalam bidang morfologi memang telah banyak dilakukan oleh para linguis. Hal ini membantu penelitian ini sehingga dapat membuka

Lebih terperinci

BAB 1 PENDAHULUAN. Masuknya istilah-istilah asing, terutama dari bahasa Inggris ke dalam

BAB 1 PENDAHULUAN. Masuknya istilah-istilah asing, terutama dari bahasa Inggris ke dalam BAB 1 PENDAHULUAN 1.1 Latar Belakang Masuknya istilah-istilah asing, terutama dari bahasa Inggris ke dalam bahasa Indonesia sudah tidak bisa ditahan lagi. Arus komunikasi kian global seiring berkembangnya

Lebih terperinci

BAB V SIMPULAN DAN SARAN

BAB V SIMPULAN DAN SARAN BAB V SIMPULAN DAN SARAN A. Simpulan Setiap bahasa di dunia memiliki sistem kebahasaan yang berbeda. Perbedaan sistem bahasa itulah yang menyebabkan setiap bahasa memiliki ciri khas dan keunikan, baik

Lebih terperinci

V.1 Tujuan Pengujian. V.2 Perancangan Pengujian

V.1 Tujuan Pengujian. V.2 Perancangan Pengujian BAB V PENGUJIAN V.1 Tujuan Pengujian Pengujian dilakukan untuk menguji hasil kumpulan file masukan hasil pemrosesan awal (preprocessing) dari tesis ini. Pengujian juga dilakukan untuk mengetahui kinerja

Lebih terperinci

BAB 4 UNSUR-UNSUR BAHASA INGGRIS YANG MUNCUL DALAM CAMPUR KODE

BAB 4 UNSUR-UNSUR BAHASA INGGRIS YANG MUNCUL DALAM CAMPUR KODE BAB 4 UNSUR-UNSUR BAHASA INGGRIS YANG MUNCUL DALAM CAMPUR KODE 4.1 Pengantar Bagian ini akan membicarakan analisis unsur-unsur bahasa Inggris yang masuk ke dalam campur kode dan membahas hasilnya. Analisis

Lebih terperinci

BAB I PENDAHULUAN. wilayah Indonesia lainnya. Menurut Wedhawati dkk (2006: 1-2), Bahasa Jawa

BAB I PENDAHULUAN. wilayah Indonesia lainnya. Menurut Wedhawati dkk (2006: 1-2), Bahasa Jawa BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Jawa adalah bahasa yang digunakan oleh penduduk suku Jawa di antaranya Jawa Tengah, Jawa Timur, Daerah Istimewa Yogyakarta, dan sebagian wilayah Indonesia lainnya.

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI 7 BAB II LANDASAN TEORI A. Penelitian Relevan 1. Penelitian yang berjudul Bentuk Fungsi Makna Afiks men- dalam Pengajaran Bahasa Indonesia di Sekolah Dasar disusun oleh Rois Sunanto NIM 9811650054 (2001)

Lebih terperinci

2 LANDASAN TEORI 2.1 Knowledge Graph (KG) Concept Relations

2 LANDASAN TEORI 2.1 Knowledge Graph (KG) Concept Relations 2 LANDASAN TEORI 2.1 Knowledge Graph (KG) Knowledge graph adalah suatu metode yang digunakan untuk menganalisis teks dan merepresentasikannya ke dalam bentuk graf (Zhang dan Hoede 2000). Menurut Zhang

Lebih terperinci

TUGAS AKHIR. Disusun oleh : SUSI SETYOWATI

TUGAS AKHIR. Disusun oleh : SUSI SETYOWATI POS TAGGER TWITTER BAHASA INDONESIA MENGGUNAKAN STANFORD NLP TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Disusun

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Banyak sekali penelitian yang telah dilakukan dalam bidang bahasa dan teknologi, namun tidak semua bahasa mampu diintegrasikan ke dalam semua teknologi yang telah diciptakan

Lebih terperinci

BAB 5 PENUTUP. Campur code..., Annisa Ramadhani, FIB UI, Universitas Indonesia

BAB 5 PENUTUP. Campur code..., Annisa Ramadhani, FIB UI, Universitas Indonesia BAB 5 PENUTUP 5.1 Simpulan Penelitian jenis proses campur kode menunjukkan hasil yang berbeda-beda antara bahasa yang satu dan bahasa yang lain karena subjek penelitian mereka pun berbeda-beda, baik dari

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN

BAB 3 ANALISIS DAN PERANCANGAN BAB 3 ANALISIS DAN PERANCANGAN 3.1 Analisis Masalah Penelitian yang sudah pernah membuat sistem ini berhasil menciptakan pembangkitan pertanyaan non-factoid secara otomatis dengan menggunakan tiga jenis

Lebih terperinci

INTERFERENSI GRAMATIKAL BAHASA KOREA KE DALAM BAHASA INDONESIA

INTERFERENSI GRAMATIKAL BAHASA KOREA KE DALAM BAHASA INDONESIA 121 INTERFERENSI GRAMATIKAL BAHASA KOREA KE DALAM BAHASA INDONESIA Leeeunjung Abstrak. Penelitian ini bertujuan untuk mendapatkan pemahaman yang mendalam tentang interferensi gramatikal bahasa Korea ke

Lebih terperinci

BAB I PENDAHULUAN. Manusia sebagai mahluk sosial yang senantiasa harus berkomunikasi

BAB I PENDAHULUAN. Manusia sebagai mahluk sosial yang senantiasa harus berkomunikasi BAB I PENDAHULUAN 1. 1 Latar Belakang Masalah Manusia sebagai mahluk sosial yang senantiasa harus berkomunikasi dengan sesamanya memerlukan sarana untuk menyampaikan kehendaknya. Salah satu sarana komunikasi

Lebih terperinci

BAB I PENDAHULUAN. bahasa manusia. Sebagai alat komunikasi manusia, bahasa adalah suatu sistem

BAB I PENDAHULUAN. bahasa manusia. Sebagai alat komunikasi manusia, bahasa adalah suatu sistem 1 BAB I PENDAHULUAN 1.1 Latar Belakang Secara populer orang sering menyatakan bahwa linguistik adalah ilmu tentang bahasa; atau ilmu yang menjadikan bahasa sebagai objek kajiannya; atau lebih tepat lagi,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB 2 LANDASAN TEORI. Dalam penelitian ini, dijelaskan konsep bentuk, khususnya afiksasi, dan

BAB 2 LANDASAN TEORI. Dalam penelitian ini, dijelaskan konsep bentuk, khususnya afiksasi, dan BAB 2 LANDASAN TEORI 2.1 Pengantar Dalam penelitian ini, dijelaskan konsep bentuk, khususnya afiksasi, dan makna gramatikal. Untuk menjelaskan konsep afiksasi dan makna, penulis memilih pendapat dari Kridalaksana

Lebih terperinci

Jurnal Sasindo Unpam, Volume 2, Nomor 2, Juli Afiksasi Dalam Bahasa Indonesia dan Bahasa Sunda (Studi Kontrastif)

Jurnal Sasindo Unpam, Volume 2, Nomor 2, Juli Afiksasi Dalam Bahasa Indonesia dan Bahasa Sunda (Studi Kontrastif) Afiksasi Dalam Bahasa Indonesia dan Bahasa Sunda (Studi Kontrastif) Muhamad Romli, S.S. 1 M. Wildan, S.S., M.A. 2 ABSTRAK Penelitian ini merupakan penelitian tentang persamaan dan perbedaan afikasasi yang

Lebih terperinci

BAB I PENDAHULUAN. Kata-kata Bahasa Indonesia kaya akan imbuhan. Kurang lebih ada sekitar

BAB I PENDAHULUAN. Kata-kata Bahasa Indonesia kaya akan imbuhan. Kurang lebih ada sekitar BAB I PENDAHULUAN 1.1. LATAR BELAKANG Kata-kata Bahasa Indonesia kaya akan imbuhan. Kurang lebih ada sekitar 35 imbuhan resmi yang disebutkan dalam Kamus Besar Bahasa Indonesia. Imbuhan-imbuhan ini dapat

Lebih terperinci

BAB I PENDAHULUAN. untuk pemersatu antarsuku, bangsa dan budaya, sehingga

BAB I PENDAHULUAN. untuk pemersatu antarsuku, bangsa dan budaya, sehingga BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Indonesia merupakan bahasa yang digunakan sebagai alat komunikasi untuk pemersatu antarsuku, bangsa dan budaya, sehingga perkembangan bahasa Indonesia saat ini

Lebih terperinci

Indonesian Part-of-Speech Tag

Indonesian Part-of-Speech Tag Indonesian Part-of-Speech Tag Fam Rashel, Andry Luthfi, Arawinda Dinakaramani, and Ruli Manurung Faculty of Computer Science, Universitas Indonesia Email: fam.rashel@ui.ac.id, andry.luthfi@ui.ac.id, ard51@ui.ac.id,

Lebih terperinci

BAB I PENDAHULUAN. kriya. (Nurhayati, 2001: 69) menyatakan bahwa verba atau tembung kriya

BAB I PENDAHULUAN. kriya. (Nurhayati, 2001: 69) menyatakan bahwa verba atau tembung kriya 1 BAB I PENDAHULUAN A. Latar Belakang Masalah Kata kerja (verba) dalam bahasa Jawa disebut dengan istilah tembung kriya. (Nurhayati, 2001: 69) menyatakan bahwa verba atau tembung kriya merupakan kata yang

Lebih terperinci

BAB I PENDAHULUAN. menengah. Di antara keempat kegiatan berbahasa tersebut, menulis

BAB I PENDAHULUAN. menengah. Di antara keempat kegiatan berbahasa tersebut, menulis BAB I PENDAHULUAN A. Latar Belakang Masalah Kegiatan berbahasa meliputi mendengar, berbicara, membaca, menulis. Keempat kegiatan tersebut merupakan kegiatan yang diterapkan dalam melaksanakan pembelajaran

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Pemrosesan Bahasa Alami (Natural Language Processing) Pemrosesan bahasa alami (Natual Language Processing - NLP) merupakan salah satu bidang ilmu Kecerdasan Buatan (Artificial

Lebih terperinci

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA Oleh: M Karibun H S G64101053 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci