PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA

Ukuran: px
Mulai penontonan dengan halaman:

Download "PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA"

Transkripsi

1 BAB III PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA Pada Bab III ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses awal (preprocessing) membentuk file masukan untuk pengurai Collins. Adaptasi ini dilakukan agar pengurai Collins dapat digunakan untuk bahasa Indonesia. Adaptasi yang dilakukan antara lain penyesuaian terhadap kelima file (file events, file grammar, file leksikon, file korpus, file simbol non-terminal) masukan pengurai Collins. III.1 Analisis Proses Tesis ini mengacu pada penelitian Collins yang menggunakan pengurai hasil disertasi Collins [12] untuk bahasa Czech. Tesis ini akan menggunakan pengurai Collins untuk bahasa Indonesia. Tesis ini menggunakan pengurai Collins karena disertasi beserta modul-modul programnya dapat diunduh (download) di website Michael Collins (lisensi GNU (open source)). Hasil penelitian Collins juga telah digunakan untuk bahasa lain selain bahasa Inggris (bahasa Czech) sehingga dapat diasumsikan dapat digunakan untuk bahasa Indonesia. Kelebihan dari pengurai Collins adalah metode head-finder yang digunakan. Metode tersebut memberikan penanda kepala kata pada setiap level pohon sehingga dapat digunakan untuk menandai inti frase. Selain itu pengurai Collins dianggap sebagai pengurai berbasis statistik dengan kecepatan yang cukup baik dalam menguraikan kalimat. Model pengurai Collins yang diimplementasikan pada tesis ini hanya model 1 dari pengurai Collins. Modul-modul pada pengurai Collins meliputi modul-modul untuk proses pembelajaran dan penguraian kalimat masukan dimana file events sebagai data pembelajaran diambil dari Penn WSJ (Wall Street Journal) treebank. Modul-modul yang digunakan juga akan menggunakan modul-modul pada pengurai Collins, tapi dimodifikasi dan dibuat tambahan pemrosesan awal agar dapat digunakan untuk bahasa Indonesia. Tesis ini akan membuat sebuah III-1

2 pemrosesan awal untuk mempersiapkan kumpulan file masukan berbahasa Indonesia untuk pengurai Collins. Kalimat dalam bahasa Indonesia memiliki beberapa kesamaan dengan kalimat dalam bahasa Inggris antara lain: Kalimat dapat memiliki sub kalimat berupa frase subyek, frase predikat, frase obyek, frase keterangan, dan pelengkap, Memiliki pola tata bahasa inti yang sama yaitu S-P-O (subyek-predikatobyek). Namun kedua bahasa ini juga memiliki beberapa perbedaan antara lain: Tabel III-1 Perbedaan Bahasa Indonesia dan Bahasa Inggris Bahasa Indonesia Bahasa Inggris penggunaan kata tidak dipengaruhi waktu kejadian penggunaan kata dipengaruhi waktu kejadian sehingga ada kata kerja bentuk pertama, kedua, dan ketiga tata bahasa tidak dipengaruhi waktu tata bahasa dipengaruhi waktu kejadian kejadian pola frase adalah diterangkan pola frase adalah menerangkan menerangkan (DM) diterangkan (MD) tidak mengenal perubahan kata benda mengenal kata benda dalam bentuk dalam bentuk jamak dan tidak jamak jamak dan tidak jamak Proses yang dilakukan dalam tesis ini meliputi proses awal (preprocessing) menyesuaikan kumpulan file masukan pada pengurai Collins dan proses pengujian dengan mencoba menguraikan kalimat baru sebagai masukan. Input dari sistem untuk proses pembelajaran adalah file treebank berbahasa Indonesia sedangkan untuk pengujian, masukannya adalah file teks yang berisi kumpulan kalimat (corpus) berbahasa Indonesia. Hasil keluaran pemrosesan awal pada tesis ini kumpulan file yang akan menjadi masukan pengurai Collins. III-2

3 Modul-modul pada Collins parser merupakan modul-modul untuk proses pembelajaran dan pengujian. Kumpulan file masukan pengurai Collins adalah sebagai berikut: 1. File events yang menyimpan hasil generasi events (kemungkinan kebergantungan antar elemen dalam kalimat yang dibangkitkan secara heuristic) dari Penn WSJ (Wall Street Journal) Treebank, file events ini menggunakan format Collins, file ini digunakan untuk menghitung probabilitas kemunculan kebergantungan antar simbol non-terminal sebagai data pembelajaran, file events sebenarnya adalah treebank yang dikemas menggunakan format events pengurai Collins, 2. File korpus yang berisi beberapa kalimat yang sudah memiliki tag, kalimat-kalimat dalam file korpus inilah yang nantinya akan diuraikan untuk proses pengujian, 3. File yang berisi pola tata bahasa dengan format Collins (grammar) sebagai acuan aturan penguraian, 4. File yang berisi simbol-simbol non terminal yang digunakan, 5. File kamus (leksikon) untuk menentukan jenis kata (tag) (berisi kata, jenis kata, dan bernilai 0 jika kata termasuk jarang digunakan, bernilai 1 jika kata termasuk sering digunakan). Pemrosesan awal (preprocessing) yang dilakukan pada tesis ini adalah melakukan penyesuaian kelima file masukan pengurai Collins menggunakan bahasa Indonesia. Algoritma penguraian (parsing) yang digunakan pengurai Collins adalah bottomup chart parsing [12] untuk membentuk pohon pola tata bahasa. Algoritma bottom up chart parsing yang digunakan diawali dengan memasukkan semua kata dalam chart (tabel) untuk dihitung kemungkinan pembentukan pola tata bahasanya antara kata yang satu dengan lainnya (menggunakan probabilitas). Dari tabel kata tersebut maka dilakukan pemeriksaan probabilitas kemunculan aturan grammar pada file grammar disesuaikan dengan tag kata (penjelasan algoritma chart yang digunakan dapat dilihat pada Lampiran 16). File yang digunakan untuk III-3

4 menghitung probabilitas aturan grammar adalah file events. Gambar keterkaitan antar file masukan pada pengurai Collins dapat dilihat pada Gambar III-1. file korpus pengurai Collins file simbol non terminal analisis leksikal pengenalan dan pendeskripsian token dengan memeriksa tag kata apakah ada di daftar simbol non terminal file leksikon analisis sintaks memeriksa kebenaran token dengan memeriksa apakah tag kata sudah benar dilihat dari leksikon file grammar file events memeriksa setiap aturan grammar yang sesuai dengan korpus dan akan dihitung probabilitasnya dengan membaca file events untuk membentuk pohon pola tata bahasa pohon pola tata bahasa Gambar III-1 Keterkaitan Antar File Masukan pada Pengurai Collins Pemrosesan awal (preprocessing) yang dilakukan pada tesis ini meliputi dua buah proses berikut: 1. Proses membuat file events dan membangkitkan aturan grammar dari file yang berisi pohon kalimat berbahasa Indonesia, selain itu, kata yang tidak ada di dalam leksikon (pada treebank) juga akan ditambahkan pada file leksikon, III-4

5 2. Proses membuat file korpus (jumlah kata dalam kalimat, kata dalam kalimat beserta tagnya) dari file teks yang berisi kumpulan kalimat berbahasa Indonesia. Proses-proses pemrosesan awal (preprocessing) yang akan dilakukan dalam tesis ini dapat dilihat pada Gambar III-2 dan III-3. masukan berupa dokumen treebank file grammar diuraikan menjadi struktur pohon dalam struktur program per kalimat file leksikon menggenerasi file events dan menambah isi file grammar dan leksikon dari pohon kalimat file events Gambar III-2 Arsitektur Global Proses Awal Pengurai Collins untuk Membuat file Events, file Grammar, file Leksikon format Collins (Menu 1) masukan berupa dokumen yang berisi kumpulan kalimat file leksikon POS tagging (penentuan jenis kata) file korpus format pengurai Collins Gambar III-3 Arsitektur Global Proses Awal Pengurai Collins untuk Membuat file korpus dengan Format Pengurai Collins (Menu 2) III-5

6 Hasil keluaran dari pemrosesan awal (preprocessing) dari tesis ini akan menjadi masukan dari pengurai Collins. III.1.1 Penyesuaian Kumpulan File Masukan Pengurai Collins untuk Bahasa Indonesia Bahasa Indonesia memiliki perbedaan dengan bahasa Inggris. Oleh karena itu perlu dilakukan beberapa adaptasi dari pengurai Collins agar dapat digunakan untuk bahasa Indonesia. Adaptasi yang harus dilakukan antara lain: 1. Perlu adanya sebuah treebank dalam bahasa Indonesia yang digunakan untuk membangkitkan file events sebagai masukan pengurai Collins, 2. File korpus masukan dibuat menggunakan bahasa Indonesia beserta tag katanya, 3. File grammar juga harus disesuaikan dengan pola tata bahasa Indonesia, 4. File yang berisi simbol-simbol non-terminal juga harus disesuaikan dengan yang digunakan pada tesis ini, 5. File leksikon juga harus berisi kata dan tag untuk bahasa Indonesia. III Penyesuaian File Treebank untuk Membuat File Events Collins menggenerasi file events dari sebuah section di Penn WSJ treebank. Pohon kalimat yang digunakan pengurai Collins sekitar pohon kalimat. Permasalahan yang paling utama adalah di Indonesia belum ada treebank berbahasa Indonesia yang dapat digunakan pada pengurai Collins. Oleh karena itu treebank akan dibuat dalam tesis ini secara manual. Treebank yang dibuat menggunakan beberapa kalimat berbahasa Indonesia sebagai uji coba proses pembelajaran pada aplikasi pemrosesan awal (preprocessing) pada tesis ini. Contoh isi treebank untuk sebuah kalimat dalam bahasa Indonesia dapat dilihat pada Tabel III-2. III-6

7 Tabel III-2 Contoh Isi Treebank (S(NP(PR Kamu))(ADVP(JJ tentu)(rb sering))(pu,)(advp(rb bahkan)(jj mungkin)(ar setiap)(nn hari))(pu,)(>vb mendengarkan) (NN berita)(advp(in di)(nn televisi)(>cc atau)(in di)(nn radio))(pu.)) Treebank yang dibuat disamakan dengan format treebank yang dipakai pengurai Collins ditambahkan tanda > sebagai penanda kata kepala level pada setiap level penguraian (inti makna). Contoh isi file event untuk sebuah kalimat dalam bahasa Indonesia dapat dilihat pada Tabel III-3. Tabel III-3 Contoh Isi File Events untuk Sebuah Kalimat 6 17 Kamu PR tentu JJ sering RB, PU bahkan RB mungkin JJ setiap AR hari NN, PU mendengarkan VB berita NN di IN televisi NN atau CC di IN radio NN. PU 3 mendengarkan VB S VB , PU mendengarkan VB PU S VB bahkan RB mendengarkan VB ADVP S VB , PU mendengarkan VB PU S VB tentu JJ mendengarkan VB ADVP S VB Kamu PR mendengarkan VB NP S VB #STOP# #STOP# mendengarkan VB #STOP# S VB berita NN mendengarkan VB NN S VB atau CC mendengarkan VB ADVP S VB PU mendengarkan VB PU S VB #STOP# #STOP# mendengarkan VB #STOP# S VB Kamu PR NP PR #STOP# #STOP# Kamu PR #STOP# NP PR #STOP# #STOP# Kamu PR #STOP# NP PR tentu JJ ADVP JJ #STOP# #STOP# tentu JJ #STOP# ADVP JJ sering RB tentu JJ RB ADVP JJ #STOP# #STOP# tentu JJ #STOP# ADVP JJ bahkan RB ADVP RB #STOP# #STOP# bahkan RB #STOP# ADVP RB mungkin JJ bahkan RB JJ ADVP RB setiap AR bahkan RB AR ADVP RB hari NN bahkan RB NN ADVP RB #STOP# #STOP# bahkan RB #STOP# ADVP RB atau CC ADVP CC televisi NN atau CC NN ADVP CC di IN atau CC IN ADVP CC #STOP# #STOP# atau CC #STOP# ADVP CC di IN atau CC IN ADVP CC radio NN atau CC NN ADVP CC #STOP# #STOP# atau CC #STOP# ADVP CC III-7

8 Kode angka 6 pada events menandakan pembacaan kalimat yang dibuat pohon kalimatnya. Kode angka 3 merupakan kode event unary dimana jika setiap simpul pohon hanya memiliki satu anak atau hubungan antara simpul dengan kepala anaknya. Kode angka 2 merupakan kode event dependency dimana merupakan aturan triple tiga buah simbol non terminal (grammar). Penjelasan lebih lanjut dapat dilihat pada Lampiran 15. File events ini sebenarnya adalah representasi pohon kalimat menggunakan format Collins untuk pengurai Collins. File events ini digunakan untuk menghitung probabilitas aturan grammar yang ada di file grammar. Pengurai Collins menggunakan probabilitas kemunculan grammar untuk menghitung probabilitas pohon kalimat yang dihasilkan. Karena keterbatasan treebank maka pada tesis ini treebank yang dibuat hanya sesuai untuk model 1 pada pengurai Collins. Pada pengurai Collins, proses penguraian dianggap memakai model 1, model 2, atau model 3 (dijelaskan pada subbab lain di bab ini) didasarkan pada data yang ada pada file events (dengan adanya beberapa tag khusus untuk model 2 dan 3). Penjelasan struktur file events dapat dilihat pada Lampiran 15. File treebank yang digunakan pada tesis ini dapat dilihat pada Lampiran 10 sedangkan file events yang digunakan pada tesis ini dapat dilihat pada Lampiran 9. Struktur data pohon yang digunakan untuk menyimpan dan memproses pohon kalimat menjadi events beserta penjelasannya dapat dilihat pada Lampiran 15. Struktur data pohon ini diambil dari modul adaptasi pengurai Collins untuk bahasa Czech. III Penyesuaian File Korpus Beberapa pemrosesan awal (preprocessing) harus dilakukan jika menggunakan pengurai Collins untuk bahasa Indonesia. Diantaranya adalah perlu adanya proses pemberian jenis kata pada setiap kata masukan (POS tagging). POS tagging perlu dilakukan untuk membuat sebuah file korpus masukan pengurai Collins yang telah diberi tag. Proses POS tagging untuk bahasa Indonesia akan dibahas pada bab selanjutnya. Format file korpus masukan dari pengurai Collins adalah sebagai berikut: III-8

9 [jumlah_kata_dalam_kalimat] [kata1] [tag1] [kata2] [tag2]... Contoh file korpus dalam bahasa Indonesia dapat dilihat pada Tabel III-4. Tabel III-4 Contoh File Korpus untuk Satu Kalimat 18 Tema NN cerita NN Malin NN Kundang NN dari IN Sumatra NN Barat NN ini PR ternyata VB juga JJ bisa AUX ditemui VB di IN daerah NN lain JJ di IN Indonesia NN. PU Contoh file korpus yang digunakan pada tesis ini dapat dilihat pada Lampiran 8. File korpus yang digunakan pada tesis ini adalah hasil pemrosesan awal (preprocessing) yang dibuat pada tesis ini. III Penyesuaian File Grammar File grammar yang digunakan pengurai Collins merupakan hasil pembangkitan dari treebank ditambah dengan aturan grammar pada pengurai Collins untuk bahasa Inggris yang masih relevan dengan bahasa Indonesia dan simbol nonterminal yang digunakan (diperiksa mungkin tidaknya untuk bahasa Indonesia). Isi file grammar ini akan terus bertambah seiring banyaknya pohon kalimat pada treebank yang digunakan untuk pembelajaran. S NP VB NN NN NN mencangkul tanah Pak tani Gambar III-4 Contoh Pohon Kalimat dalam Bahasa Indonesia III-9

10 Format file grammar merupakan tigaan (triple) dari simbol-simbol non-terminal yang mungkin. Misalkan ada pohon kalimat seperti pada Gambar III-4, maka akan menghasilkan grammar S NP VB S VB NN NP NN NN Hasil grammar pada contoh di atas akan ditulis dengan format seperti pada Tabel III-5. Tabel III-5 Contoh Penulisan Grammar L S NP VB L NP NN NN R S VB NN L berarti grammar sisi kiri dari kepala grammar dan R berarti grammar sisi kanan dari kepala grammar. Format file grammar Collins juga mengenal aturan grammar unary (U) yaitu aturan grammar yang memetakan satu simbol terminal ke satu simbol terminal yang lain. Ada juga aturan grammar sub-kategori sisi kiri (X) dan aturan grammar sub-kategori sisi kanan dimana sama dengan aturan grammar unary hanya saja ditambahkan kode sebagai penanda pembeda dengan aturan grammar unary. Penjelasan mengenai struktur data grammar yang digunakan pada tesis ini dapat dilihat pada Lampiran 13. III Penyesuaian File Simbol Non-terminal Simbol-simbol non-terminal yang digunakan untuk melakukan penyesuaian file simbol non-terminal diadaptasi dari simbol-simbol yang digunakan pengurai Collins dengan beberapa penyesuaian dengan bahasa Indonesia. Penyesuaian tersebut meliputi tidak dipakainya simbol-simbol yang dalam bahasa Indonesia tidak diperlukan misal NNP, NNPS, dan NNS untuk merepresentasikan kata benda jamak dan tidak jamak. Semua kata benda dilabeli dengan NN. Dalam bahasa Indonesia juga tidak ada determiner (DT) dan keragaman bentuk kata kerja berdasarkan waktu kalimat (VBD, VBG, VBN, VBP, VBZ). Semua kata kerja III-10

11 dalam bahasa Indonesia dilabeli dengan VB. Simbol-simbol non-terminal yang digunakan dalam tesis ini akan dibahas pada bab selanjutnya. File simbol nonterminal yang digunakan pada tesis ini dapat dilihat pada Lampiran 12. III Penyesuaian File Leksikon File leksikon merupakan file yang berfungsi sebagai kamus dalam pengurai Collins. File kamus ini akan digunakan untuk menentukan jenis kata pada proses POS tagging yang akan dijelaskan lebih lanjut pada bab selanjutnya. Sebelum dilakukan penyesuaian, file leksikon digunakan pengurai Collins untuk memeriksa tag dari file korpus masukan, tapi dalam tesis ini pemeriksaan itu tidak dilakukan karena proses POS tagging dilakukan pada pemrosesan awal. Isi file leksikon juga akan terus bertambah seiring munculnya kata baru pada treebank yang digunakan untuk pembelajaran. Proses yang dilakukan pada pemrosesan awal (preprocessing) pada tesis ini terkait dengan file leksikon adalah sebagai berikut: 1. Kata pada treebank yang ada di dalam kamus tapi tag yang diberikan pada treebank tidak sama dengan tag di dalam kamus, maka tag (pada struktur data pohon) akan diubah sama dengan yang ada di kamus, 2. Kata pada treebank yang tidak ada di dalam kamus akan diperiksa tag-nya apakah termasuk pada simbol non-terminal yang digunakan, jika termasuk maka kata akan ditambahkan ke dalam file leksikon. Contoh file leksikon yang digunakan pada tesis ini dapat dilihat pada Lampiran 11. III.1.2 Penentuan Jenis Kata (Part of Speech Tagging) Pengurai Collins memerlukan masukan berupa file korpus yang berisi kalimat beserta jenis katanya (tag) untuk kemudian diuraikan oleh pengurai Collins. Berdasarkan penelitian yang dilakukan Fadillah Z. Tala (2003) [26] menghasilkan kesimpulan bahwa pemrosesan temu balik informasi khususnya untuk POS tangging dan stemming untuk bahasa Indonesia lebih baik berbasis kamus sehingga menghasilkan lebih sedikit kesalahan dibanding berbasis aturan. Secara III-11

12 garis besar proses penentuan jenis kata yang akan dilakukan pada tesis ini adalah sebagai berikut: Jenis kata setiap kata akan dicari di dalam kamus terlebih dahulu, jika ada maka jenis kata dapat disimpulkan, Jika kata tidak ditemukan di dalam kamus maka penentuan jenis kata akan menggunakan aturan morfologi pada tata bahasa Indonesia, Jika masih juga belum dapat ditentukan jenis katanya maka jenis kata akan diprediksi dengan metode yang akan dijelaskan kemudian (Bab selanjutnya), Jika belum dapat diprediksi jenis katanya maka kata akan diberi label X (unknown). III-12

V.1 Tujuan Pengujian. V.2 Perancangan Pengujian

V.1 Tujuan Pengujian. V.2 Perancangan Pengujian BAB V PENGUJIAN V.1 Tujuan Pengujian Pengujian dilakukan untuk menguji hasil kumpulan file masukan hasil pemrosesan awal (preprocessing) dari tesis ini. Pengujian juga dilakukan untuk mengetahui kinerja

Lebih terperinci

PENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA

PENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA BAB IV PENENTUAN JENIS KATA (PART OF SPEECH TAGGING) UNTUK BAHASA INDONESIA Pada Bab IV ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses penentuan jenis kata (part of speech tagging)

Lebih terperinci

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika)

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika) PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh ROSA ARIANI SUKAMTO NIM

Lebih terperinci

BAB I PENDAHULUAN. I.1 Latar Belakang

BAB I PENDAHULUAN. I.1 Latar Belakang BAB I PENDAHULUAN I.1 Latar Belakang Pola tata bahasa memiliki manfaat dalam pemrosesan bahasa alami. Pemrosesan bahasa alami berawal dari keinginan manusia untuk berkomunikasi dengan komputer menggunakan

Lebih terperinci

TINJAUAN PUSTAKA. II.1 Model-model Pola Tata Bahasa

TINJAUAN PUSTAKA. II.1 Model-model Pola Tata Bahasa BAB II TINJAUAN PUSTAKA Bab ini membahas hal-hal apa saja yang pernah dilakukan sebelumnya mengenai model-model pola tata bahasa, pengurai (parser) untuk bahasa lain, dan pembangkitan pola tata bahasa

Lebih terperinci

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika)

PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS. ROSA ARIANI SUKAMTO NIM : (Program Magister Informatika) http://www.gangsir.com PENGURAIAN BAHASA INDONESIA DENGAN MENGGUNAKAN PENGURAI COLLINS TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung Oleh ROSA

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang 1 BAB 1 PENDAHULUAN Bab ini berisi tentang latar belakang (subbab 1.1), tujuan penelitian (subbab 1.2), perumusan dan pembatasan masalah (subbab 1.3), metodologi penelitian (subbab 1.4), serta penjelasan

Lebih terperinci

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Memasuki era big data, pertumbuhan data berbentuk dokumen teks semakin tinggi. Sehingga diperlukan text processing untuk pengolahan data yang sangat besar. Dokumen

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa alami adalah bahasa yang biasa digunakan untuk berkomunikasi antarmanusia, misalnya bahasa Indonesia, Sunda, Jawa, Inggris, Jepang, dan sebagainya. Bahasa

Lebih terperinci

PENERJEMAHAN DOKUMEN INGGRIS-INDONESIA MENGGUNAKAN MESIN PENERJEMAH STATISTIK DENGAN WORD REORDERING DAN PHRASE REORDERING

PENERJEMAHAN DOKUMEN INGGRIS-INDONESIA MENGGUNAKAN MESIN PENERJEMAH STATISTIK DENGAN WORD REORDERING DAN PHRASE REORDERING PENERJEMAHAN DOKUMEN INGGRIS-INDONESIA MENGGUNAKAN MESIN PENERJEMAH STATISTIK DENGAN WORD REORDERING DAN PHRASE REORDERING Hansel Tanuwijaya Hisar Maruli Manurung Fakultas Ilmu Komputer, Universitas Indonesia,

Lebih terperinci

UKDW BAB 1 PENDAHULUAN Latar Belakang

UKDW BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Dengan perkembangan teknologi yang semakin pesat, setiap orang dituntut untuk bisa memanfaatkan dengan baik perkembangan teknologi dan dapat menggunakan di dalam kehidupan

Lebih terperinci

Pengantar Kecerdasan Buatan (AK045218) Bahasa Alami 1

Pengantar Kecerdasan Buatan (AK045218) Bahasa Alami 1 Bahasa Alami 1 Peranan Pengetahuan dalam Bahasa Masalah Bahasa Alami Proses Sintaksis Grammar dan Parser Automated Transition Network Referensi Luger & Stubblefield : bab-3 Rich & Knight : bab 15 Bahasa

Lebih terperinci

PENGEMBANGAN PROTOTIPE APLIKASI KONVERSI KODE DARI BAHASA C KE PASCAL

PENGEMBANGAN PROTOTIPE APLIKASI KONVERSI KODE DARI BAHASA C KE PASCAL PENGEMBANGAN PROTOTIPE APLIKASI KONVERSI KODE DARI BAHASA C KE PASCAL LAPORAN TUGAS AKHIR Disusun Sebagai Syarat Kelulusan Tingkat Sarjana oleh : Ipam Fuaddina Adam / 13502079 PROGRAM STUDI TEKNIK INFORMATIKA

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa Inggris merupakan salah satu bahasa yang sering digunakan baik pada percakapan sehari-hari maupun pada dunia akademik. Penelitian mengenai pemeriksaan

Lebih terperinci

BAB 3 ARSITEKTUR DAN PERANCANGAN SISTEM

BAB 3 ARSITEKTUR DAN PERANCANGAN SISTEM 26 BAB 3 ARSITEKTUR DAN PERANCANGAN SISTEM Bab ini menjelaskan tentang arsitektur dan perancangan sistem pada saat pengerjaan tugas akhir. Pembahasan dimulai dari arsitektur sistem (subbab 3.1), korpus

Lebih terperinci

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM : PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI Oleh : SEPTIAN BAGUS WAHYONO NPM : 0734010126 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS

Lebih terperinci

DAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi.

DAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi. DAFTAR ISI ABSTRAK...i ABSTRACT... ii KATA PENGANTAR... iii DAFTAR ISI... v DAFTAR GAMBAR...vii DAFTAR TABEL... viii DAFTAR ISTILAH... ix BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah...

Lebih terperinci

1. PENDAHULUAN 1.1 Latar belakang Masalah

1. PENDAHULUAN 1.1 Latar belakang Masalah 1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.

Lebih terperinci

Aplikasi Pengolah Bahasa Alami Untuk Operasi Boolean Antar Citra Agus Purwo Handoko 5)

Aplikasi Pengolah Bahasa Alami Untuk Operasi Boolean Antar Citra Agus Purwo Handoko 5) ISSN : 1693 1173 Aplikasi Pengolah Bahasa Alami Untuk Operasi Boolean Antar Citra Agus Purwo Handoko 5) Abstrak Bahasa alami yang diproses untuk operasi Boolean merupakan bahasa Indonesia sehari-hari yang

Lebih terperinci

Bab 1 Pendahuluan 1.1 Latar Belakang

Bab 1 Pendahuluan 1.1 Latar Belakang Bab 1 Pendahuluan 1.1 Latar Belakang Bahasa merupakan salah satu aspek penting dalam kehidupan manusia karena bahasa adalah alat untuk berkomunikasi dengan manusia lain. Bahasa dapat disajikan dalam bentuk

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Salah satu cabang dari ilmu komputer yang mulai populer adalah Artificial Intelligence atau kecerdasan buatan. Kecerdasan buatan merupakan sub-bidang dari

Lebih terperinci

BAB II SINTAKS 2.1. SINTAKS

BAB II SINTAKS 2.1. SINTAKS BAB II SINTAKS 2.1. SINTAKS merupakan kumpulan aturan yang mendefinisikan suatu bentuk bahasa. mendefinisikan bagaimana suatu kalimat dibentuk sebagai barisan/urutan dari pemilihan suatu kata dasar. Kata

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa merupakan salah satu komponen yang paling penting dalam kehidupan manusia. Dalam bentuk tulisan, bahasa menyimpan pengetahuan dari satu generasi ke generasi

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING

APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING Dzulfie Zamzami 1, Dr.Eng.Faisal Rahutomo,ST.,M.Kom 2., Dwi Puspitasari, S.Kom., M.Kom.

Lebih terperinci

PERANCANGAN APLIKASI PERINGKAS KALIMAT DENGAN MENGGUNAKAN METODE NOISY CHANNEL MODEL

PERANCANGAN APLIKASI PERINGKAS KALIMAT DENGAN MENGGUNAKAN METODE NOISY CHANNEL MODEL PERANCANGAN APLIKASI PERINGKAS KALIMAT DENGAN MENGGUNAKAN METODE NOISY CHAEL MODEL Helmy Thendean, Hartono Mochtar Program Studi Teknik Informatika Universitas Tarumanagara Jl. Let. Jend. S. Parman No.

Lebih terperinci

Parsing. A -> a as baa B -> b bs abb

Parsing. A -> a as baa B -> b bs abb Parsing Misalnya: S -> ab ba A -> a as baa B -> b bs abb Penurunan untuk string aaabbabba Dalam hal ini perlu untuk melakukan percobaan pemilihan aturan produksi yang bisa mendapatkan solusi Metode Parsing

Lebih terperinci

PENGURAIAN KATA PADA KALIMAT BAHASA KOMERING RASUAN BERDASARKAN KAIDAH BAHASA INDONESIA MENGGUNAKAN TEORI AUTOMATA

PENGURAIAN KATA PADA KALIMAT BAHASA KOMERING RASUAN BERDASARKAN KAIDAH BAHASA INDONESIA MENGGUNAKAN TEORI AUTOMATA PENGURAIAN KATA PADA KALIMAT BAHASA KOMERING RASUAN BERDASARKAN KAIDAH BAHASA INDONESIA MENGGUNAKAN TEORI AUTOMATA Alvi Syahrini Utami 1), Julianisya Tri Parasta 1 alvisyahrini22@yahoo.com ABSTRACT Untuk

Lebih terperinci

Komponen sebuah Kompilator

Komponen sebuah Kompilator Komponen sebuah Kompilator Program Subjek Program Objek ANALISIS SINTESIS Penganalisis Leksikal (Scanner) Penganalisis Sintaks (Parser) Penganalisis Semantik Pembentuk Kode Pengoptimal Kode TABEL 1 Scanning

Lebih terperinci

BAB V PEMBAHASAN DAN UJI COBA HASIL PENELITIAN

BAB V PEMBAHASAN DAN UJI COBA HASIL PENELITIAN BAB V PEMBAHASAN DAN UJI COBA HASIL PENELITIAN 5.1. Penyempurnaan Berikut adalah penyempurnaan yang sudah dilakukan pada aplikasi untuk memaksimalkan kinerja sistem. 5.1.1. Kamus Sinonim Offline Pada saat

Lebih terperinci

BAB 3 ALGORITMA DAN PERANCANGAN

BAB 3 ALGORITMA DAN PERANCANGAN BAB 3 ALGORITMA DAN PERANCANGAN 3.1 Algoritma Program Dibutuhkan algoritma untuk diimplementasikan ke dalam program aplikasi ini, yaitu langkah langkah instruksi sehingga dicapai hasil yang diinginkan.

Lebih terperinci

UNIVERSITAS GUNADARMA

UNIVERSITAS GUNADARMA UNIVERSITAS GUNADARMA SK No. 92 / Dikti / Kep /1996 Fakultas Ilmu Komputer, Teknologi Industri, Ekonomi,Teknik Sipil & Perencanaan, Psikologi, Sastra Program Diploma (D3) Manajemen Informatika, Teknik

Lebih terperinci

SKRIPSI. Triastuti Chandrawati

SKRIPSI. Triastuti Chandrawati Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning SKRIPSI Triastuti Chandrawati 1204000866 UNIVERSITAS INDONESIA FAKULTAS

Lebih terperinci

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA Oleh: M Karibun H S G64101053 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Pemrosesan Bahasa Alami (Natural Language Processing) Pemrosesan bahasa alami (Natual Language Processing - NLP) merupakan salah satu bidang ilmu Kecerdasan Buatan (Artificial

Lebih terperinci

Parsing dapat dilakukan dengan cara : Penurunan terkiri (leftmost derivation) : simbol variable yang paling kiri diturunkan (tuntas) dahulu

Parsing dapat dilakukan dengan cara : Penurunan terkiri (leftmost derivation) : simbol variable yang paling kiri diturunkan (tuntas) dahulu Parsing atau Proses Penurunan Parsing dapat dilakukan dengan cara : Penurunan terkiri (leftmost derivation) : simbol variable yang paling kiri diturunkan (tuntas) dahulu Penurunan terkanan (rightmost derivation):

Lebih terperinci

BAB VI METODE PARSING

BAB VI METODE PARSING Bab VI Metode Parsing 35 BAB VI METODE PARSING TUJUAN PRAKTIKUM 1. Memahami Metode Parsing 2. Memahami Parsing Top - Down 3. Memahami Parsing Bottom - Up 4. Mengerti Tentang Operasi - Operasi yang dilakukan

Lebih terperinci

Alat bantu (tools) dalam pembuatan parser/ analisis sintaksis. Menggunakan simbol persegi panjang untuk non terminal

Alat bantu (tools) dalam pembuatan parser/ analisis sintaksis. Menggunakan simbol persegi panjang untuk non terminal Diagram Syntax Alat bantu (tools) dalam pembuatan parser/ analisis sintaksis Menggunakan simbol persegi panjang untuk non terminal Lingkaran untuk simbol terminal Misalnya E T T+E T-E E T + - BNF:

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Bahasa merupakan alat komunikasi lingual manusia baik secara lisan maupun tulisan. Dalam membuat suatu karya ilmiah, penggunaan Bahasa Indonesia harus sesuai

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Indonesia adalah bahasa resmi dari negara Indonesia. Bahasa Indonesia memiliki sekitar 23 juta penutur asli pada tahun 2010, dan lebih dari 140.000.000 penutur

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi informasi sudah semakin maju. Beberapa aplikasi text mining awal menggunakan penyajian sederhana yang disebut dengan bag-ofwords' ketika

Lebih terperinci

2.5 Context-Free Grammar (CFG) LALR Parser Bab 3 Metodologi Penelitian Studi Literatur Desain Sistem P

2.5 Context-Free Grammar (CFG) LALR Parser Bab 3 Metodologi Penelitian Studi Literatur Desain Sistem P Daftar Isi Lembar Pengesahan Pembimbing... i Lembar Pengesahan Penguji... ii Abstrak... iii Abstract... iv Pernyataan Keaslian Tulisan... v Publikasi Selama Masa Studi... vi Kontribusi Yang Diberikan Oleh

Lebih terperinci

Natural Language Processing

Natural Language Processing Disiplin ilmu NPL Natural Language Processing By: Uro Abdulrohim, S.Kom, MT Fonetik / fonologi Morfologi Sintaksis Semantik Pragmatik Discource knowledge World knowledge 1 3 Apa itu NLP Proses pembuatan

Lebih terperinci

PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL

PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL PART OF SPEECH TAGGER UNTUK BAHASA INDONESIA DENGAN MENGGUNAKAN MODIFIKASI BRILL Eka Rahayu Setyaningsih Teknik Informatika, Sekolah Tinggi Teknik Surabaya (1) e-mail: eka@stts.edu ABSTRAK Dalam penelitian

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah

Lebih terperinci

TEORI BAHASA DAN OTOMATA [TBO]

TEORI BAHASA DAN OTOMATA [TBO] TEORI BAHASA DAN OTOMATA [TBO] Teori Bahasa Teori bahasa membicarakan bahasa formal (formal language), terutama untuk kepentingan perancangan kompilator (compiler) danpemroses naskah (text processor).

Lebih terperinci

PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA

PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA Ahmad Rio Adriansyah STT Terpadu Nurul Fikri, arasy@nurulfikri.ac.id, ahmad.rio.adriansyah@gmail.com Abstrak Korpus dalam bahasa Indonesia dibutuhkan

Lebih terperinci

BAB III METODE KOMPRESI HUFFMAN DAN DYNAMIC MARKOV COMPRESSION. Kompresi ialah proses pengubahan sekumpulan data menjadi suatu bentuk kode

BAB III METODE KOMPRESI HUFFMAN DAN DYNAMIC MARKOV COMPRESSION. Kompresi ialah proses pengubahan sekumpulan data menjadi suatu bentuk kode BAB III METODE KOMPRESI HUFFMAN DAN DYNAMIC MARKOV COMPRESSION 3.1 Kompresi Data Definisi 3.1 Kompresi ialah proses pengubahan sekumpulan data menjadi suatu bentuk kode untuk menghemat kebutuhan tempat

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Teks naratif menurut kamus besar bahasa Indonesia adalah teks yang berisikan deretan sejarah, peristiwa atau kejadian dan sebagainya. Kata naratif sendiri berasal

Lebih terperinci

Spesifikasi Pengembangan Validasi HASIL DAN PEMBAHASAN Deskripsi Umum Sistem

Spesifikasi Pengembangan Validasi HASIL DAN PEMBAHASAN Deskripsi Umum Sistem Spesifikasi Tahap spesifikasi ini mencakup proses perancangan dan pemrograman perangkat lunak secara keseluruhan. Tahap ini juga melibatkan perbaikan terhadap spesifikasi sebelumnya. Perancangan BogorDelftConStruct

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi internet bagi organisasi penyedia berita mempunyai dampak positif, yaitu munculnya situs-situs microbloging yang dimanfaatkan secara optimal

Lebih terperinci

TEORI BAHASA DAN AUTOMATA

TEORI BAHASA DAN AUTOMATA MODUL I TEORI BAHASA DAN AUTOMATA Tujuan : Mahasiswa memahami pengertian dan kedudukan Teori Bahasa dan Otomata (TBO) pada ilmu komputer Definisi dan Pengertian Teori Bahasa dan Otomata Teori bahasa dan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

BAB II TINJAUAN PUSTAKA. Bahasa menurut kamus Websters adalah the body of words and methods of

BAB II TINJAUAN PUSTAKA. Bahasa menurut kamus Websters adalah the body of words and methods of BAB II TINJAUAN PUSTAKA 2.1 Bahasa Alami dan Bahasa Formal Bahasa menurut kamus Websters adalah the body of words and methods of combining words used and understood by a considerable community, sedangkan

Lebih terperinci

PERBANDINGAN ALGORITMA HUFFMAN DAN ALGORITMA SHANNON-FANO PADA PROSES KOMPRESI BERBAGAI TIPE FILE. Irwan Munandar

PERBANDINGAN ALGORITMA HUFFMAN DAN ALGORITMA SHANNON-FANO PADA PROSES KOMPRESI BERBAGAI TIPE FILE. Irwan Munandar PERBANDINGAN ALGORITMA HUFFMAN DAN ALGORITMA SHANNON-FANO PADA PROSES KOMPRESI BERBAGAI TIPE FILE I. Pendahuluan Irwan Munandar Balai Pendidikan dan Pelatihan Tambang Bawah Tanah Keterbatasan komputer

Lebih terperinci

KAKAS BANTU ANALISIS KERANCUAN KEBUTUHAN PERANGKAT LUNAK BERBASIS ATURAN

KAKAS BANTU ANALISIS KERANCUAN KEBUTUHAN PERANGKAT LUNAK BERBASIS ATURAN KAKAS BANTU ANALISIS KERANCUAN KEBUTUHAN PERANGKAT LUNAK BERBASIS ATURAN Yunata Dede Pratiwi 1, Daniel Oranova S 2, Sarwosri 3 1,2,3 Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi

Lebih terperinci

IMPLEMENTASI ALGORITMA COCKE-YOUNGER-KASAMI (CYK) DAN LEVENSHTEIN UNTUK MENGOREKSI KESALAHAN PENGEJAAN KALIMAT BAHASA INGGRIS SKRIPSI

IMPLEMENTASI ALGORITMA COCKE-YOUNGER-KASAMI (CYK) DAN LEVENSHTEIN UNTUK MENGOREKSI KESALAHAN PENGEJAAN KALIMAT BAHASA INGGRIS SKRIPSI IMPLEMENTASI ALGORITMA COCKE-YOUNGER-KASAMI (CYK) DAN LEVENSHTEIN UNTUK MENGOREKSI KESALAHAN PENGEJAAN KALIMAT BAHASA INGGRIS SKRIPSI BERRY SAFAAT HARAHAP 091401015 PROGRAM STUDI (S-1) ILMU KOMPUTER FAKULTAS

Lebih terperinci

Nama : Rendi Setiawan Nim :

Nama : Rendi Setiawan Nim : Nama : Rendi Setiawan Nim : 41813120188 Pemodelan Data Pemodelan Data dalam rekayasa perangkat lunak adalah proses menciptakan sebuah model data dengan menerapkan model deskripsi formal data menggunakan

Lebih terperinci

BAB III CFG DAN PARSING

BAB III CFG DAN PARSING BAB 3 CFG DAN PARSING 32 BAB III CFG DAN PARSING TUJUAN PRAKTIKUM 1) Memahami dan mengerti CFG. 2) Memahami dan mengerti metode parsing. TEORI PENUNJANG 3.1. Pendahuluan Bentuk umum produksi CFG adalah

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA. memerlukan Jaringan Internet. Namun Tentu saja filenya berada di komputer

BAB 2 TINJAUAN PUSTAKA. memerlukan Jaringan Internet. Namun Tentu saja filenya berada di komputer BAB 2 TINJAUAN PUSTAKA 2.1. Cloud Storage Cloud Storage Merupakan Media Penyimpanan yang dalam pengaksesannya memerlukan Jaringan Internet. Namun Tentu saja filenya berada di komputer dimana kita harus

Lebih terperinci

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL Adhitya Teguh Nugraha Program Studi Teknik Informatika Jurusan Teknik Elektro Fakultas Teknik Universitas Tanjungpura ituteguh@gmail.com

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN :

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN : Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) Edisi Volume Bulan20.. ISSN : 2089-9033 Analisis Perbandingan Algoritma LCP (Left-Corner-Parsing) Dan Algoritma CYK (Cocke-Younger-Kasami) Untuk Memeriksa

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Basis data merupakan kumpulan data yang berisi informasi yang sesuai bagi sebuah institusi/perusahaan (Silberschatz, 2002). Data-data yang disimpan dalam basis data

Lebih terperinci

Aplikasi Rekursif dalam Analisis Sintaks Program

Aplikasi Rekursif dalam Analisis Sintaks Program Aplikasi Rekursif dalam Analisis Sintaks Program Albertus Kelvin / 13514100 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132,

Lebih terperinci

ALGORITMA PEMROGRAMAN 1C SINTAKS

ALGORITMA PEMROGRAMAN 1C SINTAKS ALGORITMA PEMROGRAMAN 1C SINTAKS Indah Wahyuni PENDAHULUAN Bahasa mesin adalah bentuk terendah komputer. Kita dapat berhubungan langsung dengan bagianbagian yang ada didalam komputer seperti bits, register.

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Berdasarkan data dari Kementerian Komunikasi dan Informasi Indonesia yang diperoleh dari Lembaga Riset Pasar E-Marketer, populasi pengguna internet tanah air pada tahun

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI 2.1. Kompresi Data Kompresi adalah mengecilkan/ memampatkan ukuran. Kompresi Data adalah teknik untuk mengecilkan data sehingga dapat diperoleh file dengan ukuran yang lebih kecil

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang Masalah BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Seiring dengan perkembangan informasi, banyak pihak menyadari bahwa masalah utama telah bergeser dari cara mengakses atau bagaimana mencari informasi, namun

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Lahirnya teknologi informasi komputer dan fasilitas pendukungnya seperti layanan internet saat ini membuat perkembangan yang sangat luas. Segala informasi-informasi

Lebih terperinci

BAB 3 PERANCANGAN SISTEM

BAB 3 PERANCANGAN SISTEM BAB 3 PERANCANGAN SISTEM Bab ini menguraikan perancangan sistem yang dikembangkan meliputi arsitektur sistem, perancangan pembuat unit pengindeksan dan perancangan antarmuka. 3.1 Arsitektur Sistem Gambar

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN BAB III ANALISIS DAN PERANCANGAN Bab ini akan membahas analisis mengenai permasalahan yang didefinisikan pada tugas akhir ini yaitu pemanfaatan pohon keputusan untuk pembelajaran kasus pola penulisan SMS.

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang website adalah salah satu layanan yang bisa digunakan untuk melakukan pencarian berbagai informasi, sehingga sangat dibutuhkan untuk keperluan pengguna dalam pencarian

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Media massa memiliki berbagai jenis media penyiaran seperti televisi dan radio dan media cetak seperti surat kabar, majalah dan tabloid. Namun, dengan kemajuan teknologi

Lebih terperinci

PERANGKAT LUNAK BANTU TRY OUT UJIAN NASIONAL BERBASIS MULTI USER MENGGUNAKAN VISUAL BASIC 6.0 DAN MYSQL

PERANGKAT LUNAK BANTU TRY OUT UJIAN NASIONAL BERBASIS MULTI USER MENGGUNAKAN VISUAL BASIC 6.0 DAN MYSQL PERANGKAT LUNAK BANTU TRY OUT UJIAN NASIONAL BERBASIS MULTI USER MENGGUNAKAN VISUAL BASIC 6.0 DAN MYSQL Oleh : Dwi Apri Setyorini STMIK Duta Bangsa Surakarta ABSTRAK Seiring dengan kemajuan teknologi informasi

Lebih terperinci

Rancang Bangun Ekstraksi Ekspresi Kata Kerja pada Ulasan Pelanggan Dengan Text Chunking untuk Memaparkan Pengalaman Penggunaan Produk

Rancang Bangun Ekstraksi Ekspresi Kata Kerja pada Ulasan Pelanggan Dengan Text Chunking untuk Memaparkan Pengalaman Penggunaan Produk JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: 2337-3539 (2301-9271 Print) A-250 Rancang Bangun Ekstraksi Ekspresi Kata Kerja pada Ulasan Pelanggan Dengan Text Chunking untuk Memaparkan Pengalaman Penggunaan

Lebih terperinci

BAB III LANDASAN TEORI. Secara umum pengertian inventori adalah stock barang yang harus dimiliki

BAB III LANDASAN TEORI. Secara umum pengertian inventori adalah stock barang yang harus dimiliki BAB III LANDASAN TEORI 1.1. Inventori Secara umum pengertian inventori adalah stock barang yang harus dimiliki oleh prusahaan baik bahan baku, barang yang sudah diproses, dan barang jadi. (Ballou, 2004)

Lebih terperinci

BAB IV ANALISA SINTAKS

BAB IV ANALISA SINTAKS BAB 4 ANALISA SINTAKS 41 BAB IV ANALISA SINTAKS TUJUAN PRAKTIKUM 1) Memahami dan mengerti tugas analisa sintaks. 2) Memahami dan mengerti predictive parsing. 3) Memahami dan mengerti parsing Table M. TEORI

Lebih terperinci

SPESIFIKASI KEBUTUHAN PERANGKAT LUNAK NAMA SISTEM

SPESIFIKASI KEBUTUHAN PERANGKAT LUNAK NAMA SISTEM SPESIFIKASI KEBUTUHAN PERANGKAT LUNAK NAMA SISTEM (..) untuk: IMHERE UPI Dipersiapkan oleh: Direktorat Teknologi Informasi dan Komunikasi Universitas Pendidikan Indonesia Jl. Dr. Setiabudhi No. 229 Bandung

Lebih terperinci

Teknik Kompiler 6. oleh: antonius rachmat c, s.kom

Teknik Kompiler 6. oleh: antonius rachmat c, s.kom Teknik Kompiler 6 oleh: antonius rachmat c, s.kom Analisis Sintaks (Parser) Analisis Sintaks bergantung pada bahasa pemrograman masing-masing. Karena masing-masing bahasa pemrograman memiliki bentuk sintaks

Lebih terperinci

BAB IV METODOLOGI PENELITIAN

BAB IV METODOLOGI PENELITIAN BAB IV METODOLOGI PENELITIAN Bab ini menjelaskan tahapan metodologi penelitian yang digunakan untuk melakukan penelitian beserta penjelasan. Metodologi penelitian dibagi menjadi beberapa tahap, yaitu pengumpulan

Lebih terperinci

IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE

IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE Novario Jaya Perdana 1, Diana Purwitasari 2 Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

APLIKASI PENENTUAN JENIS PART OF SPEECH MENGGUNAKAN METODE N-GRAM DAN STRING MATCHING

APLIKASI PENENTUAN JENIS PART OF SPEECH MENGGUNAKAN METODE N-GRAM DAN STRING MATCHING APLIKASI PENENTUAN JENIS PART OF SPEECH MENGGUNAKAN METODE N-GRAM DAN STRING MATCHING 1 Nurzaenab dan 2 Purnawansyah 1 nurzaenab16@yahoo.co.id, 2 purnawansyah@gmail.com 12 Teknik Informatika, Fakultas

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1.Latar Belakang

BAB 1 PENDAHULUAN. 1.1.Latar Belakang 7 BAB 1 PENDAHULUAN 1.1.Latar Belakang Saat ini informasi sangat mudah didapatkan terutama melalui media internet. Dengan banyaknya informasi yang terkumpul atau tersimpan dalam jumlah yang banyak, user

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN BAB III ANALISIS DAN PERANCANGAN Bab ini menjelaskan mengenai analisa sistem dan perancangan yang akan digunakan untuk membuat Aplikasi Permainan Hangman Tebak Kalimat untuk Pembelajaran Bahasa Inggris

Lebih terperinci

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL Nadia Damayanti 1, Nur Rosyid Mubtada i, S.Kom, M.Kom 2, Afrida Helen S.T, M.Kom

Lebih terperinci

Format : <path>_spasi_<keywords> Contoh : 0/2/5 A,Ab,Abs

Format : <path>_spasi_<keywords> Contoh : 0/2/5 A,Ab,Abs BAB IV PERANCANGAN Bab ini akan membahas perancangan perangkat lunak yang akan dikembangkan untuk membangun dynamic folksonomy. Pembahasan meliputi perancangan mekanisme kerja sistem baru, perancangan

Lebih terperinci

IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan)

IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan) IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan) (Bab 8.5-8.8 Jurafsky & Martin) Ruli Manurung Fakultas Ilmu Komputer Universitas Indonesia 25 Februari 2008 Outline Stochastic POS Tagging

Lebih terperinci

PERTEMUAN KE 4: SISTEM DAN TEKNIK DOKUMENTASI

PERTEMUAN KE 4: SISTEM DAN TEKNIK DOKUMENTASI PERTEMUAN KE 4: SISTEM DAN TEKNIK DOKUMENTASI A. TUJUAN PEMBELAJARAN Setelah mempelajari bab ini mahasiswa diharapkan mampu memahami : 1. Memahami pengertian teknik dan sistem dokumentasi. 2. Mengetahui

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen

Lebih terperinci

APLIKASI PENGOLAH BAHASA ALAMI UNTUK OPERASI QUERI DATABASE

APLIKASI PENGOLAH BAHASA ALAMI UNTUK OPERASI QUERI DATABASE APLIKASI PENGOLAH BAHASA ALAMI UNTUK OPERASI QUERI DATABASE Taryadi Dosen STMIK Widya Pratama Pekalongan Abstrak Natural Language Processing (NLP) merupakan salah satu aplikasi Artificial Intelligence

Lebih terperinci

PERTEMUAN KE 4: SISTEM DAN TEKNIK DOKUMENTASI

PERTEMUAN KE 4: SISTEM DAN TEKNIK DOKUMENTASI PERTEMUAN KE 4: SISTEM DAN TEKNIK DOKUMENTASI A. TUJUAN PEMBELAJARAN Setelah mempelajari bab ini mahasiswa diharapkan mampu memahami : 1. Memahami pengertian teknik dan sistem dokumentasi. 2. Mengetahui

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

BAB 1 PENDAHULUAN. Universitas Sumatera Utara 1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Kata kunci (keyword) merupakan kata-kata singkat yang dapat menggambarkan isi suatu artikel ataupun dokumen (Figueroa,et al. 2014). Kata kunci memberikan kemudahan

Lebih terperinci

Text Mining. Budi Susanto. Text dan Web Mining. Teknik Informatika UKDW Yogyakarta

Text Mining. Budi Susanto. Text dan Web Mining. Teknik Informatika UKDW Yogyakarta Text Mining Budi Susanto Materi Pengertian Text Mining Pemrosesan Text Tokenisasi Lemmatization Vector Document Pengertian Text Mining Text mining merupakan penerapan konsep dan teknik data mining untuk

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

Hirarki Comsky. Unrestricted. Context Sensitive Context free Regular

Hirarki Comsky. Unrestricted. Context Sensitive Context free Regular Hirarki Comsky Unrestricted Context Sensitive Context free Regular Contoh Tata Bahasa Sederhana BEGIN END ;

Lebih terperinci

Daftar Istilah. kata yang digunakan dalam kalimat tertentu, ketika kata memiliki sejumlah makna yang berbeda.

Daftar Istilah. kata yang digunakan dalam kalimat tertentu, ketika kata memiliki sejumlah makna yang berbeda. Daftar Istilah Word Sense Disambiguation Maximal Marginal Relevance Cosine Similarity Compression Rate Synset F-Measure Proses untuk mengidentifikasi makna kata yang digunakan dalam kalimat tertentu, ketika

Lebih terperinci