BAB II LANDASAN TEORI

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II LANDASAN TEORI"

Transkripsi

1 BAB II LANDASAN TEORI 2.1 Struktur Baku Kalimat Bahasa Indonesia Landasan teori yang dikemukakan tentang struktur baku kalimat Bahasa Indonesia pada bab ini mengacu pada [10]. Kalimat umumnya berwujud rentetan kata yang disusun sesuai dengan kaidah yang berlaku. Tiap kata dalam kalimat mempunyai tiga klasifikasi yaitu (1) kategori sintaksis, (2) fungsi sintaksis, (3) peran semantisnya. Tabel 2. 1 Contoh Hubungan Bentuk, Kategori, Fungsi dan Peran Unsur Kalimat Bentuk Ibu saya tidak membeli baju baru untuk kami minggu lalu Kata N Pron Adv V N Adj Prep N N V Frasa FN FV FN Fprep FN Fungsi subjek Predikat Objek pelengkap Keterangan Peran Pelaku Perbuatan Sasaran Peruntung Waktu Bagian-bagian Kalimat Dilihat dari segi bentuknya, kalimat dapat dirumuskan sebagai konstruksi sintaksis terbesar yang terdiri atas dua kata atau lebih. Antara kalimat dan kata terdapat dua satuan sintaksis antara, yaitu klausa dan frasa. Klausa merupakan satuan sintaksis yang terdiri atas dua kata, atau lebih, yang mengandung unsur predikasi. Sedangkan frasa adalah satuan sintaksis yang terdiri atas dua kata atau lebih yang tidak mengandung unsur predikasi Struktur Kalimat Dasar Yang dimaksud dengan kalimat dasar adalah kalimat yang (i) terdiri atas satu klausa, (ii) unsur-unsurnya lengkap, (iii) susunan unsur-unsurnya menurut urutan yang paling umum, dan (iv) tidak mengandung pertanyaan atau pengingkaran [11]. Dengan kata lain, kalimat dasar di sini identik dengan kalimat tunggal deklaratif afirmatif yang urutan unsur-unsurnya paling lazim. 9

2 Berdasarkan ciri-ciri yang dimilikinya, kalimat dasar dapat dibedakan ke dalam enam tipe [11]. Tipe Tabel 2. 2 Pola Kalimat Dasar Fungsi S P O Pel Ket 1. S-P Saya dosen 2. S-P-O Rani Mendapat Uang 3. S-P-Pel Pancasila adalah dasar negara kita 4. S-P-Ket itu terjadi tadi pagi 5. S-P-O-Pel Dia mengirimi kami uang 6. S-P-O-Ket Beliau memberi kami Pada struktur kalimat dasar, di antara kalimat dan kata, biasanya ada satuan-antara yang berupa kelompok kata. Kelompok kata yang menjadi salah satu unsur pembentuk kalimat ini dikenal dengan sebutan frasa. Dalam bahasa Indonesia dikenal lima buah frasa yang lazim menjadi unsur pembentuk kalimat. Kelima buah frasa ini, antara lain yaitu : frasa verbal, frasa nominal, frasa, pronominal, frasa adjektival, dan frasa numeralia Fungsi Sintaksis Unsur-unsur Kalimat Terdapat lima fungsi sintaktis yang digunakan untuk membangun sebuah kalimat, yaitu subjek, predikat, objek, pelengkap dan keterangan. Suatu pernyataan merupakan suatu kalimat jika di dalam pernyataan tersebut sekurang-kurangnya terdapat subjek dan predikat, baik disertai objek, pelengkap, atau keterangan maupun tidak. 2.2 Makna Pada bab ini teori mengenai penjelasan makna mengacu pada [10]. Dalam [10] makna diartikan sebagai arti, maksud pembicara atau penulis, pengertian yang diberikan kepada suatu bentuk kebahasaan. rasa aman 10

3 2.2.1 Pendekatan Makna Makna dapat dibicarakan dari dua pendekatan, yakni pendekatan analitik atau referensial dan pendekatan operasional. Pendekatan analitik ingin mencari makna dengan cara menguraikannya atas segmen-segmen utama, sedangkan pendekatan operasional ingin mempelajari kata dalam penggunaannya. Pendekatan operasional lebih menekankan, bagaimana kata dioperasikan di dalam tindak fonasi sehari-hari. Di depan telah dikatakan bahwa pendekatan analitik ingin menguraikan makna dengan jalan segmentasi. Misalkan contoh kata istri. Dilihat dari pendekatan analitik, kata istri dapat diuraikan menjadi: perempuan, telah bersuami, kemungkinan telah beranak, manusia, ramah-tamah, berambut panjang, berfungsi sebagai pendamping suami. Jika kata istri dilihat dari segi pendekatan operasional, akan terlihat dari kemungkinan-kemungkinan pemunculannya dalam kalimat-kalimat, misalnya sebagai berikut: Si Dula mempunyai istri; Istri si Ali telah meninggal; Banyak istri yang bekerja di kantor. Tetapi tidak mungkin orang mengatakan: Istri si Ali berkaki tiga; Istri tidak pernah melahirkan. Pendekatan operasional menggunakan tes subtitusi untuk menentukan tepat tidaknya makna sebuah kata Ambiguitas Keragu-raguan tentang makna kata atau makna kalimat dalam linguistik disebut ambiguitas. Ambiguitas timbul dalam berbagai variasi ujaran atau bahasa tertulis Homonim Homonim adalah kata yang sama ejaan atau lafalnya, tetapi mengungkapkan makna yang berbeda-beda karena berasal dari sumber yang berlainan. Bergantung kepada keidentikan dalam ejaan atau lafalnya, suatu homonim disebut homograf atau homofon Homograf Homograf adalah bentuk istilah yang sama ejaannya, tetapi maknanya berbeda. Contohnya kata bisa yang dapat bermakna dapat atau bermakna racun binatang. 11

4 2.3 Natural Language Processing Natural Language Processing (NLP) adalah penerapan ilmu komputer, khususnya linguistik komputasional (computational linguistics), untuk mengkaji interaksi antara komputer dengan bahasa (alami) manusia. NLP berupaya memecahkan masalah untuk memahami bahasa alami manusia, dengan segala aturan gramatika dan semantiknya, dan mengubah bahasa tersebut menjadi representasi formal yang dapat diproses oleh computer [12]. Dalam penerapannya, tujuan NLP untuk memahami bahasa manusia ini memiliki banyak tantangan, yang antara lain adalah sebagai berikut: 1. Penandaan kelas kata (part-of-speech tagging). Sulit untuk menandai kelas kata (kata benda, kata kerja, kata sifat, dsb.) suatu kata dalam teks karena pengelasan kata sangat bergantung kepada konteks penggunaannya. 2. Segmentasi teks (text segmentation). Penentuan segmentasi sulit dilakukan pada bahasa tulis yang tidak memiliki pembatas kata spesifik (misal: bahasa Mandarin, Jepang, dan Thailand) serta pada bahasa lisan yang kadang membaurkan bunyi antarkata. 3. Disambiguasi makna kata (word sense disambiguation). Banyak kata memiliki lebih dari satu makna, baik dalam bentuk homonim (makna berbeda dan tidak terkait, contohnya bisa dalam makna dapat dan racun ) maupun polisemi (makna berbeda, namun terkait, mis. ragu dalam makna bimbang dan sangsi ). Pembedaan makna hanya dapat dilakukan dengan melihat konteks penggunaan. 4. Ambiguitas sintaksis (syntactic ambiguity). Suatu bahasa memiliki berbagai kemungkinan struktur kalimat. Pemilihan struktur yang paling tepat biasanya membutuhkan gabungan informasi semantic dan kontekstual. 5. Masukan yang tak sempurna atau tak teratur (imperfect or irregular input). Aksen dalam bahasa lisan serta kesalahan ejaan dan gramatikal dalam bahasa tulis menyulitkan pemrosesan bahasa 12

5 alami. 6. Pertuturan (speech act). Struktur kalimat saja kadang tidak dapat dengan tepat menggambarkan maksud penutur atau penulis. Kadang gaya bahasa dan konteks menentukan maksud yang diinginkan. Di luar dari kesulitan-kesulitan tersebut, NLP telah berhasil diterapkan untuk berbagai tugas yang semula hanya dapat dilakukan oleh manusia. Beberapa bidang populer dalam penerapan NLP adalah sebagai berikut: 1. Pemerolehan informasi (information retrieval). Pencarian dokumen yang relevan, pencarian informasi spesifik di dalam dokumen, serta pembuatan metadata. 2. Penjawaban pertanyaan (question answering). Secara otomatis menjawab pertanyaan yang diajukan dengan bahasa alami dengan jawaban dalam bahasa alami pula. 3. Perangkuman otomatis (automatic summarization). Pembuatan versi singkat berisi butir-butir penting dari suatu dokumen dengan menggunakan program komputer. 4. Penerjemahan mesin (machine translation). Penerjemahan otomatis dari suatu bahasa alami ke bahasa lain. 5. Pengenalan wicara (speech recognition). Pengubahan bahasa lisan menjadi masukan yang dikenali oleh mesin, misalnya pada pendiktean bahasa lisan kepada komputer untuk menghasilkan bahasa tulis atau pelaksanaan suatu perintah oleh komputer berdasarkan bahasa lisan dari manusia. 6. Sintesis wicara (speech synthesis). Pengubahan bahasa tulis menjadi bahasa lisan, kebalikan dari pengenalan wicara. 7. Pengenalan karakter optis (optical character recognition). Pengubahan tulisan tangan atau teks tercetak (biasanya melalui pemindai) menjadi dokumen yang dapat dikenali oleh mesin. 13

6 8. Analisis sentimen (Sentiment Analysis). Ekstraksi informasi dari sumber data teks untuk mendeteksi pandangan positif atau negatif terhadap suatu objek. Biasanya diterapkan untuk mengidentifikasi tren opini publik terhadap suatu produk atau perusahaan. 2.4 Text Mining Text Mining adalah proses ekstraksi pola (informasi dan pengetahuan yang berguna) dari sejumlah besar sumber data tak terstruktur. Penambangan teks memiliki tujuan dan menggunakan proses yang sama dengan penambangan data, namun memiliki masukan yang berbeda. Masukan untuk penambangan teks adalah data yang tidak (atau kurang) terstruktur, seperti dokumen Word, PDF, kutipan teks, dll., sedangkan masukan untuk penambangan data adalah data yang terstruktur [13]. Penambangan teks dapat dianggap sebagai proses dua tahap yang diawali dengan penerapan struktur terhadap sumber data teks dan dilanjutkan dengan ekstraksi informasi dan pengetahuan yang relevan dari data teks terstruktur ini dengan menggunakan teknik dan alat yang sama dengan penambangan data. Area penerapan penambangan teks yang paling populer adalah: 1. Ekstraksi informasi (information extraction): Identifikasi frasa kunci dan keterkaitan di dalam teks dengan melihat urutan tertentu melalui pencocokan pola. 2. Pelacakan topik (topic tracking): Penentuan dokumen lain yang menarik seorang pengguna berdasarkan profil dan dokumen yang dilihat pengguna tersebut. 3. Perangkuman (summarization): Pembuatan rangkuman dokumen untuk mengefisienkan proses membaca. 4. Kategorisasi (categorization): Penentuan tema utama suatu teks dan pengelompokan teks berdasarkan tema tersebut ke dalam kategori yang telah ditentukan. 5. Penggugusan (clustering): Pengelompokan dokumen yang serupa tanpa penentuan kategori sebelumnya (berbeda dengan kategorisasi 14

7 di atas). 6. Penautan konsep (concept linking): Penautan dokumen terkait dengan identifikasi konsep yang dimiliki bersama sehingga membantu pengguna untuk menemukan informasi yang mungkin tidak akan ditemukan dengan hanya menggunakan metode pencarian tradisional. 7. Penjawaban pertanyaan (question answering): Pemberian jawaban terbaik terhadap suatu pertanyaan dengan pencocokan pola berdasarkan pengetahuan. 2.5 Word Sense Disambiguation Word Sense Disambiguation atau Disambiguasi Makna Kata merupakan salah satu topik dari NLP (Natural Language Processing). Secara harfiah Word Sense Disambiguation (WSD) merupakan salah satu topik yang penting dalam Natural Language Processing (NLP), di mana bertujuan untuk menentukan makna suatu kata. WSD banyak digunakan pada aplikasi seperti mesin penterjemah, pengektraks informasi/berita, mesin tanya jawab, perangkuman opini. Berkaitan dengan makna dari suatu kata, apabila kita mempelajari salah satu bahasa, maka akan kita temukan bahwa sebuah kata dapat mempunyai banyak makna seperti contoh dalam bahasa inggris, kata call dapat berarti command to come, dapat juga berarti a telephone connection, bahkan dalam online wordnet 3.0 ditemukan ±30 arti call, di sinilah peranan WSD untuk memilih dari 30 arti call, tentunya setelah kata tersebut dimasukkan dalam kalimat. 2.6 Text Preprocessing Struktur data yang baik dapat memudahkan proses komputerisasi secara otomatis. Pada Text Mining, informasi yang akan digali berisi informasiinformasi yang strukturnya sembarang. Oleh karena itu, diperlukan proses pengubahan bentuk menjadi data yang terstruktur sesuai kebutuhannya untuk proses dalam data mining, yang biasanya akan menjadi nilai-nilai numerik. Proses ini sering disebut Text Preprocessing [13]. Setelah data menjadi data 15

8 terstruktur dan berupa nilai numerik maka data dapat dijadikan sebagai sumber data yang dapat diolah lebih lanjut. Berberapa proses yang dilakukan adalah sebagai berikut : 1. Case folding Case folding adalah mengubah semua huruf dalam dokumen menjadi huruf kecil. Hanya huruf a sampai dengan z yang diterima. Karakter selain huruf dihilangkan dan dianggap delimiter. 2. Tokenizing Tahap Tokenizing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. 3. Stemming Tahap stemming adalah tahap mencari root kata dari tiap kata hasil filtering. Pada tahap ini dilakukan proses pengembalian berbagai bentukan kata ke dalam suatu representasi yang sama. 2.7 Algoritma Lesk Pada referensi [6] disebutkan bahwa algoritma Lesk merupakan implementasi dari pendekatan unsupervised yang digunakan untuk menghilangkan ambiguitas makna kata. Algoritma ini berdasarkan intuisi bahwa kata yang bermakna ambigu yang terdapat bersamaan dalam kalimat, digunakan untuk merujuk topik yang sama dan makna yang berhubungan dengan topik tersebut didefinisikan di dalam kamus dengan menggunakan kata yang sama. Algoritma Lesk memiliki fungsi relatedness (keterhubungan) akan mengembalikan jumlah kata yang tumpang tindih antara definisi dari dua kata yang diinput. Berikut ini adalah pseudo code algoritma Lesk : for every word w[i] in the phrase let BEST_SCORE = 0 16

9 let BEST_SENSE = null for every sense sense[j] of w[i] let SCORE = 0 for every other word w[k] in the phrase, k!= i for every sense sense[l] of w[k] SCORE = SCORE + number of words that occur in the gloss of both sense[j] and sense[l] end for end for if SCORE > BEST_SCORE BEST_SCORE = SCORE BEST_SENSE = w[i] end if end for if BEST_SCORE > 0 output BEST_SENSE else output "Could not disambiguate w[i]" end if end for Di bawah ini adalah contoh penerapan algoritma Lesk terhadap ungkapan pine cone, dengan menggunakan Oxford Advance Learner s Dictionary, ditemukan kata pine mempunyai dua makna yaitu: makna 1 : kind of evergreen tree with needle- shaped leaves makna 2 : waste away through sorrow or illness Sedangkan kata cone mempunyai tiga makna, yaitu: makna 1 : solid body which narrow to a point makna 2 : something of this shape wheter solid or hollow makna 3 : fruit of certain evergreen tree Setiap makna dari pine dibandingkan dengan setiap makna dari cone, kemudian didapat bahwa evergreen tree muncul di dalam salah satu makna dari kata pine dan cone. Karena kemunculannya hanya untuk kata evergreen tree, maka berdasarkan algoritma Lesk, evergreen tree akan mendapat skor 1. Jadi, evergreen tree dianggap menjadi makna yang tepat jika kata pine dan cone digabung menjadi pine cone. 17

10 2.8 Algoritma Simplified Lesk Sesuai dengan [8], algoritma lesk mengalami modifikasi dan dinamakan dengan algoritma simplified lesk. Definisi dari algoritma ini adalah menghitung nilai overlap antara definisi makna kata dengan konteks kalimat sebelumnya. Berikut merupakan tahapan dari algoritma simplified lesk : a. Retrieve from MRD all sense defintions of the word tobe disambiguated b. Determine the overlap between each sense definition and the current context c. Choose the sense the leads to highest overlap Sebagai contoh implementasi dari algoritma simplified lesk : Untuk menjelaskan kata buku dalam kalimat : tebu itu mempunyai buku yang sangat keras Makna 1 : lembar kertas yang berjilid, berisi tulisan atau kosong, kitab Makna 2 : bagian yang keras tempat pertemuan dua ruas(jari, buluh, tebu) Ditemukan kata tree dalam makna 1 yang tumpeng tindih dengan kalimat (konteks sebelumnya). Sehingga perhitungan untuk overlap pada tiap makna kata adalah : Pine#1 Sentence = 0 Pine#2 Sentence = 2 Dari perhitungan diatas dapat ditarik kesimpulan, bahwa makna 1 mendapatkan skor 0 dan skor makna ke 2 adalah 2 sehingga makna kata buku yang sesuai dalam kalimat diatas adalah makna KBBI Kamus Besar Bahasa Indonesia (KBBI) merupakan kamus Bahasa Indonesia yang disusun oleh Pusat Bahasa, Kementrian Pendidikan Nasional dan diterbitkan oleh Balai Pustaka. Kamus ini dipercaya sebagai rujukan utama untuk mengetahui arti dari suatu kata dalam Bahasa Indonesia, dan menjadi acuan tertinggi Bahasa Indonesia yang baku. 18

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Natural Language Processing Natural Language Processing (NLP) adalah penerapan ilmu komputer, khususnya linguistik komputasional (computational linguistics), untuk mengkaji interaksi

Lebih terperinci

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa alami adalah bahasa yang biasa digunakan untuk berkomunikasi antarmanusia, misalnya bahasa Indonesia, Sunda, Jawa, Inggris, Jepang, dan sebagainya. Bahasa

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Indonesia adalah bahasa resmi dari negara Indonesia. Bahasa Indonesia memiliki sekitar 23 juta penutur asli pada tahun 2010, dan lebih dari 140.000.000 penutur

Lebih terperinci

UKDW BAB 1 PENDAHULUAN Latar Belakang

UKDW BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Dengan perkembangan teknologi yang semakin pesat, setiap orang dituntut untuk bisa memanfaatkan dengan baik perkembangan teknologi dan dapat menggunakan di dalam kehidupan

Lebih terperinci

BAB I PENDAHULUAN! 1.1 Latar Belakang

BAB I PENDAHULUAN! 1.1 Latar Belakang 1.1 Latar Belakang BAB I PENDAHULUAN Untuk dapat tetap bisa menjalankan proses bisnisnya dengan baik, suatu instansi harus memenuhi suatu standar dalam melayani keinginan konsumen atau yang biasa dikenal

Lebih terperinci

BAB I PENDAHULUAN. Kemiripan makna dalam suatu bentuk kebahasaan dapat menimbulkan

BAB I PENDAHULUAN. Kemiripan makna dalam suatu bentuk kebahasaan dapat menimbulkan BAB I PENDAHULUAN 1.1 Latar Belakang Kemiripan makna dalam suatu bentuk kebahasaan dapat menimbulkan kekacauan pada tindak berbahasa. Salah satu contoh penggunaan bentuk bersinonim yang dewasa ini sulit

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Natural Language Processing Natural language processing (NLP), merupakan salah satu pendekatan terkomputerisasi untuk menganalisa teks berdasarkan aspek teori dan teknologi. Menurut

Lebih terperinci

Regina Malvinasrani Gitasari¹, -². ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Regina Malvinasrani Gitasari¹, -². ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom Tugas Akhir - 2007 PENGHILANGAN AMBIGUITAS MAKNA KATA DALAM KALIMAT BERBAHASA INDONESIA DENGAN MENGGUNAKAN PARSER, WORDNET DAN ALGORITMA LESK WORD SENSE DISAMBIGUATION IN INDONESIAN SENTENCE USE PARSER,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

Alat Sintaksis. Kata Tugas (Partikel) Intonasi. Peran. Alat SINTAKSIS. Bahasan dalam Sintaksis. Morfologi. Sintaksis URUTAN KATA 03/01/2015

Alat Sintaksis. Kata Tugas (Partikel) Intonasi. Peran. Alat SINTAKSIS. Bahasan dalam Sintaksis. Morfologi. Sintaksis URUTAN KATA 03/01/2015 SINTAKSIS Pengantar Linguistik Umum 26 November 2014 Morfologi Sintaksis Tata bahasa (gramatika) Bahasan dalam Sintaksis Morfologi Struktur intern kata Tata kata Satuan Fungsi Sintaksis Struktur antar

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang 1.1 Latar Belakang BAB 1 PENDAHULUAN Chatbot adalah sebuah program komputer yang dirancang untuk mensimulasikan sebuah percakapan atau komunikasi yang interaktif kepada pengguna (manusia) melalui bentuk

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Basis data merupakan kumpulan data yang berisi informasi yang sesuai bagi sebuah institusi/perusahaan (Silberschatz, 2002). Data-data yang disimpan dalam basis data

Lebih terperinci

Gambar 1.1 Proses Text Mining [7]

Gambar 1.1 Proses Text Mining [7] 1. BAB II LANDASAN TEORI 2.1 Text Mining Text mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

ANALISA KOMPETENSI DOSEN DALAM PENENTUAN MATAKULIAH YANG DIAMPU MENGGUNAKAN METODE CF-IDF A B S T R A K

ANALISA KOMPETENSI DOSEN DALAM PENENTUAN MATAKULIAH YANG DIAMPU MENGGUNAKAN METODE CF-IDF A B S T R A K ANALISA KOMPETENSI DOSEN DALAM PENENTUAN MATAKULIAH YANG DIAMPU MENGGUNAKAN METODE CF-IDF Oleh : Tacbir Hendro Pudjiantoro A B S T R A K Kompetensi dosen adalah salah satu bagian yang utama dalam penunjukan

Lebih terperinci

Text Pre-Processing. M. Ali Fauzi

Text Pre-Processing. M. Ali Fauzi Text Pre-Processing M. Ali Fauzi Latar Belakang Latar Belakang Dokumen-dokumen yang ada kebanyakan tidak memiliki struktur yang pasti sehingga informasi di dalamnya tidak bisa diekstrak secara langsung.

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Kata Pengertian kata secara sederhana adalah sekumpulan huruf yang mempunyai arti. Dalam kamus besar bahasa indonesia (KBBI) pengertian kata adalah unsur bahasa yang diucapkan

Lebih terperinci

BAB I PENDAHULUAN. menyampaikan suatu pesan dari seseorang ke orang lain. Berbahasa yang baik dan

BAB I PENDAHULUAN. menyampaikan suatu pesan dari seseorang ke orang lain. Berbahasa yang baik dan BAB I PENDAHULUAN 1.1 Latar belakang Bahasa merupakan suatu alat komunikasi yang digunakan untuk menyampaikan suatu pesan dari seseorang ke orang lain. Berbahasa yang baik dan benar ialah berbahasa sesuai

Lebih terperinci

BAB I PENDAHULUAN. Linguistik, semantik adalah bidang yang fokus mempelajari tentang makna baik yang berupa text

BAB I PENDAHULUAN. Linguistik, semantik adalah bidang yang fokus mempelajari tentang makna baik yang berupa text BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa adalah alat komunikasi yang digunakan oleh manusia dalam kehidupan seharihari. Ketika berbahasa ada bentuk nyata dari pikiran yang ingin disampaikan kepada mitra

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

BAB II KAJIAN PUSTAKA DAN KERANGKA TEORETIK

BAB II KAJIAN PUSTAKA DAN KERANGKA TEORETIK BAB II KAJIAN PUSTAKA DAN KERANGKA TEORETIK 2.1 Teori-Teori Yang Relevan Dengan Variabel Yang Diteliti 2.1.1 Pengertian Semantik Semantik ialah bidang linguistik yang mengkaji hubungan antara tanda-tanda

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi informasi sudah semakin maju. Beberapa aplikasi text mining awal menggunakan penyajian sederhana yang disebut dengan bag-ofwords' ketika

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang 1 BAB 1 PENDAHULUAN Bab ini berisi tentang latar belakang (subbab 1.1), tujuan penelitian (subbab 1.2), perumusan dan pembatasan masalah (subbab 1.3), metodologi penelitian (subbab 1.4), serta penjelasan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Twitter Twiter adalah sebuah layanan media sosial yang memungkinkan penggunanya untuk menulis maksimal 140 karakter, yang dikenal sebagai Tweet. Twitter didirikan oleh Jack Dorsey

Lebih terperinci

SPEECH RECOGNITION (Pengenalan Ucapan)

SPEECH RECOGNITION (Pengenalan Ucapan) MODUL 1 SPEECH RECOGNITION (Pengenalan Ucapan) Komunikasi Bahasa Lisan Human Computer Input Speech Recognition Text Output Speech Synthesis Text Generation Meaning Understanding 1 Speech recognition memiliki

Lebih terperinci

BAB I PENDAHULUAN. alam pikiran sehingga terwujud suatu aktivitas. dalam pikiran pendengar atau pembaca.

BAB I PENDAHULUAN. alam pikiran sehingga terwujud suatu aktivitas. dalam pikiran pendengar atau pembaca. BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa merupakan alat untuk berkomunikasi sehari-hari oleh para penuturnya. Bahasa merupakan sesuatu yang sangat penting dalam proses berpikir maupun dalam kegiatan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang

Lebih terperinci

04/10/2016. Dengan bangga, kami mempersembahkan KALIMAT. Pertemuan 6

04/10/2016. Dengan bangga, kami mempersembahkan KALIMAT. Pertemuan 6 Dengan bangga, kami mempersembahkan KALIMAT Pertemuan 6 1 Bahasan Identifikasi Aktualisasi Unsur-unsur Struktur Pengembangan Identifikasi Kalimat ialah satuan bahasa terkecil, dalam wujud lisan atau tulisan

Lebih terperinci

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat

Lebih terperinci

PROGRAM PEMBELAJARAN BAHASA INGGRIS KELAS III - SEMESTER 2

PROGRAM PEMBELAJARAN BAHASA INGGRIS KELAS III - SEMESTER 2 PROGRAM PEMBELAJARAN BAHASA INGGRIS KELAS III - SEMESTER 2 1 KEPALA SEKOLAH PROGRAM SEMESTER TAHUN PELAJARAN 20 / 20 MATA PELAJARAN : Bahasa Inggris KELAS / SEMESTER : III (Tiga) / 2 (dua) Standar Kompetensi

Lebih terperinci

BAB I PENDAHULUAN. Berbeda dengan sintaksis yang mempelajari bagaimana satuan bahasa terbentuk,

BAB I PENDAHULUAN. Berbeda dengan sintaksis yang mempelajari bagaimana satuan bahasa terbentuk, BAB I PENDAHULUAN 1.1 Latar Belakang Dalam mempelajari bahasa Inggris terutama yang berkenaan dengan makna yang terkandung dalam setiap unsur suatu bahasa, semantik merupakan ilmu yang menjadi pengukur

Lebih terperinci

NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER

NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER Hanif Al Fatta Abstraksi Aplikasi konsep AI terus berkembang. Salah satunya adalah bagaimana membuat komputer memahami perintah yang diberikan

Lebih terperinci

BAB 1 PENDAHULUAN. Latar Belakang

BAB 1 PENDAHULUAN. Latar Belakang BAB 1 PENDAHULUAN Latar Belakang Berita pada media massa online bertambah banyak setiap waktu karena selalu ada sesuatu yang patut untuk diberitakan kepada khalayak. Hal ini membuat pembaca harus menyiapkan

Lebih terperinci

KATA TANYA DALAM KONSTRUKSI INTEROGATIF BAHASA INDONESIA: KAJIAN SINTAKTIS DAN SEMANTIS

KATA TANYA DALAM KONSTRUKSI INTEROGATIF BAHASA INDONESIA: KAJIAN SINTAKTIS DAN SEMANTIS Kata Tanya dalam Konstruksi Interogatif Bahasa Indonesia: Kajian Sintaktis dan Semantis (Wini Tarmini) KATA TANYA DALAM KONSTRUKSI INTEROGATIF BAHASA INDONESIA: KAJIAN SINTAKTIS DAN SEMANTIS Wini Tarmini

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang website adalah salah satu layanan yang bisa digunakan untuk melakukan pencarian berbagai informasi, sehingga sangat dibutuhkan untuk keperluan pengguna dalam pencarian

Lebih terperinci

BAB I PENDAHULUAN. gabah, dan yang sudah dibuang kulit luarnya disebut beras. Dalam praktek di

BAB I PENDAHULUAN. gabah, dan yang sudah dibuang kulit luarnya disebut beras. Dalam praktek di BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Padi merupakan bahan makanan pokok bagi masyarakat Indonesia. Sebagian dari masyarakat kita sumber makanannya dapat berasal dari jagung, sorghum, dan sagu.

Lebih terperinci

BAB II TINJAUAN PUSTAKA. sekunder yang akan mendukung penelitian, juga diperlukan untuk mengetahui sampai

BAB II TINJAUAN PUSTAKA. sekunder yang akan mendukung penelitian, juga diperlukan untuk mengetahui sampai BAB II TINJAUAN PUSTAKA 2.1 Kepustakaan Yang Relevan Pengkajian teori tidak akan terlepas dari kajian pustaka atau studi pustaka karena teori secara nyata dapat dipeoleh melalui studi atau kajian kepustakaan.

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat

Lebih terperinci

Natural Language Processing

Natural Language Processing Disiplin ilmu NPL Natural Language Processing By: Uro Abdulrohim, S.Kom, MT Fonetik / fonologi Morfologi Sintaksis Semantik Pragmatik Discource knowledge World knowledge 1 3 Apa itu NLP Proses pembuatan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Memasuki era big data, pertumbuhan data berbentuk dokumen teks semakin tinggi. Sehingga diperlukan text processing untuk pengolahan data yang sangat besar. Dokumen

Lebih terperinci

BAB 1 PENDAHULUAN. fonologi, morfologi, sintaksis, maupun semantik (Tarigan dan

BAB 1 PENDAHULUAN. fonologi, morfologi, sintaksis, maupun semantik (Tarigan dan BAB 1 PENDAHULUAN 1.1. Latar Belakang Fungsi bahasa adalah sebagai alat komunikasi yang memungkinkan manusia dapat berkomunikasi dengan sesamanya baik secara lisan maupun tulisan. Komunikasi akan berlangsung

Lebih terperinci

BAB I PENDAHULUAN. Orasi ilmiah DR. Arry Akhmad Arman, Fakultas Teknologi Industri, ITB, 23 Agustus

BAB I PENDAHULUAN. Orasi ilmiah DR. Arry Akhmad Arman, Fakultas Teknologi Industri, ITB, 23 Agustus BAB I PENDAHULUAN 1. LATAR BELAKANG MASALAH llmu komputer memiliki dua komponen utama; pertama, model dan gagasan mendasar mengenai komputasi, kzdua, teknik rekayasa untuk perancangan sistem komputasi

Lebih terperinci

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma

Lebih terperinci

BAB I PENDAHULUAN. komunikasi, yaitu lisan dan tulisan. Komunikasi lisan adalah komunikasi yang

BAB I PENDAHULUAN. komunikasi, yaitu lisan dan tulisan. Komunikasi lisan adalah komunikasi yang BAB I PENDAHULUAN 1.1 Latar Belakang Untuk dapat berkomunikasi antarsesama manusia terdapat 2 jenis komunikasi, yaitu lisan dan tulisan. Komunikasi lisan adalah komunikasi yang dilakukan oleh dua orang

Lebih terperinci

BAB 1. Universitas Sumatera Utara

BAB 1. Universitas Sumatera Utara BAB 1 PENDAHULUAN 1.1 Latar Belakang Berdasarkan UUD 1945 Pasal 36 Bahasa Indonesia sebagai bahasa nasional yang berfungsi sebagai alat komunikasi formal di negara Indonesia. Selain sebagai alat komunikasi,

Lebih terperinci

@UKDW BAB 1 PENDAHULUAN Latar Belakang

@UKDW BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Pada saat ini, sangatlah mudah untuk mendapatkan informasi, baik melalui media cetak maupun media elektronik. Akan tetapi, banyaknya informasi yang ada belum tentu

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan sebuah informasi berbanding lurus dengan tingginya laju teknologi pada saat ini, ketersediaan dan perkembangan dari informasi yang berbentuk text digital

Lebih terperinci

Bab 1 Pendahuluan 1.1 Latar Belakang

Bab 1 Pendahuluan 1.1 Latar Belakang Bab 1 Pendahuluan 1.1 Latar Belakang Bahasa merupakan salah satu aspek penting dalam kehidupan manusia karena bahasa adalah alat untuk berkomunikasi dengan manusia lain. Bahasa dapat disajikan dalam bentuk

Lebih terperinci

Budi Susanto Versi /08/2012. Teknik Informatika UKDW Yogyakarta

Budi Susanto Versi /08/2012. Teknik Informatika UKDW Yogyakarta Budi Susanto Versi 1.0 29/08/2012 1 Memahami pengertian dari text mining dan web mining Memahami latar belakang perlunya pengolahan dokumen teks dan web Memahami arsitektur dasar aplikasi text dan web

Lebih terperinci

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Dokumen Penyimpanan yang Terorganisasi Database Mahasiswa Database Buku ID Nama Buku Pengarang 001 Information Retrieval Ricardo baeza

Lebih terperinci

BAB I PENDAHULUAN. dibandingkan komunikasi dalam bentuk tulisan. bahasa Indonesia ragam lisan atau omong.

BAB I PENDAHULUAN. dibandingkan komunikasi dalam bentuk tulisan. bahasa Indonesia ragam lisan atau omong. BAB I PENDAHULUAN A. Latar Belakang Masalah Manusia lebih banyak melakukan komunikasi lisan daripada komunikasi tulisan oleh sebab itu, komunikasi lisan dianggap lebih penting dibandingkan komunikasi dalam

Lebih terperinci

BAB I PENDAHULUAN. Surat kabar atau dapat disebut koran merupakan lembaran-lembaran kertas

BAB I PENDAHULUAN. Surat kabar atau dapat disebut koran merupakan lembaran-lembaran kertas 1 BAB I PENDAHULUAN 1.1 Latar Belakang Surat kabar atau dapat disebut koran merupakan lembaran-lembaran kertas yang bertuliskan berita-berita dan sebagainya (Sugono ed., 2015:872). Beritaberita dalam surat

Lebih terperinci

Analisis Penggunaan Kalimat Bahasa Indonesia pada Karangan Siswa Kelas V Sekolah Dasar Negeri 10 Sanur, Denpasar

Analisis Penggunaan Kalimat Bahasa Indonesia pada Karangan Siswa Kelas V Sekolah Dasar Negeri 10 Sanur, Denpasar Analisis Penggunaan Kalimat Bahasa Indonesia pada Karangan Siswa Kelas V Sekolah Dasar Negeri 10 Sanur, Denpasar Wayan Yuni Antari 1*, Made Sri Satyawati 2, I Wayan Teguh 3 [123] Program Studi Sastra Indonesia,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Bagi perusahaan yang bergerak dalam industri manufaktur, sistem informasi produksi yang efektif merupakan suatu keharusan dan tidak lepas dari persoalan persediaan

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa merupakan salah satu komponen yang paling penting dalam kehidupan manusia. Dalam bentuk tulisan, bahasa menyimpan pengetahuan dari satu generasi ke generasi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 1.1 Tinjauan studi Penelitian yang sudah ada sebelumnya, yaitu : 1. Nur Afifah (2010), Pembuatan Kamus Elektronik Kalimat Bahasa Indonesia dan Bahasa Jawa untuk Aplikasi Mobile

Lebih terperinci

BAB I PENDAHULUAN. A. Latar Belakang Masalah. Pendidikan Bahasa Indonesia di sekolah merupakan salah satu aspek

BAB I PENDAHULUAN. A. Latar Belakang Masalah. Pendidikan Bahasa Indonesia di sekolah merupakan salah satu aspek 1 BAB I PENDAHULUAN A. Latar Belakang Masalah Pendidikan Bahasa Indonesia di sekolah merupakan salah satu aspek pengajaran yang sangat penting, mengingat bahwa setiap orang menggunakan bahasa Indonesia

Lebih terperinci

BAB 3 METODOLOGI PENELITIAN

BAB 3 METODOLOGI PENELITIAN BAB 3 METODOLOGI PENELITIAN 3.1 Metode Penelitian Metode yang digunakan dalam penelitian ini, yaitu metode penelitian deskriptif analitik. Metode deskriptif merupakan metode penelitian yang bertujuan untuk

Lebih terperinci

TRANSLASI KALIMAT BAHASA INGGRIS KE BAHASA INDONESIA MENGGUNAKAN METODE AUGMENTED TRANSITION NETWORK

TRANSLASI KALIMAT BAHASA INGGRIS KE BAHASA INDONESIA MENGGUNAKAN METODE AUGMENTED TRANSITION NETWORK TRANSLASI KALIMAT BAHASA INGGRIS KE BAHASA INDONESIA MENGGUNAKAN METODE AUGMENTED TRANSITION NETWORK Nurhalimah Harahap¹, Eddy Muntina Dharma², Andrian Rakhmatsyah³ ¹Teknik Informatika,, Universitas Telkom

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Pada bab ini menjelaskan topik taksonomi yang merupakan pengorganisasian informasi yang penting karena merupakan dasar dalam memahami suatu informasi. Taksonomi membantu memahami

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Text Mining Text mining merupakan suatu teknologi untuk menemukan suatu pengetahuan yang berguna dalam suatu koleksi dokumen teks sehingga diperoleh tren, pola, atau kemiripan

Lebih terperinci

BAB I PENDAHULUAN. dari lapisan atas sampai lapisan bawah. Bahasa surat kabar harus lancar agar

BAB I PENDAHULUAN. dari lapisan atas sampai lapisan bawah. Bahasa surat kabar harus lancar agar BAB I PENDAHULUAN 1.1 Latar Belakang Sekarang kita dapat dengan mudah memperoleh informasi mengenai berbagai peristiwa yang terjadi di dalam atau luar negeri melalui media elektronik atau cetak. Setiap

Lebih terperinci

Pemberdayaan TIK untuk pengembangan bahasa Indonesia dan pengajaran BIPA

Pemberdayaan TIK untuk pengembangan bahasa Indonesia dan pengajaran BIPA Kobarkan Semangatmu! Working Together to Overcome Challenges Pemberdayaan TIK untuk pengembangan bahasa Indonesia dan pengajaran BIPA Ivan Lanin ASILE 2014, Bali, 29 30 September 2014 Lisensi Atribusi-BerbagiSerupa

Lebih terperinci

BAB I PENDAHULUAN. dan bukan suatu khayalan yang tidak tampak (Language may be form and not

BAB I PENDAHULUAN. dan bukan suatu khayalan yang tidak tampak (Language may be form and not 1 BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa secara umum adalah sistem lambang bunyi ujaran yang digunakan untuk berkomunikasi dengan suatu kelompok atau masyarakat dan harus dipahami oleh pemakainya.

Lebih terperinci

BAB I PENDAHULUAN. Bahasa adalah sesuatu yang bersifat universal karena tidak memedulikan

BAB I PENDAHULUAN. Bahasa adalah sesuatu yang bersifat universal karena tidak memedulikan 1 BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Bahasa adalah sesuatu yang bersifat universal karena tidak memedulikan warna kulit, ras, agama, bangsa dan negara. Bahasa merupakan perwujudan suatu konsep

Lebih terperinci

1.2. Latar Belakang Masalah

1.2. Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1. Pengantar Dewasa ini fungsi komputer semakin dimanfaatkan dalam segala bidang. Baik di bidang pendidikan, bisnis, ataupun penelitian. Komputer dimanfaatkan dalam segala bidang dikarenakan

Lebih terperinci

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Komang Rinartha

Lebih terperinci

BAB I PENDAHULUAN. Setiap bahasa memiliki sistem fonologi dan tata bahasanya sendiri, yang membedakannya dari bahasa lain. Oleh karena itu, masyarakat

BAB I PENDAHULUAN. Setiap bahasa memiliki sistem fonologi dan tata bahasanya sendiri, yang membedakannya dari bahasa lain. Oleh karena itu, masyarakat 1 BAB I PENDAHULUAN 1.1 Latar Belakang Setiap bahasa memiliki sistem fonologi dan tata bahasanya sendiri, yang membedakannya dari bahasa lain. Oleh karena itu, masyarakat pemakai bahasa membutuhkan satu

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada bab ini, akan dibahas landasan teori mengenai pendeteksian kemiripan dokumen teks yang mengkhususkan pada pengertian dari keaslian dokumen, plagiarisme, kemiripan dokumen, dan

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN. Aplikasi penterjemahan kata Indonesia-Inggris yang dibuat dalam tulisan

BAB III ANALISA DAN PERANCANGAN. Aplikasi penterjemahan kata Indonesia-Inggris yang dibuat dalam tulisan BAB III ANALISA DAN PERANCANGAN 3.1 Analisa Sistem Aplikasi penterjemahan kata Indonesia-Inggris yang dibuat dalam tulisan ini adalah aplikasi pencarian kata, berupa kamus untuk bahasa Indonesia - Inggris

Lebih terperinci

BAB IV PREPROCESSING DATA MINING

BAB IV PREPROCESSING DATA MINING BAB IV PREPROCESSING DATA MINING A. Konsep Sebelum diproses data mining sering kali diperlukan preprocessing. Data preprocessing menerangkan tipe-tipe proses yang melaksanakan data mentah untuk mempersiapkan

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Berkembangnya teknologi komputer semakin menarik minat para insan ilmiah untuk berkreasi dan berkarya. Berbagai penelitian yang dilakukan telah melahirkan metode atau teknologi

Lebih terperinci

Direct Parsing Pada Pengenalan Pola Kalimat Berbahasa Indonesia

Direct Parsing Pada Pengenalan Pola Kalimat Berbahasa Indonesia 10 Direct Parsing Pada Pengenalan Pola Kalimat Berbahasa Indonesia Fawaid Effendi Jurusan Teknik Informatika, STT Nurul Jadid Paiton PO BOX 1 Paiton Probolinggo 67291 Email : fadwa_situbondo@yahoo.com

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Document summarization adalah proses pengambilan teks dari sebuah dokumen dan membuat sebuah ringkasan yang mempunyai informasi yang lebih berguna bagi user

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Informasi telah menjadi kebutuhan utama dalam kehidupan manusia. Informasi bisa dikatakan sebagai pengetahuan yang didapatkan dari pembelajaran, pengalaman, atau instruksi.

Lebih terperinci

KONSTRUKSI OBJEK GANDA DALAM BAHASA INDONESIA

KONSTRUKSI OBJEK GANDA DALAM BAHASA INDONESIA HUMANIORA Suhandano VOLUME 14 No. 1 Februari 2002 Halaman 70-76 KONSTRUKSI OBJEK GANDA DALAM BAHASA INDONESIA Suhandano* 1. Pengantar ahasa terdiri dari dua unsur utama, yaitu bentuk dan arti. Kedua unsur

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Bahasa merupakan alat komunikasi lingual manusia baik secara lisan maupun tulisan. Dalam membuat suatu karya ilmiah, penggunaan Bahasa Indonesia harus sesuai

Lebih terperinci

BAB 1 PENDAHULUAN. 1 Universitas Kristen Maranatha

BAB 1 PENDAHULUAN. 1 Universitas Kristen Maranatha BAB 1 PENDAHULUAN 1.1 Latar Belakang Kata kunci adalah kata yang mewakili konsep atau garis besar dari suatu dokumen [1]. Kata kunci digunakan sebagai pernyataan informasi penting mengenai isi pembahasan

Lebih terperinci

PEMODELAN BERBASIS KONSEP UNTUK KATEGORISASI ARTIKEL BERITA BERBAHASA INDONESIA

PEMODELAN BERBASIS KONSEP UNTUK KATEGORISASI ARTIKEL BERITA BERBAHASA INDONESIA PEMODELAN BERBASIS KONSEP UNTUK KATEGORISASI ARTIKEL BERITA BERBAHASA INDONESIA Candra Triawati 1, M. Arif Bijaksana 2, Nur Indrawati 3, Widyanto Adi Saputro 4 1,2,3,4 Departemen Teknik Informatika, Institut

Lebih terperinci

BAB I PENDAHULUAN. maupun sebagai komunikan (mitra baca, penyimak, pendengar, atau pembaca).

BAB I PENDAHULUAN. maupun sebagai komunikan (mitra baca, penyimak, pendengar, atau pembaca). BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa memiliki peran penting dalam kehidupan manusia. Manusia sebagai makhluk sosial tidak akan pernah lepas dari peristiwa komunikasi. Dalam berkomunikasi,

Lebih terperinci

Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara

Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara Implementasi Algoritma Knuth Morris Pratt pada Alat Penerjemah Suara Bima Laksmana Pramudita (13511042) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,

Lebih terperinci

BAB I PENDAHULUAN. Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan

BAB I PENDAHULUAN. Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan BAB I PENDAHULUAN 1.1 Latar Belakang Untuk mengukur keberhasilan suatu proses pembelajaran dibutuhkan sebuah sistem penilaian atau evaluasi. Penilaian adalah suatu proses untuk mengambil keputusan dengan

Lebih terperinci

BAB I PENDAHULUAN A. Latar Belakang Masalah

BAB I PENDAHULUAN A. Latar Belakang Masalah BAB I PENDAHULUAN A. Latar Belakang Masalah Di Indonesia terdapat berbagai macam profesi khususnya bidang pendidikan, misalnya sebagai : guru, dosen, guru bimbingan belajar, guru konseling dan lain sebagainya.

Lebih terperinci

BAB VI TATARAN LINGUISTIK SINTAKSIS

BAB VI TATARAN LINGUISTIK SINTAKSIS Nama : Khoirudin A. Fauzi NIM : 1402408313 BAB VI TATARAN LINGUISTIK SINTAKSIS Pada bab terdahulu disebutkan bahwa morfologi dan sintaksis adalah bidang tataran linguistik yang secara tradisional disebut

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN

BAB 3 ANALISIS DAN PERANCANGAN BAB 3 ANALISIS DAN PERANCANGAN 3.1 Analisis Masalah Penelitian yang sudah pernah membuat sistem ini berhasil menciptakan pembangkitan pertanyaan non-factoid secara otomatis dengan menggunakan tiga jenis

Lebih terperinci

Pengantar Kecerdasan Buatan (AK045218) Bahasa Alami 1

Pengantar Kecerdasan Buatan (AK045218) Bahasa Alami 1 Bahasa Alami 1 Peranan Pengetahuan dalam Bahasa Masalah Bahasa Alami Proses Sintaksis Grammar dan Parser Automated Transition Network Referensi Luger & Stubblefield : bab-3 Rich & Knight : bab 15 Bahasa

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini perkembangan ilmu pengetahuan dan teknologi informasi semakin berkembang pesat, banyak teknologi baru yang telah diciptakan dan digunakan oleh masyarakat

Lebih terperinci

BAB I PENDAHULUAN. gramatikal dalam bahasa berkaitan dengan telaah struktur bahasa yang berkaitan. dengan sistem kata, frasa, klausa, dan kalimat.

BAB I PENDAHULUAN. gramatikal dalam bahasa berkaitan dengan telaah struktur bahasa yang berkaitan. dengan sistem kata, frasa, klausa, dan kalimat. BAB I PENDAHULUAN A. Latar Belakang Masalah Penelitian dalam bidang linguistik berkaitan dengan bahasa tulis dan bahasa lisan. Bahasa tulis memiliki hubungan dengan tataran gramatikal. Tataran gramatikal

Lebih terperinci

BAB I PENDAHULUAN. sintaksis,fungsi semantis dan fungsi pragmatis.fungsi sintaksis adalah hubungan

BAB I PENDAHULUAN. sintaksis,fungsi semantis dan fungsi pragmatis.fungsi sintaksis adalah hubungan 1.1 Latar Belakang BAB I PENDAHULUAN Analisis kalimat dapat dilakukan pada tiga tataran fungsi, yaitu fungsi sintaksis,fungsi semantis dan fungsi pragmatis.fungsi sintaksis adalah hubungan gramatikal antara

Lebih terperinci