BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI"

Transkripsi

1 BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat pada 33 provinsi sampai saat ini hanya terkumpul di satu tempat tanpa ada proses selanjutnya untuk mengambil informasi inti dalam laporan tersebut. Ketiadaan proses ekstraksi informasi ini mengakibatkan adanya kesulitan jika sewaktu waktu diperlukan informasi tertentu dari sejumlah besar dokumen LHP. Selain itu, tidak adanya aplikasi pencarian informasi menghambat adanya proses pembelajaran terhadap laporan-laporan yang ada sebelumnya, sehingga apabila terjadi kasus yang sama di masa sekarang, maka proses pembelajaran tidak dapt berjalan secara efektif. Oleh karena itu, diperlukan sebuah aplikasi yang mampu melakukan ekstraksi informasi dari sekumpulan dokumen LHP untuk dapat mengambil data inti dari dokumen tersebut. Berdasarkan Undang-Undang No. 15 Tahun 2006 pasal 6 ayat (3), pemeriksaan BPK mencakup pemeriksaan keuangan, pemeriksaan kinerja, dan pemeriksaan dengan tujuan tertentu. Laporan yang akan menjadi obyek dalam penelitian ini adalah laporan yang merupakan hasil dari pemeriksaan keuangan. Pemeriksaan keuangan adalah pemeriksaan atas laporan keuangan pemerintah (Pusat, Daerah, BUMN, dan BUMD) dengan tujuan pemeriksaan menilai kewajaran laporan keuangan dan memberikan pernyataan pendapat/opini tentang 1

2 tingkat kewajaran informasi yang disajikan dalam laporan keuangan pemerintah pusat/daerah. Tahapan yang harus dilalui dalam pemeriksaan adalah tahap persiapan, tahap pelaksanaan, dan tahap pelaporan. Penelitian ini akan berfokus pada salah satu proses dalam tahap pelaporan, yaitu penyusunan konsep laporan hasil pemeriksaan. Pemeriksaan yang menjadi obyek dalam penelitiaan ini adalah pemeriksaan Laporan Keuangan Pemerintah Daerah (LKPD). Laporan Hasil Pemeriksaan (LHP) LKPD, terbagi dalam beberapa bagian, yaitu: 1. Laporan Hasil Pemeriksaan atas Laporan Keuangan; 2. Laporan Hasil Pemeriksaan atas Sistem Pengedalian Intern (SPI); 3. Laporan Hasil Pemeriksaan atas Kepatuhan terhadap Peraturan Perundang-undangan. Penelitian ini akan berfokus pada Temuan Pemeriksaan (TP) LHP atas SPI dan TP LHP atas Keputuhan terhadap Peraturan Perundang-undangan. Temuan pemeriksaan muncul karena adanya kondisi yang tidak memenuhi kriteria pemeriksaan yang ditetapkan. Jika kondisi memenuhi atau melebih kriteria, hal ini mengindikasikan bahwa entitas telah melaksanakan praktik terbaik. Sebaliknya, jika kondisi tidak memenuhi kriteria, hal ini mengindikasikan perlunya tindakan perbaikan. Temuan pemeriksaan meliputi unsur-unsur kondisi, kriteria, akibat, sebab, tanggapan dari entitas terperiksa, dan saran atau rekomendasi. Kondisi yang ada di BPK saat ini, tidak ada aplikasi yang membantu pemeriksa dalam memetakan saran ataupun mengelompokkan saran berdasarkan kriteria, sebab, akibat, atau jenis temuan. Laporan Hasil Pemeriksaan (LHP) yang 2

3 ada hanya dikumpulkan berdasarkan jenis pemeriksaan tanpa dikelompokkan lebih lanjut per kasus atau temuan pada masing-masing LHP. Hal ini berarti tidak adanya klasifikasi temuan pemeriksaan berdasarkan kondisi, kriteria, sebab, dan akibat dan tidak ada proses pengambilan informasi berdasarkan hasil pemeriksaan yang ada untuk menentukan arah kebijakan selanjutnya. Di samping itu, tidak ada data mengenai keterkaitan antara saran pemeriksaan dengan komponen lain dalam temuan pemeriksaan. I.1.1 Perumusan Masalah Penelitian ini akan melakukan klasifikasi bagian dalam temuan pemeriksaan berdasarkan kriteria, sebab, akibat, tanggapan, dan saran pemeriksaan dengan mengembangkan sebuah Sistem Informasi yang mampu mengambil informasi inti dari temuan pemeriksaan. Saat ini, Temuan Pemeriksaan (TP) yang merupakan bagian dari Laporan Hasil Pemeriksaan (LHP) hanya dikumpulkan secara elektronis berupa file pdf. Dari kumpulan file pdf tersebut, tidak ada proses yang dilakukan lebih lanjut untuk mendapatkan suatu informasi sebagai dasar pengambilan keputusan bagi top level management ataupun pengambilan keputusan untuk mempertimbangkan penyusunan LHP bagi kasus serupa di lokasi yang berbeda. Pengambilan informasi yang selama ini dilakukan hanya bersifat manual dan sepotong-sepotong, sehingga sangat memungkinkan terjadinya perbedaaan informasi yang diambil untuk kasus yang semestinya serupa. Oleh karena itu diperlukan suatu aplikasi yang mampu mengidentifikasi atau mengklasifikasi temuan temuan pemeriksaan yang telah ada pada tahun-tahun sebelumnya, 3

4 sehingga dengan adanya aplikasi ini diharapkan dapat membantu proses pengambilan keputusan. Penelitian ini akan menggunakan salah satu cabang dari Pemrosesan Bahasa Alami, yaitu Ekstraksi Informasi. Ekstraksi Informasi dapat diartikan sebagai sebuah proses untuk mendapatkan informasi inti dari dokumen tidak terstruktur ataupun dokumen semi terstruktur. Dalam penelitian ini, ekstraksi informasi dibagi dalam dua proses, yaitu preprocessing dan klasifikasi. Preprocessing dilakukan untuk menyiapkan dokumen agar dapat diproses pada tahap berikutnya, yaitu klasifikasi, serta untuk mendapatkan akurasi yang lebih tinggi dari hasil klasifikasi. Sedangkan klasifikasi merupakan proses inti dalam penelitian ini, yang bertujuan untuk mengelompokkan isi dokumen ke dalam beberapa klasifikasi. I.1.2. Keaslian Penelitian Penelitian mengenai Pemrosesan Bahasa Alami ataupun part of speech tagger untuk bahasa Indonesia pernah dilakukan oleh beberapa peneliti. Salah satu diantaranya menggunakan metode Conditional Random Fields dan Transformation Based Learning [1]. Penelitian ini menghasilkan suatu aplikasi part-of-speech tagger untuk Bahasa Indonesia dengan memanfaatkan tiga metode, yaitu Conditional Random Fields, Transformation Based Learning, dan kombinasi kedua metode tersebut. Hasil dari penelitian ini adalah, tagging tertinggi dengan metode Conditional Random Fields mencapai 80,21%, dengan metode Transformation Based Learning 90,08%, dan dengan kombinasi kedua metode 86,24%. Berdasarkan hasil penelitian, metode Transformation Based 4

5 Learning adalah metode yang paling cocok untuk diterapkan dalam pembuatan part-of-speech tagger untuk Bahasa Indonesia jika dibandingkan dengan kedua metode lain. Penelitian serupa memanfaatkan algoritma GLR (Generalized Left-to-right Rightmost) dengan kalimat yang dibangun bersifat rule-based untuk membangun pengurai kalimat Bahasa Indonesia [2]. Kelebihan dari penelitian ini dibandingkan penelitian sebelumnya adalah pengurai kalimat yang dinamai INAGP ini mampu menguraikan semua jenis kalimat majemuk. Sedangkan kendala dari penelitian ini adalah kurang sempurnanya grammar yang digunakan, yang hanya melingkupi kalimat deklaratif saja. Selain itu, kalimat uji yang digunakan masih terbatas. Penelitian lain mengenai PBA menggunakan metode Hidden Markov Model (HMM) untuk membangun POS Tagger Bahasa Indonesia (HMM Based Part-of- Speech Tagger for Bahasa Indonesia) [3]. Dari penelitian yang dilakukan terhadap model HMM yang dibangun pada 1500 token data corpus dan 15% out of vocabulary (OOV) corpus, akurasi yang dicapai adalah 96,50%, dimana 99,40% untuk kata-kata yang ada dalam kosakata bahasa Indonesia, dan 80,40% untuk kata-kata di luar kosakata bahasa Indonesia (OOV-out of vocabulary). Penelitian tentang ekstraksi informasi untuk bahasa Indonesia pernah dilakukan oleh Kurnia Muludi dengan judul Evaluasi Kinerja Algoritma Support Vector Machine dalam Ekstraksi Informasi Korpus Berbahasa Indonesia [4]. Penelitian ini melihat pengaruh beberapa parameter SVM pada kinerja ekstraksi informasi dengan menggunakan 60 teks yang diambil dari situs-situs surat kabar. Berita yang diambil berkaitan dengan perkembangan komoditi sayur mayur di 5

6 kota-kota di Indonesia. Hasil F-Measure terbaik SVM-GATE pada Korpus berbahasa Indonesia adalah 49,64% (Strict) dan 58,45% (Lenient). Kinerja terbaik SVM-GATE terbaik diperoleh pada margin tau = 0,3 dan window size = 4. Saran yang dalam penelitian ini adalah diperlukan pengayaan NLP features yag lain, misalnya penggunaan Part of Speech Tagger untuk Bahasa Indonesia untuk meningkatkan kinerja SVM-GATE. Penelitian yang akan dilakukan oleh penulis adalah bagaimana cara yang dapat dilakukan untuk mendapatkan hasil ekstraksi informasi dari Laporan Hasil Pemeriksaan (LHP) atas Laporan Keuangan Pemerintah Daerah (LKPD) dengan menggunakan output dari penelitian sebelumnya, yaitu HMM Based Part-of- Speech Tagger for Bahasa Indonesia. Penelitian ini akan memanfaatkan aplikasi IPOSTagger yang dibangun dengan metode HMM. Dokumen LHP akan menjadi input pada aplikasi IPOSTagger, dan selanjutnya proses klasifikasi akan dilakukan terhadap output dari aplikasi ini. Informasi yang diharapkan dari penelitian ini adalah berupa pengelompokkan komponen temuan pemeriksaan dalam LHP LKPD yang berupa kriteria, sebab, akibat, tanggapan, dan saran. I.1.3 Manfaat Penelitian Hasil dari penelitian ini diharapkan dapat diperoleh informasi digital dari data Temuan Pemeriksaan (TP) dalam Laporan Hasil Pemeriksaan (LHP) Laporan Keuangan Pemerintah Daerah (LKPD). Informasi tersebut dapat dikelompokkan dalam kategori kriteria, sebab, akibat, tanggapan, dan saran pemeriksaan. Informasi yang merupakan output dari aplikasi ini nantinya dapat dimanfaatkan 6

7 untuk mengelompokkan dan menghubungkan jenis pemeriksaan dengan setiap bagian dokumen, yaitu kriteria, akibat, sebab, tanggapan, dan saran pemeriksaan. I.2 Tujuan Penelitian Tujuan dari penelitian ini adalah membuat tools untuk dapat meng-ekstrak informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) Laporan Keuangan Pemerintah Daerah (LKPD). Informasi dalam Temuan Pemeriksaan (TP) LHP LKPD yang ingin diperoleh dari penelitian ini adalah kriteria, sebab, akibat, tanggapan, dan saran pemeriksaan. I.3 Tinjauan Pustaka Ekstraksi Informasi adalah proses pengubahan dokumen tidak terstruktur atau semi terstruktur dengan domain tertentu ke dalam sebuah struktur informasi yang relevan. Secara sederhana, ekstraksi informasi juga bisa diartikan sebagai sebuah proses untuk mendapatkan bagian-bagian penting atau intisari dari dokumen tidak terstruktur, yang kemudian informasi tersebut dapat diproses lebih lanjut secara otomatis, misalnya untuk menjawab pertanyaan [5]. Terdapat tiga metode yang dapat digunakan dalam ekstraksi informasi, yaitu : a. Rule-based methods Rule-based methods menggunakan pola tertentu (template) untuk menganalisa struktur teks, yang nantinya akan digunakan untuk mencari dan menafsirkan informasi inti dari dokumen. Pola yang digunakan dapat diinputkan secara manual atau didapat dari hasil pengolahan oleh mesin. 7

8 b. Statistical methods Statistical methods menggunakan perhitungan matematika untuk memprediksi kemiripan dari informasi yang diharapkan dengan dokumen yang ada, dengan membandingkan informasi dan konteks kalimat. c. Knowledge-based methods Pendekatan ini memanfaatkan informasi eksternal untuk membantu proses kategorisasi dan klasifikasi teks sehingga informasi inti dari dokumen dapat lebih mudah ditemukan. Ekstraksi informasi merupakan salah satu bagian dari Pemrosesan Bahasa Alami (Natural Language Processing). Pemrosesan Bahasa Alami (PBA) adalah salah satu tujuan jangka panjang dari Artificial Intelligence (AI) yang memiliki kemampuan untuk memahami bahasa manusia. Inti dari pemrosesan bahasa alami adalah penguraian kalimat atau parser. Parser berfungsi untuk membaca kalimat, kata demi kata dan menentukan jenis kata apa saja yang termasuk dalam kelompok kata tersebut. Pemrosesan Bahasa Alami terdiri dari beberapa bagian, yaitu : a. Information Retrieval (IR) Information Retrieval (IR) diartikan sebagai tindakan, metode, dan prosedur untuk menemukan kembali data yang tersimpan, kemudian menyediakan informasi mengenai subyek yang dibutuhkan. IR mencakup teks, table, gambar, ucapan, dan video. Informasi termasuk pengetahuan terkait yang dibutuhkan untuk mendukung penyelesaian masalah dan akuisisi pengetahuan. 8

9 b. Passage Retrieval Bidang ini bertujuan untuk mencari dan menghasilkan salah satu bagian dalam dokumen sesuai dengan query yang diinputkan. c. Information Extraction IE bisa dimanfaatkan untuk meng-ekstrak informasi secara otomatis dari teks berbahasa alami. IE juga bisa digunakan untuk mengumpulkan informasi terstruktur yang berasal dari dokumen tidak terstruktur ataupun semi terstruktur. d. Question/Answering Tasks Question/Answering Tasks merupakan gabungan dari IR dan IE, yang bisa digunakan untuk menjawab pertanyaan-pertanyaan umum dengan menggunakan teks sebagai dasar pengambilan informasi (fact retrieval). e. Text Understanding Text Understanding berfungsi untuk memahami teks sebagaimana manusia dapat memahaminya, dengan memanfaatkan Artificial Intelligence. Terdapat beberapa metode yang dapat digunakan untuk melakukan ekstraksi informasi, di antaranya adalah dengan Hidden Markov Model, Support Vector Machine, Collin s Parser. HMM merupakan metode yang banyak digunakan untuk ekstraksi informasi, akan tetapi tidak dapat digunakan utnuk menangani token dengan multiple attribute. Sedangkan Support Vector Machine (SVM) adalah bagian dari Support machine learning, dan telah mencapai kinerja state-of-the-art pada 9

10 berbagai classification task, termasuk named entity recognition.klassifier SVM dapat menduga dimana suatu jenis tag berawal dan berakhir dalam suatu teks. Pengurai Collin (Collin s Parser) adalah pengurai dengan metode statistik yang memiliki kecepatan pemrosesan dan akurasi yang lebih baik jika dibandingkan dengan metode statistik lainnya. Penelitian ini akan menggunakan output yang dihasilkan oleh POS Tagging dengan metode HMM karena tingkat akurasinya yang tinggi, yaitu 96,5% dan 99,4% untuk kata-kata yang terdapat dalam kamus, serta 80,4% untuk kata-kata yang tidak tercantum dalam kamus. 10

1. PENDAHULUAN 1.1 Latar belakang Masalah

1. PENDAHULUAN 1.1 Latar belakang Masalah 1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.

Lebih terperinci

Algoritma Ekstraksi Informasi Berbasis Aturan

Algoritma Ekstraksi Informasi Berbasis Aturan 242 JNTETI, Vol. 03, No. 04, November 2014 Algoritma Ekstraksi Informasi Berbasis Aturan Agny Ismaya 1 Abstract The information in in the audit report of local government financial statement (LHP LKPD)

Lebih terperinci

UKDW BAB 1 PENDAHULUAN Latar Belakang

UKDW BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Dengan perkembangan teknologi yang semakin pesat, setiap orang dituntut untuk bisa memanfaatkan dengan baik perkembangan teknologi dan dapat menggunakan di dalam kehidupan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang pesat mempermudah akses terhadap informasi tekstual yang sangat besar jumlahnya, baik yang terdapat pada Internet maupun pada koleksi dokumen

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Indonesia adalah bahasa resmi dari Negara Indonesia. Berdasarkan ketentuan UU Nomor 24 tahun 2009 (Pasal 3) tujuan dari penggunaan Bahasa Indonesia sebagai bahasa

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Memasuki era big data, pertumbuhan data berbentuk dokumen teks semakin tinggi. Sehingga diperlukan text processing untuk pengolahan data yang sangat besar. Dokumen

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi informasi sudah semakin maju. Beberapa aplikasi text mining awal menggunakan penyajian sederhana yang disebut dengan bag-ofwords' ketika

Lebih terperinci

BABI PENDAHULUAN. 1.1 Latar Belakang

BABI PENDAHULUAN. 1.1 Latar Belakang BABI PENDAHULUAN 1.1 Latar Belakang Named entity recognition(ner) merupakan salah satu bagian domain Information Extraction(IE) pada sistem Natural Language Processing(NLP). Sistem NER bertujuan untuk

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang 1 BAB 1 PENDAHULUAN Bab ini berisi tentang latar belakang (subbab 1.1), tujuan penelitian (subbab 1.2), perumusan dan pembatasan masalah (subbab 1.3), metodologi penelitian (subbab 1.4), serta penjelasan

Lebih terperinci

BAB I PENDAHULUAN! 1.1 Latar Belakang

BAB I PENDAHULUAN! 1.1 Latar Belakang 1.1 Latar Belakang BAB I PENDAHULUAN Untuk dapat tetap bisa menjalankan proses bisnisnya dengan baik, suatu instansi harus memenuhi suatu standar dalam melayani keinginan konsumen atau yang biasa dikenal

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan jumlah situs web (website) di Internet berdasarkan hasil survey dari Netcraft (2013) menunjukkan peningkatan pesat dari 18 juta website pada tahun 2000

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kemajuan dibidang teknologi informasi dan telekomunikasi berdampak pada munculnya berbagai media sosial, seperti Twitter. Twitter didirikan oleh Jack Dorsey, Biz Stone,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang website adalah salah satu layanan yang bisa digunakan untuk melakukan pencarian berbagai informasi, sehingga sangat dibutuhkan untuk keperluan pengguna dalam pencarian

Lebih terperinci

Bab 1 Pendahuluan 1.1 Latar Belakang

Bab 1 Pendahuluan 1.1 Latar Belakang Bab 1 Pendahuluan 1.1 Latar Belakang Bahasa merupakan salah satu aspek penting dalam kehidupan manusia karena bahasa adalah alat untuk berkomunikasi dengan manusia lain. Bahasa dapat disajikan dalam bentuk

Lebih terperinci

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2013 PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL I Wayan Hendra Maha Putra¹, Imelda Atastina², Alfian Akbar Gozali³ ¹Teknik

Lebih terperinci

PERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA

PERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA PERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA Astria Kurniawan Sumantri 1, Indra Budi 2, Heri Kurniawan 2 1,2,3 Fakultas Ilmu Komputer,Universitas

Lebih terperinci

SKRIPSI. Triastuti Chandrawati

SKRIPSI. Triastuti Chandrawati Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning SKRIPSI Triastuti Chandrawati 1204000866 UNIVERSITAS INDONESIA FAKULTAS

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Fiqih berarti paham atau mengerti, merupakan salah satu bagian dari domain agama. Hukum mempelajarinya adalah fardu ain bagi setiap kaum muslimin (Rasjid, 2013). Pemanfaatan

Lebih terperinci

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha

PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL. Adhitya Teguh Nugraha PREDIKSI JEDA DALAM UCAPAN KALIMAT BAHASA INDONESIA DENGAN HIDDEN MARKOV MODEL Adhitya Teguh Nugraha Program Studi Teknik Informatika Jurusan Teknik Elektro Fakultas Teknik Universitas Tanjungpura ituteguh@gmail.com

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi komputer khususnya di jaringan Internet telah berkembang dengan sangat cepat. Semua orang dapat saling bertukar dan mendapatkan informasi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

Penerapan Support Vector Machine untuk Ekstraksi Informasi dari Dokumen Teks

Penerapan Support Vector Machine untuk Ekstraksi Informasi dari Dokumen Teks Penerapan Support Vector Machine untuk Ekstraksi Informasi dari Dokumen Teks LAPORAN TUGAS AKHIR Disusun sebagai syarat kelulusan tingkat sarjana oleh : Paramita / 13504040 PROGRAM STUDI TEKNIK INFORMATIKA

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

BAB 1 PENDAHULUAN. Universitas Sumatera Utara 1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Kata kunci (keyword) merupakan kata-kata singkat yang dapat menggambarkan isi suatu artikel ataupun dokumen (Figueroa,et al. 2014). Kata kunci memberikan kemudahan

Lebih terperinci

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan 1 BAB I PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan media sosial menawarkan pengguna kesempatan untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan tidak lagi memiliki

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA

PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA BAB III PENYESUAIAN PENGURAI COLLINS UNTUK BAHASA INDONESIA Pada Bab III ini akan dijelaskan mengenai proses-proses yang diperlukan dalam proses awal (preprocessing) membentuk file masukan untuk pengurai

Lebih terperinci

EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA

EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA EKSTRAKSI OPINION HOLDER MENGGUNAKAN METODE MAXIMUM ENTROPY PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED

ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED ISSN : 2355-9365 e-proceeding of Engineering : Vol.3, No.2 Agustus 2016 Page 3654 ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED ASPECT LEVEL SENTIMENT CLASSIFICATION

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa alami adalah bahasa yang biasa digunakan untuk berkomunikasi antarmanusia, misalnya bahasa Indonesia, Sunda, Jawa, Inggris, Jepang, dan sebagainya. Bahasa

Lebih terperinci

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang

Lebih terperinci

BAB I PENDAHULUAN. gabah, dan yang sudah dibuang kulit luarnya disebut beras. Dalam praktek di

BAB I PENDAHULUAN. gabah, dan yang sudah dibuang kulit luarnya disebut beras. Dalam praktek di BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Padi merupakan bahan makanan pokok bagi masyarakat Indonesia. Sebagian dari masyarakat kita sumber makanannya dapat berasal dari jagung, sorghum, dan sagu.

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Indonesia adalah bahasa resmi dari negara Indonesia. Bahasa Indonesia memiliki sekitar 23 juta penutur asli pada tahun 2010, dan lebih dari 140.000.000 penutur

Lebih terperinci

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM : PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI Oleh : SEPTIAN BAGUS WAHYONO NPM : 0734010126 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS

Lebih terperinci

: Peringkasan Terpandu Otomatis (Automatic Guided Summarization)

: Peringkasan Terpandu Otomatis (Automatic Guided Summarization) I. Identitas Calon Promotor Nama Lengkap Fakultas/Sekolah Kelompok Keahlian Telp/Fax/E mail : Ir. Dwi Hendratmo Widyantoro, M.Sc., Ph.D. : STEI : Informatika : (022)2502260/dwi@stei.itb.ac.id II. Deskripsi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN. 1.1 Latar belakang BAB I PENDAHULUAN 1.1 Latar belakang Dalam beberapa tahun terakhir teknologi informasi dan telekomunikasi berkembang dengan pesat. Masyarakat mendapatkan manfaat dari tekonologi informasi dan telekomunikasi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1. 1.1 Latar Belakang Perkembangan dunia telekomunikasi meningkat secara signifikan dalam kurun waktu satu dekade terahir. Tidak hanya dari segi jumlah pengguna, jenis layanan yang ditawarkanpun

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Bagi perusahaan yang bergerak dalam industri manufaktur, sistem informasi produksi yang efektif merupakan suatu keharusan dan tidak lepas dari persoalan persediaan

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Indonesia

BAB 1 PENDAHULUAN. Universitas Indonesia BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan semakin berkembangnya teknologi telekomunikasi, internet menjadi sesuatu yang tidak lagi sulit dan mahal. Kemudahan ini menyebabkan internet dipenuhi berbagai

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER

NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER NATURAL LANGUAGE PROCESSING DENGAN TEKNIK STATE MACHINE PARSER Hanif Al Fatta Abstraksi Aplikasi konsep AI terus berkembang. Salah satunya adalah bagaimana membuat komputer memahami perintah yang diberikan

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

PENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA.

PENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA. PENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA Gunawan 1, Devi Dwi Purwanto, Herman Budianto, dan Indra Maryati 1 Jurusan Teknik Elektro, Fakultas Teknologi Industri, Institut

Lebih terperinci

Analisis Sentimen Menggunakan Lexicalized-Hidden Markov Model(L-HMM)

Analisis Sentimen Menggunakan Lexicalized-Hidden Markov Model(L-HMM) Analisis Sentimen Menggunakan Lexicalized-Hidden Markov Model(L-HMM) Virani Kartika Satrioputri 1, Warih Maharani 2, Jondri 3 Abstrak Saat ini semakin banyak produsen yang menawarkan produknya melalui

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Salah satu cabang dari ilmu komputer yang mulai populer adalah Artificial Intelligence atau kecerdasan buatan. Kecerdasan buatan merupakan sub-bidang dari

Lebih terperinci

DAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi.

DAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi. DAFTAR ISI ABSTRAK...i ABSTRACT... ii KATA PENGANTAR... iii DAFTAR ISI... v DAFTAR GAMBAR...vii DAFTAR TABEL... viii DAFTAR ISTILAH... ix BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah...

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Proses pendidikan yang baik dapat dilihat dari hasil pembelajaran yang dilakukan melalui ujian atau tes. Tipe ujian atau latihan dapat dilakukan dengan berbagai

Lebih terperinci

Penggunaan Named Entity Recognition dan Artificial Intelligence Markup Language untuk Penerapan Chatbot Berbasis Teks

Penggunaan Named Entity Recognition dan Artificial Intelligence Markup Language untuk Penerapan Chatbot Berbasis Teks Jurnal Telematika, vol. 10 no. 2, Institut Teknologi Harapan Bangsa, Bandung ISSN: 1858-2516 Penggunaan Named Entity Recognition dan Artificial Intelligence Markup Language untuk Penerapan Chatbot Berbasis

Lebih terperinci

Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi

Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN: 1978-1520 1 Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi Nitin Sabloak 1, Bebeto Agung Hardono 2, Derry Alamsyah 3 1,2 STMIK GI

Lebih terperinci

PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA

PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA PENYUSUNAN KORPUS BERITA TERBUKA BERBAHASA INDONESIA Ahmad Rio Adriansyah STT Terpadu Nurul Fikri, arasy@nurulfikri.ac.id, ahmad.rio.adriansyah@gmail.com Abstrak Korpus dalam bahasa Indonesia dibutuhkan

Lebih terperinci

IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan)

IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan) IKI 40931: Topik Khusus: NLP Kuliah 5: POS Tagging (Lanjutan) (Bab 8.5-8.8 Jurafsky & Martin) Ruli Manurung Fakultas Ilmu Komputer Universitas Indonesia 25 Februari 2008 Outline Stochastic POS Tagging

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN Bab ini akan menjelaskan latar belakang dari penelitian yang memberikan gambaran awal mengenai analisis sentimen dan perannya dalam perkembangan teknologi informasi. Tujuan dan ruang

Lebih terperinci

BAB IV PREPROCESSING DATA MINING

BAB IV PREPROCESSING DATA MINING BAB IV PREPROCESSING DATA MINING A. Konsep Sebelum diproses data mining sering kali diperlukan preprocessing. Data preprocessing menerangkan tipe-tipe proses yang melaksanakan data mentah untuk mempersiapkan

Lebih terperinci

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,

Lebih terperinci

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad 1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan komputer di dalam lingkungan kehidupan masyarakat di seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad terakhir ini. Hal

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 1.1 Tinjauan studi Penelitian yang sudah ada sebelumnya, yaitu : 1. Nur Afifah (2010), Pembuatan Kamus Elektronik Kalimat Bahasa Indonesia dan Bahasa Jawa untuk Aplikasi Mobile

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada zaman seperti sekarang ini, jurnal atau berita elektronik merupakan suatu bentuk hasil karya dari seseorang yang sudah familiar. Di dalam karyakarya tersebut

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 60 BAB III METODOLOGI PENELITIAN 1.1 Desain Penelitian Desain penelitian adalah tahapan atau gambaran yang akan dilakukan dalam penelitian. Desain penelitian dibuat untuk memudahkan pelaksanaan tahaptahap

Lebih terperinci

DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA. Aswin Juari dan Ayu Purwarianti

DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA. Aswin Juari dan Ayu Purwarianti DETEKSI OOV MENGGUNAKAN HASIL PENGENALAN SUARA OTOMATIS UNTUK BAHASA INDONESIA Aswin Juari dan Ayu Purwarianti Teknik Informatika, Institut Teknologi Bandung, Bandung, Indonesia aswin_tsy@yahoo.com, ayu@stei.itb.ac.id

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Information age atau computer age adalah suatu era dimana kebutuhan seseorang akan informasi menjadi suatu hal yang sangat penting. Pada saat era informasi ini seseorang

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pengenalan ucapan (speech recognition) merupakan sistem yang dirancang untuk dapat mengenali sinyal suara, sehingga menghasilkan keluaran berupa tulisan. Input dari

Lebih terperinci

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S

PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA. M Karibun H S PENERAPAN METODE RULE-BASED DENGAN UNSUPERVISED LEARNING UNTUK PELABELAN DOKUMEN BERBAHASA INDONESIA Oleh: M Karibun H S G64101053 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Perkembangan teknologi informasi telah mampu mengubah persepsi manusia terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Twitter Twiter adalah sebuah layanan media sosial yang memungkinkan penggunanya untuk menulis maksimal 140 karakter, yang dikenal sebagai Tweet. Twitter didirikan oleh Jack Dorsey

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen

Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen Adi Radili 1, Suwanto Sanjaya 2 1,2 Teknik Informatika UIN Sultan Syarif Kasim Riau Jl. H.R. Soebrantas no. 155 KM. 18

Lebih terperinci

Text dan Web Mining. Budi Susanto Teknik Informatika UKDW Yogyakarta

Text dan Web Mining. Budi Susanto Teknik Informatika UKDW Yogyakarta Text dan Web Mining Budi Susanto Teknik Informatika UKDW Yogyakarta Deskripsi Matakuliah ini secara prinsip menekankan tentang teknik-teknik yang perlu diketahui mahasiswa dalam mengelola kumpulan dokumen

Lebih terperinci

Integrasi Data Terstruktur dan Tidak Terstruktur dalam Sistem Inteligensi Bisnis

Integrasi Data Terstruktur dan Tidak Terstruktur dalam Sistem Inteligensi Bisnis Integrasi Data Terstruktur dan Tidak Terstruktur dalam Sistem Inteligensi Bisnis Choerul Afifanto Komputasi Statistik, Sekolah Tinggi Ilmu Statistik, Jakarta, Indonesia 12.7077@stis.ac.id Abstract Kuantitas

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang 1 BAB 1 PENDAHULUAN Bab ini menguraikan latar belakang penelitian, rumusan masalah, tujuan penelitian, ruang lingkup penelitian, tahapan penelitian, dan sistematika penulisan. 1.1. Latar Belakang Indonesia

Lebih terperinci

BAB I PENDAHULUAN. Orasi ilmiah DR. Arry Akhmad Arman, Fakultas Teknologi Industri, ITB, 23 Agustus

BAB I PENDAHULUAN. Orasi ilmiah DR. Arry Akhmad Arman, Fakultas Teknologi Industri, ITB, 23 Agustus BAB I PENDAHULUAN 1. LATAR BELAKANG MASALAH llmu komputer memiliki dua komponen utama; pertama, model dan gagasan mendasar mengenai komputasi, kzdua, teknik rekayasa untuk perancangan sistem komputasi

Lebih terperinci

IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE

IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE IMPLEMENTASI PEREKOMENDASIAN KATA KUNCI DOKUMEN MENGGUNAKAN ALGORITMA GOOGLE LATENT SEMANTIC DISTANCE Novario Jaya Perdana 1, Diana Purwitasari 2 Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa merupakan salah satu komponen yang paling penting dalam kehidupan manusia. Dalam bentuk tulisan, bahasa menyimpan pengetahuan dari satu generasi ke generasi

Lebih terperinci

1. Introduction. tertentu memegang peran penting dalam. Abstract

1. Introduction. tertentu memegang peran penting dalam. Abstract Perbandingan Metode Latent Semantic Analysis, Syntactically Enhanced Latent Semantic Analysis, dan Generalized Latent Semantic Analysis dalam Klasifikasi Dokumen Berbahasa Inggris Gilbert Wonowidjojo Bina

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Natural Language Processing (NLP) adalah area penelitian dan pengaplikasan yang mengekplorasi bagaimana caranya sebuah komputer dapat digunakan dan memanipulasi berupa

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

Mencari dokumen yang dituliskan dalam berbagai bahasa

Mencari dokumen yang dituliskan dalam berbagai bahasa Always Siempre Mencari dokumen yang dituliskan dalam berbagai bahasa Menggunakan query yang dituliskan dalam sebuah bahasa Pengguna internet jumlahnya terus meningkat dari tahun ke tahun dan tersebar

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Wicara atau ucapan adalah cara berkomunikasi yang paling sederhana dan sering digunakan oleh manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi

Lebih terperinci

1. BAB I PENDAHULUAN 1.1. Latar Belakang

1. BAB I PENDAHULUAN 1.1. Latar Belakang 1. BAB I PENDAHULUAN 1.1. Latar Belakang Riset di bidang sistem pengenalan ucapan otomatis (Automatic Speech Recognition) merupakan salah satu riset yang banyak ditekuni dan terus dikembangkan hingga saat

Lebih terperinci

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

1 BAB I PENDAHULUAN. 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan infrastruktur teknologi informasi dan penggunaannya berdampak luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah dalam memperoleh

Lebih terperinci

ARTIKEL KLASIFIKASI KONTEN BERITA SURAT KABAR BERDASARKAN JUDUL DENGAN TEXT MINING MENGGUNAKAN METODE NAÏVE BAYES (STUDI KASUS : RADAR KEDIRI)

ARTIKEL KLASIFIKASI KONTEN BERITA SURAT KABAR BERDASARKAN JUDUL DENGAN TEXT MINING MENGGUNAKAN METODE NAÏVE BAYES (STUDI KASUS : RADAR KEDIRI) ARTIKEL KLASIFIKASI KONTEN BERITA SURAT KABAR BERDASARKAN JUDUL DENGAN TEXT MINING MENGGUNAKAN METODE NAÏVE BAYES (STUDI KASUS : RADAR KEDIRI) Oleh: Enggal Suci Febriani 3..3..35 Dibimbing oleh :. Irwan

Lebih terperinci

Budi Susanto Versi /08/2012. Teknik Informatika UKDW Yogyakarta

Budi Susanto Versi /08/2012. Teknik Informatika UKDW Yogyakarta Budi Susanto Versi 1.0 29/08/2012 1 Memahami pengertian dari text mining dan web mining Memahami latar belakang perlunya pengolahan dokumen teks dan web Memahami arsitektur dasar aplikasi text dan web

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Indonesia. Pengembangan sistem..., Susy Violina, FASILKOM UI,

BAB 1 PENDAHULUAN. Universitas Indonesia. Pengembangan sistem..., Susy Violina, FASILKOM UI, BAB 1 PENDAHULUAN Bab ini menguraikan latar belakang penelitian, rumusan masalah, tujuan penelitian, ruang lingkup penelitian, tahapan penelitian, dan sistematika penulisan. 1.1 Latar Belakang Indonesia

Lebih terperinci

BAB I PENDAHULUAN. informasi yang disampaikan dapat lebih cepat dan efektif. Pada tempat observasi penelitian, penyampaian informasi melalui layanan

BAB I PENDAHULUAN. informasi yang disampaikan dapat lebih cepat dan efektif. Pada tempat observasi penelitian, penyampaian informasi melalui layanan BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Informasi merupakan bagian penting yang tidak dapat dipisahkan dari kehidupan sehari-hari, sehingga manusia berupaya membuat alat bantu agar informasi yang

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Berkembangnya teknologi telah membuat banyak informasi bermunculan. Informasi-informasi tersebut tertuang dalam bentuk dokumen terutama dokumen digital. Semakin

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

TUGAS AKHIR. Disusun oleh : SUSI SETYOWATI

TUGAS AKHIR. Disusun oleh : SUSI SETYOWATI POS TAGGER TWITTER BAHASA INDONESIA MENGGUNAKAN STANFORD NLP TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Disusun

Lebih terperinci

Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia

Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia Abd Wahab Syahroni 1), Joan Santoso 2), Endang Setyati

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci