BABI PENDAHULUAN. 1.1 Latar Belakang

Ukuran: px
Mulai penontonan dengan halaman:

Download "BABI PENDAHULUAN. 1.1 Latar Belakang"

Transkripsi

1 BABI PENDAHULUAN 1.1 Latar Belakang Named entity recognition(ner) merupakan salah satu bagian domain Information Extraction(IE) pada sistem Natural Language Processing(NLP). Sistem NER bertujuan untuk menyelesaikan identifikasi dan klasifikasi entitas secara kontekstual. Klasifikasi umum pada sistem NER meliputi: organisasi, person/orang, lokasi, tanggal, waktu, mata uang, persentase, fasilitas dan geo political entities(gpe)[1]. Salah satu contoh aplikasi NER dalam melakukan klasifikasi berdasarkan konteksnya ialah pada dua kalimat bahasa Indonesia berikut. Gadjah Mada seorang patih dari kerajaan Majapahit Pada kalimat pertama ini frase Gadjah Mada diklasifikasikan sebagai person/orang. Gadjah Mada merupakan salah satu universitas tertua di Indonesia pada kalimat kedua frase Gadjah Mada diklasifikasikan sebagai organisasi. Penelitian NER bahasa Indonesia yang ada saat ini telah mengadopsi pendekatan berbasis tradisional berupa rule-based maupun statistical method serta pendekatan machine learning(ml). Salah satu penelitian NER berbahasa Indonesia dengan konsep rule-based ialah penelitian yang dilakukan oleh Budi [2]. Pada penelitiannya ia mengembangkan system NER dengan konsep rulebased. Dari penelitian Budi didapatkan hasil yang lebih menonjol pada akurasi klasifikasi saja, bukan pada jumlah entitas yang ditemukan. Pendekatan machine-learning terutama pada model supervised learning ditemui pada penelitian yang dilakukan oleh Lutfi [3]. Penelitian yang dilakukan ialah membentuk mesin klasifikasi NER dengan menggunakan support vector machine (SVM) dan data berlabel dari DBPedia. Hasil klasifikasi NER yang dikembangkan menunjukkan nilai yang mendekati skor 90% untuk nilai recall dan precision. 1

2 Pengembangan sistem NER yang berbasis supervised learning cenderung memberikan hasil yang lebih baik, namun memiliki kendala harus memiliki data berlabel dalam jumlah yang ideal. Data berlabel yang dibutuhkan merupakan data yang memiliki tag atau label dan cenderung membutuhkan cost atau effort dalam mengumpulkannya karena harus mendapatkan bantuan dari expert. Dilain pihak data tanpa label sangat banyak sekali tersedia dan dapat dengan mudah dikumpulkan melalui internet dengan teknik web mining atau text mining[4], [5]. Data tanpa label dalam bahasa Indonesia dapat didapatkan secara mudah seperti melalui text mining atau data mining dari situs-situs berita nasional. Data tersebut dapat digunakan menjadi sebuah kumpulan data tanpa label. Permasalahan yang dihadapi ialah apabila sistem NER yang dikembangkan menggunakan konsep supervised learning yang mensyaratkan data training merupakan data yang berlabel maka data ini menjadi tidak bermakna, sedangkan jumlahnya ada sangat banyak. Pendekatan ML dengan model pembelajaran semi-supervised learning memungkinkan penggunaan data tanpa label untuk membantu proses pembelajaran. Pada tahun 1998 Blum dan Mitchell mengembangkan sebuah gagasan mengenai penggunaan unlabeled data untuk meningkatkan performa dalam sistem kalasifikasi mereka. Hasil klasifikasi menunjukkan hasil tingkat akurasi sebesar 95% untuk 788 halaman web yang menjadi uji coba[5]. Penelitian yang dilakukan oleh Gerrish dkk [6] mengenai pengujian kombinasi algoritme Bayesian dan K-Nearest Neighbor (KNN) dengan cotraining memberikan hasil peningkatan dibanding dengan menggunakan algoritme asli Bayesian atau KNN saja. Pierce dkk [7] melakukan penelitian yang berjudul Limitations of Co-Training for natural Language Learning from Large Datasets. Dalam penelitian tersebut terindikasi co-training merupakan salah satu metode yang effisien untuk pembelajaran bracketing dengan jumlah data berlabel yang sedikit. Memanfaatkan konsep pembelajaran semi-supervised learning, peneliti mencoba untuk memanfaatkan data tanpa label dengan menggunakan pendekatan 2

3 semi-supervised learning untuk meningkatkan kemampuan sistem NER bahasa Indonesia. Pembelajaran dilakukan dengan menggabungkan data berlabel yang diambil dari DBPedia Indonesia (dengan jumlah terbatas) dengan data tanpa label yang didapatkan dari artikel situs-situs berita nasional di Indonesia. Penelitian ini melakukan improvisasi dengan mengkombinasikan algoritme co-training dan algoritme klasifikasi SVM. Pemanfaatan data tanpa label dalam penelitian ini diharapkan dapat meninkatkan performa sistem NER bahasa Indonesia. Pengembangan sistem ini juga diharapkan dapat mengurangi cost atau effort dalam pengembangan sistem NER dengan memanfaatkan data tanpa label yang banyak tersedia. 1.2 Perumusan masalah Berdasarkan uraian latar belakang masalah dalam permasalahan Named Entity Recognition, maka diperoleh permasalahan sebagai berikut. 1. Banyak tersedianya data tanpa label berbahasa Indonesia yang berupa unstructured text dari situs-situs berita nasional di Indonesia. 2. Belum adanya penelitian mengenai penyelesaian permasalahan NER berbahasa Indonesia dengan memanfaatkan data tanpa label dalam membantu proses klasifikasi entitas. 1.3 Keaslian penelitian Hingga saat ini belum banyak pengembangan sistem NER berbahasa Indonesia dengan penyelesaian berbasis machine learning. Beberapa penelitian menunjukan bahwa penyelesaian sistem NER masih diselesaikan dengan metode rule-based dan basis data. Penelitian yang dilakukan oleh Budi [2] dalam sistem NER yang dibangun menggunakan association rules. Menurut Budi, sistem NER yang dikembangkan sesuai untuk penyelesaian klasifikasi yang mementingkan tingkat akurasi pada kualitas klasifikasi dibandingkan dengan quantity result. Pada tahun berikutnya Budi dkk [8] mengembangkan kembali sistem NER dengan pendekatan yang lebih baru yang dinamakan InNER (Indonesian Named 3

4 Entity Recognition). InNER menggunakan set aturan dalam menangkap konteks, morfologi dan part of speech yang diperlukan dalam klasifikasi entitas pada teks berbahasa Indonesia. Rules atau set aturan yang digunakan pada InNER sendiri dikembangkan dari knowledge yang dimiliki oleh expert. Hasil pengujian dari sistem InNER sendiri memiliki nilai 63,43% dan 71,84% untuk nilai yield recall dan precision. Menurut Budi dkk, hasil yang dicapai lebih tinggi dibandingkan dengan penelitian mereka sebelumnya terkait pengembangan NER dengan metode rule-based NER yang mereka kembangkan pada tahun Perkembangan penelitian klasifikasi NER hingga saat ini pada umumnya menggunakan SVM sebagai algoritme mesin klasifikasinya. Seperti penelitian yang dilakukan oleh Suwarningsih dkk [9] yang melakukan penelitian terhadap pengembangan sistem NER untuk kebutuhan medical named entity berbahasa Indonesia. Suwarningsih memiliki tujuan untuk mengembangkan sistem medical NER dengan sumber daya bahasa Indonesia yang tersedia. SVM digunakan sebagai mesin klasifikasi dalam penelitian ini. Hasil yang dicapai oleh sistem medical NER berbahasa Indonesia ini mencapai hampir 90% untuk nilai akurasinya. Luthfi dkk [3] pada tahun 2014 melakukan pengembangan sistem NER dengan menggunakan basis data Wikipedia dan DBPedia sebagai data training. Sistem NER yang mereka gunakan sendiri menggunakan Stanford-NER. Stanford NER merupakan sistem NER yang menggunakan Support Vector Machine(SVM) sebagai mesin klasifikasinya. Pada awal penelitiannya sistem NER yang dikembangkan ini berfokus pada tiga entitas yaitu person/orang, place/lokasi dan organization/organisasi. Hasil evaluasi sistem NER yang dikembangkan oleh Lutfi dkk memiliki tingkat persentase diatas 90% untuk nilai precision dan recall. Penyelesian permasalahan klasifikasi NER mulai mengadopsi konsep machine learning sebagai pendukung penyelesaian permasalahannya. Namun adanya keterbatasan data berlabel untuk proses pembelajaran mesin klasifikasi NER terutama pada model supervised learning menjadikan beberapa peneliti mencoba konsep pembelajaran semi-supervised learning pada mesin klasifikasi 4

5 NER. Penggunaan pembelajaran co-training sendiri diawali dengan riset mengenai text classification dengan algoritme tersebut. Penelitian classification dengan algoritme co-training yang dilakukan oleh Kiritchenko dkk [10] mengemukakan pada gagasan awal bahwa terjadi kekurangan dalam data berlabel. Kekurangan data berlabel ini menjadi masalah utama yang dihadapi oleh mesin klasifikasi secara umum. Hal ini berkaitan pula dengan pengumpulan data berlabel yang sifatnya costly atau membutuhkan effort. Konsep pembelajaran semi-supervised learning memanfaatkan data tanpa label untuk meningkatkan performa data berlabel yang jumlahnya terbatas. Hasil percobaan klasifikasi yang didapatkan sendiri bervariasi, tergantung dengan algoritme apa yang dugunakan untuk melakukan klasifikasi. Dalam kesimpulan penelitian disebutkan bahwa algoritme SVM memberikan performa lebih baik dibandingkan algoritme Bayesian dalam penelitian mereka dengan pendekatan semi-supervised. Pada tahun 2009 Liao dkk [11] melakukan sebuah penelitian aplikasi pembelajaran semi-supervised pada klasifikasi NER. Penelitian ini menggunakan metode klasifikasi conditional random fields (CRFs) yang digunakan untuk menginduksi data tanpa label, dengan memberikan label yang memiliki presisi tinggi ke kumpulan data tanpa label. Hasil pengujian memberikan peningkatan 12 poin pada nilai recall dan 4 poin pada nilai precission dibandingkan dengan pembelajaran supervised. Penggunaan pembelajaran semi-supervised dan SVM dikenalkan pula dalam penelitian yang dilakukan oleh Park Seong-Bae dkk [12]. Penelitian ini melakukan pendekatan untuk melakukan klasifikasi teks tidak terstruktur dalam skala besar. Pembelajaran co-training dan algoritme SVM digunakan untuk melakukan training data baik data berlabel dan data tanpa label. Hasil penelitian menunjukkan pembelajaran co-training memberikan peningkatan performa dari sistem klasifikasi dokumen yang mereka kembangkan baik untuk lexical dan syntactic information. Rangkuman penelitian pada bidang klasifikasi entitas atau NER ynag telah dilakukan oleh peneliti terdahulu ialah seperti pada Tabel

6 1.4 Tujuan Penelitian Tujuan pengembangan sistem NER untuk bahasa Indonesia dengan metode pembelajaran semi-supervised ini ialah sebagai berikut. a. Rancang bangun sistem NER bahasa Indonesia dengan pendekatan pembelajaran semi-supervised co-training, dengan memanfaatkan data tanpa label untuk meningkatkan performa sistem klasifikasi NER. b. Melakukan evaluasi unjuk kerja sistem NER yang dikembangkan dengan pendekatan pembelajaran semi-supervised co-training. 1.5 Manfaat Penelitian Penelitian pengembangan sistem NER untuk bahasa Indonesia dengan pendekatan metode pembelajaran semi-supervised ini diharapkan dapat meningkatkan performa sistem NER dengan keterbatasan data initial (data berlabel) dengan memanfaatkan data tanpa label yang berasal dari artikel situssitus berita nasional di Indonesia. 6

7 Table 1.1 Penelitian klasifikasi entitas yang telah ada Peneliti Judul Tahun Objek Metode Hasil Budi Indra Association Rules Mining for Name Entity Recognition 2003 News Article Association Rules Baik untuk penyelesaian taks yang mengedepankan kualitas klasifikasi daripada kuantitas klasifikasi. I. Budi, S. Bressan, G. Wahyudi, Z. A. Hasibuan, dan B. A. A. Nazief Named Entity Recognition for the Indonesian language: Combining contextual, morphological and part-ofspeech features into a knowledge engineering approach 2005 Indonesian Text Rule based: combining contextual, morphological and part of speech tagging. Precision: 71,84% and recall: 63,43% S. Wiwin, S. Iping, and P. Ayu imner Indonesian Medical Named Entity Recognition 2014 Medical Entities SVM ~ 90% accuracy A. Luthfi, B. Distiawan, and R. Manurung Building an Indonesian named entity recognizer using Wikipedia and DBPedia 2014 Text Classifcation SVM Precision: ~90% dan recall: ~90% 7

8 S. Kiritchenko and S. Matwin Classification with Co-Training Classification Co-training: SVM dan Bayesian Algoritme klasifikasi dengan SVM memberikan performa lebih baik daripada Bayesian. W. Liao and S. Veeramacha neni A simple semi-supervised algorithm for named entity recognition 2009 Named Entities in News Document SSL conditional random fields (CRFs) Precision score naik 4 poin dan recall score naik 12 poin. S. B. Park and B. T. Zhang Co-trained support vector machines for large scale unstructured document classification using unlabeled data and syntactic information 2004 Text classification Co-training - SVM Peningkatan performa klasifikasi pada lexical dan syntactic information. 8

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Indonesia adalah bahasa resmi dari Negara Indonesia. Berdasarkan ketentuan UU Nomor 24 tahun 2009 (Pasal 3) tujuan dari penggunaan Bahasa Indonesia sebagai bahasa

Lebih terperinci

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat

Lebih terperinci

UKDW BAB 1 PENDAHULUAN Latar Belakang

UKDW BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Dengan perkembangan teknologi yang semakin pesat, setiap orang dituntut untuk bisa memanfaatkan dengan baik perkembangan teknologi dan dapat menggunakan di dalam kehidupan

Lebih terperinci

PERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA

PERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA PERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA Astria Kurniawan Sumantri 1, Indra Budi 2, Heri Kurniawan 2 1,2,3 Fakultas Ilmu Komputer,Universitas

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang website adalah salah satu layanan yang bisa digunakan untuk melakukan pencarian berbagai informasi, sehingga sangat dibutuhkan untuk keperluan pengguna dalam pencarian

Lebih terperinci

PEMBUATAN MODEL NAMED ENTITY RECOGNITION UNTUK TWITTER BAHASA INDONESIA DENGAN MENGGUNAKAN STANFORD NER

PEMBUATAN MODEL NAMED ENTITY RECOGNITION UNTUK TWITTER BAHASA INDONESIA DENGAN MENGGUNAKAN STANFORD NER PEMBUATAN MODEL NAMED ENTITY RECOGNITION UNTUK TWITTER BAHASA INDONESIA DENGAN MENGGUNAKAN STANFORD NER TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika

Lebih terperinci

PENGGUNAAN MODEL RUANG VEKTOR DALAM PENGENALAN RELASI ANTAR ENTITAS PADA SISTEM EKSTRAKSI INFORMASI

PENGGUNAAN MODEL RUANG VEKTOR DALAM PENGENALAN RELASI ANTAR ENTITAS PADA SISTEM EKSTRAKSI INFORMASI PENGGUNAAN MODEL RUANG VEKTOR DALAM PENGENALAN RELASI ANTAR ENTITAS PADA SISTEM EKSTRAKSI INFORMASI Kiki Marjuki 1) Indra Budi 2) Fakultas Ilmu Komputer, Universitas Indonesia, Kampus UI Depok kiki972000@yahoo.com

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kemajuan dibidang teknologi informasi dan telekomunikasi berdampak pada munculnya berbagai media sosial, seperti Twitter. Twitter didirikan oleh Jack Dorsey, Biz Stone,

Lebih terperinci

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan jumlah situs web (website) di Internet berdasarkan hasil survey dari Netcraft (2013) menunjukkan peningkatan pesat dari 18 juta website pada tahun 2000

Lebih terperinci

ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED

ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED ISSN : 2355-9365 e-proceeding of Engineering : Vol.3, No.2 Agustus 2016 Page 3654 ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED ASPECT LEVEL SENTIMENT CLASSIFICATION

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Memasuki era big data, pertumbuhan data berbentuk dokumen teks semakin tinggi. Sehingga diperlukan text processing untuk pengolahan data yang sangat besar. Dokumen

Lebih terperinci

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan BAB I PENDAHULUAN Sebagai negara berkembang, perekonomian Indonesia didorong untuk tumbuh dengan pesat. Salah satu indikator pertumbuhan perekonomian yang baik adalah tingginya daya beli masyarakat. Tingginya

Lebih terperinci

DAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi.

DAFTAR ISI. Adryan Ardiansyah, 2013 Sistem Pengenalan Entitas Dengan Perceptron Pada Tweets Universitas Pendidikan Indonesia repository.upi. DAFTAR ISI ABSTRAK...i ABSTRACT... ii KATA PENGANTAR... iii DAFTAR ISI... v DAFTAR GAMBAR...vii DAFTAR TABEL... viii DAFTAR ISTILAH... ix BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah...

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

BAB 1 PENDAHULUAN. Universitas Sumatera Utara 1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Kata kunci (keyword) merupakan kata-kata singkat yang dapat menggambarkan isi suatu artikel ataupun dokumen (Figueroa,et al. 2014). Kata kunci memberikan kemudahan

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang 1 BAB 1 PENDAHULUAN Bab ini menguraikan latar belakang penelitian, rumusan masalah, tujuan penelitian, ruang lingkup penelitian, tahapan penelitian, dan sistematika penulisan. 1.1. Latar Belakang Indonesia

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang 1 BAB 1 PENDAHULUAN Bab ini berisi tentang latar belakang (subbab 1.1), tujuan penelitian (subbab 1.2), perumusan dan pembatasan masalah (subbab 1.3), metodologi penelitian (subbab 1.4), serta penjelasan

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil Penelitian 4.1.1 Support Vector Machines (SVM) Setelah melalui proses training dan testing dengan metode Support Vector Machines (SVM), diperoleh hasil yang tertera

Lebih terperinci

Truecasing untuk Teks Bahasa Indonesia

Truecasing untuk Teks Bahasa Indonesia Truecasing untuk Teks Bahasa Indonesia Said Al Faraby dan Ade Romadhony Fakultas Informatika Universitas Telkom Indonesia {saidalfaraby,aderomadhony}@telkomuniversity.ac.id Abstrak Penggunaan huruf besar

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini sudah banyak sistem klasifikasi yang diciptakan dalam rangka membantu pengguna dalam melakukan pengklasifikasian dokumen, baik dokumen yang berbentuk

Lebih terperinci

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. BAB I PENDAHULUAN 1. 1.1. Latar Belakang Perkembangan infrastruktur dan penggunaan teknologi informasi memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah perolehan

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Information age atau computer age adalah suatu era dimana kebutuhan seseorang akan informasi menjadi suatu hal yang sangat penting. Pada saat era informasi ini seseorang

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan merupakan salah satu aspek penting di dalam kehidupan. Oleh karena itu, pendidikan mendapat perhatian besar dalam kehidupan masyarakat dan negara. Pendidikan

Lebih terperinci

BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai

BAB II TINJAUAN PUSTAKA. Penelitian awal dalam bidang automatic text summarization dimulai BAB II TINJAUAN PUSTAKA Penelitian awal dalam bidang automatic text summarization dimulai dengan pembuatan metode term frequency oleh Luhn pada tahun 1958. Metode ini berasumsi bahwa frekuensi kata di

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah

Lebih terperinci

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala Metode Klasifikasi (SVM Light dan K-NNK NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech Jurusan Informatika FMIPA Universitas Syiah Kuala www.informatika.unsyiah.ac.id/tfa Alur dan Proses Cleaning Process Dokumen

Lebih terperinci

Named Entity Recognition Menggunakan Hidden Markov Model dan Algoritma Viterbi pada Teks Tanaman Obat

Named Entity Recognition Menggunakan Hidden Markov Model dan Algoritma Viterbi pada Teks Tanaman Obat Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 12, Desember 2017, hlm. 1858-1864 http://j-ptiik.ub.ac.id Named Entity Recognition Menggunakan Hidden Markov Model

Lebih terperinci

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan 1 BAB I PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan media sosial menawarkan pengguna kesempatan untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan tidak lagi memiliki

Lebih terperinci

PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM.

PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM. PART-OF-SPEECH TAGGING UNTUK DOKUMEN BAHASA BALI MENGGUNAKAN ALGORITMA BRILL TAGGER KOMPETENSI KOMPUTASI SKRIPSI NI PUTU MERI SRIYATI NIM. 1208605026 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN ILMU KOMPUTER

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kehadiran teknologi web yang interaktif telah merubah cara orang mengekspresikan pandangan dan opininya. Saat ini pengguna dapat menulis ulasan suatu produk pada situs

Lebih terperinci

ISSN : e-proceeding of Engineering : Vol.3, No.1 April 2016 Page 1184

ISSN : e-proceeding of Engineering : Vol.3, No.1 April 2016 Page 1184 ISSN : 2355-9365 e-proceeding of Engineering : Vol.3, No.1 April 2016 Page 1184 Ekstraksi Informasi pada Makalah Ilmiah dengan Pendekatan Supervised Learning Information Extraction on Scientific Papers

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN. 1.1 Latar belakang BAB I PENDAHULUAN 1.1 Latar belakang Dalam beberapa tahun terakhir teknologi informasi dan telekomunikasi berkembang dengan pesat. Masyarakat mendapatkan manfaat dari tekonologi informasi dan telekomunikasi

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

BAB II TINJAUAN PUSTAKA. salah satu persoalan penting dalam bidang affective computing. Deteksi emosi dapat

BAB II TINJAUAN PUSTAKA. salah satu persoalan penting dalam bidang affective computing. Deteksi emosi dapat BAB II TINJAUAN PUSTAKA Penelitian dalam tesis ini melakukan deteksi. menjadi salah satu persoalan penting dalam bidang affective computing. dapat dilakukan melalui beberapa media seperti ekspresi wajah,

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang pesat mempermudah akses terhadap informasi tekstual yang sangat besar jumlahnya, baik yang terdapat pada Internet maupun pada koleksi dokumen

Lebih terperinci

@UKDW BAB 1 PENDAHULUAN Latar Belakang

@UKDW BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Pada saat ini, sangatlah mudah untuk mendapatkan informasi, baik melalui media cetak maupun media elektronik. Akan tetapi, banyaknya informasi yang ada belum tentu

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1. 1.1 Latar Belakang Perkembangan dunia telekomunikasi meningkat secara signifikan dalam kurun waktu satu dekade terahir. Tidak hanya dari segi jumlah pengguna, jenis layanan yang ditawarkanpun

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Opini adalah pendapat pribadi yang tidak obyektif dan tidak melalui proses verifikasi (Quirk et al., 1985). Opini orang lain tentang suatu hal menjadi penting dalam

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah Bab 1 PENDAHULUAN 1.1 Latar Belakang Masalah Semakin hari semakin banyak inovasi, perkembangan, dan temuan-temuan yang terkait dengan bidang Teknologi Informasi dan Komputer. Hal ini menyebabkan semakin

Lebih terperinci

1. PENDAHULUAN 1.1 Latar belakang Masalah

1. PENDAHULUAN 1.1 Latar belakang Masalah 1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.

Lebih terperinci

BAB I PENDAHULUAN. Jumlah spam di dunia semakin meningkat secara eksponensial.

BAB I PENDAHULUAN. Jumlah  spam di dunia semakin meningkat secara eksponensial. BAB I PENDAHULUAN 1.1 Latar Belakang Jumlah email spam di dunia semakin meningkat secara eksponensial. Dilaporkan bahwa pada tahun 1978 sebuah email spam dikirimkan ke 600 alamat email. Sedangkan pada

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Selain sebagai media komunikasi, Twitter memberikan akses bagi pihak ketiga yang ingin mengembangkan aplikasi yang memanfaatkan layanannya melalui Twitter API. Salah

Lebih terperinci

Bandung, Indonesia Bandung, Indonesia

Bandung, Indonesia Bandung, Indonesia ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6353 Analisis dan Implementasi Pengklasifikasian Pesan Singkat pada Penyaringan SMS Spam Menggunakan Algoritma Multinomial Naïve

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi

Lebih terperinci

SKRIPSI. Triastuti Chandrawati

SKRIPSI. Triastuti Chandrawati Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning SKRIPSI Triastuti Chandrawati 1204000866 UNIVERSITAS INDONESIA FAKULTAS

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Proses pendidikan yang baik dapat dilihat dari hasil pembelajaran yang dilakukan melalui ujian atau tes. Tipe ujian atau latihan dapat dilakukan dengan berbagai

Lebih terperinci

Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi

Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN: 1978-1520 1 Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi Nitin Sabloak 1, Bebeto Agung Hardono 2, Derry Alamsyah 3 1,2 STMIK GI

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini media sosial seperti Twitter telah berkembang pesat. Data global menyebut pada akhir Desember 2014 Twitter memiliki 284 juta pengguna aktif. Dick Costolo

Lebih terperinci

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

1 BAB I PENDAHULUAN. 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan infrastruktur teknologi informasi dan penggunaannya berdampak luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah dalam memperoleh

Lebih terperinci

Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk Spam Filtering

Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk  Spam Filtering Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk E-mail Spam Filtering Proposal Tugas Akhir KBK: Rekayasa Perangkat Lunak dan Data (RPLD) Moh. Mahsus 113060088

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu tanggung jawab sosial PT. Telkom dalam program kemitraan dengan masyarakat sekitarnya adalah memberikan kredit lunak bagi pelaku Usaha Kecil Menengah (UKM).

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Indonesia. Pengembangan sistem..., Susy Violina, FASILKOM UI,

BAB 1 PENDAHULUAN. Universitas Indonesia. Pengembangan sistem..., Susy Violina, FASILKOM UI, BAB 1 PENDAHULUAN Bab ini menguraikan latar belakang penelitian, rumusan masalah, tujuan penelitian, ruang lingkup penelitian, tahapan penelitian, dan sistematika penulisan. 1.1 Latar Belakang Indonesia

Lebih terperinci

PERINGKASAN TEKS BAHASA INDONESIA SECARA OTOMATIS MENGGUNAKAN METODE SENTENCE SCORING DAN DECISION TREE

PERINGKASAN TEKS BAHASA INDONESIA SECARA OTOMATIS MENGGUNAKAN METODE SENTENCE SCORING DAN DECISION TREE TESIS PERINGKASAN TEKS BAHASA INDONESIA SECARA OTOMATIS MENGGUNAKAN METODE SENTENCE SCORING DAN DECISION TREE PERIANTU MARHENDRI SABUNA No. Mhs.: 155302367/PS/MTF PROGRAM STUDI MAGISTER TEKNIK INFORMATIKA

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Informasi telah menjadi kebutuhan utama dalam kehidupan manusia. Informasi bisa dikatakan sebagai pengetahuan yang didapatkan dari pembelajaran, pengalaman, atau instruksi.

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Apa yang orang lain pikirkan telah menjadi sesuatu yang penting untuk menjadi pertimbangan dalam pengambilan keputusan (Pang and Lee, 2006). Sesuatu yang orang lain

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

PENDAHULUAN. I.1 Latar Belakang

PENDAHULUAN. I.1 Latar Belakang I PENDAHULUAN I.1 Latar Belakang Internet sebagai jaringan komputer skala global telah mendorong pertambahan jumlah informasi digital. Pada sistem yang bersifat terbuka seperti internet, pertambahan informasi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Fiqih berarti paham atau mengerti, merupakan salah satu bagian dari domain agama. Hukum mempelajarinya adalah fardu ain bagi setiap kaum muslimin (Rasjid, 2013). Pemanfaatan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor

Lebih terperinci

Dr. Taufik Fuadi Abidin, S.Si., M.Tech

Dr. Taufik Fuadi Abidin, S.Si., M.Tech Dr. Taufik Fuadi Abidin, S.Si., M.Tech Ketua Program Studi Informatika FMIPA Universitas Syiah Kuala tfa@informatika.unsyiah.ac.id www.informatika.unsyiah.ac.id/tfa Disampaikan pada Seminar Nasional Teknologi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Setiap siswa di dalam kelas memiliki karakteristik diri yang berbeda beda, seperti : jujur, empati, sopan, menghargai dan sebagainya. Karakteristik diri tersebut berperan

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

Ekstraksi Informasi Halaman Web Menggunakan Pendekatan Bootstrapping pada Ontology-Based Information Extraction

Ekstraksi Informasi Halaman Web Menggunakan Pendekatan Bootstrapping pada Ontology-Based Information Extraction IJCCS, Vol.9, No.2, July 2015, pp. 111~120 ISSN: 1978-1520 111 Ekstraksi Informasi Halaman Web Menggunakan Pendekatan Bootstrapping pada Ontology-Based Information Extraction Erma Susanti* 1, Khabib Mustofa

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Twitter Twiter adalah sebuah layanan media sosial yang memungkinkan penggunanya untuk menulis maksimal 140 karakter, yang dikenal sebagai Tweet. Twitter didirikan oleh Jack Dorsey

Lebih terperinci

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali BAB I PENDAHULUAN 1.1. Latar Belakang Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali objek 3 dimensi. Sistem penglihatan manusia dapat membedakan berbagai macam objek 3 dimensi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Institusi pendidikan saat ini seharusnya membuat proses pembelajaran yang sesuai dengan karakteristik siswanya. Hal ini perlu diaplikasikan karena setiap siswa memiliki

Lebih terperinci

Penerapan Support Vector Machine untuk Ekstraksi Informasi dari Dokumen Teks

Penerapan Support Vector Machine untuk Ekstraksi Informasi dari Dokumen Teks Penerapan Support Vector Machine untuk Ekstraksi Informasi dari Dokumen Teks LAPORAN TUGAS AKHIR Disusun sebagai syarat kelulusan tingkat sarjana oleh : Paramita / 13504040 PROGRAM STUDI TEKNIK INFORMATIKA

Lebih terperinci

RANCANG BANGUN SISTEM OPINION MINING DENGAN METODE POS TAGGING

RANCANG BANGUN SISTEM OPINION MINING DENGAN METODE POS TAGGING TESIS RANCANG BANGUN SISTEM OPINION MINING DENGAN METODE POS TAGGING DAN SUPPORT VECTOR MACHINE UNTUK EKSTRAKSI DATA OPINI PUBLIK PADA LAYANAN JAMINAN KESEHATAN BALI MANDARA LUH RIA ATMARANI 1491761020

Lebih terperinci

FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP)

FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP) FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP) Ratna Pertiwi¹, Deni Saepudin², Intan Nurma Yulita³ ¹Teknik Informatika,, Universitas Telkom Abstrak Berkembangnya

Lebih terperinci

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh

Lebih terperinci

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Selama pengamatan dalam dekade terakhir terhadap hasil Penerjemahan Mesin (Machine Translation) ternyata masih terdapat masalah dari segi kualitas translasinya. Kualitas

Lebih terperinci

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK Lukman Syafie / JUPITER Volume XV No.2 (2016) 109 KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK Lukman Syafie Staf Pengajar Teknik Informatika, Fakultas Ilmu Komputer

Lebih terperinci

OPTIMASI SUFFIX TREE CLUSTERING DENGAN WORDNET DAN NAMED ENTITY RECOGNITION UNTUK PENGELOMPOKAN DOKUMEN

OPTIMASI SUFFIX TREE CLUSTERING DENGAN WORDNET DAN NAMED ENTITY RECOGNITION UNTUK PENGELOMPOKAN DOKUMEN Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK) p-issn: 2355-7699 Vol. 4, No. 4, Desember 2017, hlm. 263-267 e-issn: 2528-6579 OPTIMASI SUFFIX TREE CLUSTERING DENGAN WORDNET DAN NAMED ENTITY RECOGNITION

Lebih terperinci

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5097

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5097 ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5097 Perancangan Sistem Pemeringkatan Jawaban Pada Forum Tanya Jawab Menggunakan Textual Feature dan Semantic Similarity Answer

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Sistem jaringan komputer memiliki peran yang sangat penting dalam masyarakat modern karena memungkinkan informasi dapat diakses, disimpan dan dimanipulasi secara online.

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Kebutuhan informasi dan perkembangan teknologi yang semakin tinggi meningkatkan jumlah artikel atau berita yang terpublikasikan, terutama pada media online. Untuk

Lebih terperinci

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan

Lebih terperinci

ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE

ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE SENTIMENT ANALYSIS ON THE ENGLISH BOOK REVIEWS USING INFORMATION GAIN AND SUPPORT VECTOR MACHINE

Lebih terperinci

Apa itu is K-Nearest Neighbor (KNN) Algorithm?

Apa itu is K-Nearest Neighbor (KNN) Algorithm? K-Nearest Neighbor Pendahuluan K-Nearest Neighbour atau KNN adalah salah dari algoritma instance based learning atau case-based reasoning. Definisi case based reasoning: KNN digunakan dalam banyak aplikasi

Lebih terperinci

Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita

Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita Yoseph Samuel, Rosa Delima, Antonius Rachmat 1) Program Studi Teknik Informatika Universitas Kristen Duta Wacana,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi informasi sudah semakin maju. Beberapa aplikasi text mining awal menggunakan penyajian sederhana yang disebut dengan bag-ofwords' ketika

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Citra merupakan salah satu media yang penting bagi manusia untuk memperoleh informasi. Seiring dengan perkembangan teknologi citra digital maka setiap orang dapat dengan

Lebih terperinci

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Achmad Ridok 1), Retnani Latifah 2) Filkom

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini, microblogging menjadi sangat popular untuk alat komunikasi antara pengguna internet. Setiap hari jutaan pesan muncul di website penyedia microblogging diantaranya

Lebih terperinci

OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA

OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA Optimization Techniques Modi ed k Nearest Neighbor Classi cation Using Genetic Algorithm Siti Mutro n 1, Abidatul

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN PENEMPATAN JURUSAN MAHASISWA BARU MENGGUNAKAN METODE K-NEAREST NEIGHBOR

SISTEM PENDUKUNG KEPUTUSAN PENEMPATAN JURUSAN MAHASISWA BARU MENGGUNAKAN METODE K-NEAREST NEIGHBOR Cogito Smart Journal/VOL. 1/NO. 1/DESEMBER 2015IJCCS ISSN: 1 97 55 SISTEM PENDUKUNG KEPUTUSAN PENEMPATAN JURUSAN MAHASISWA BARU MENGGUNAKAN METODE K-NEAREST NEIGHBOR Ratih Kumalasari Niswatin 1) Teknik

Lebih terperinci

BAB IV PREPROCESSING DATA MINING

BAB IV PREPROCESSING DATA MINING BAB IV PREPROCESSING DATA MINING A. Konsep Sebelum diproses data mining sering kali diperlukan preprocessing. Data preprocessing menerangkan tipe-tipe proses yang melaksanakan data mentah untuk mempersiapkan

Lebih terperinci

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL

PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2013 PENANGANAN OOV ( OUT OF VOCABULARY ) PADA POS TAGGING HIDDEN MARKOV MODEL I Wayan Hendra Maha Putra¹, Imelda Atastina², Alfian Akbar Gozali³ ¹Teknik

Lebih terperinci