BAB I PENDAHULUAN 1.1 Latar Belakang

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak

JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang,

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

3.1 Desain Penelitian

BAB I PENDAHULUAN Latar Belakang

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

1. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam.

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB III METODOLOGI PENELITIAN

IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER

ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( )

BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB I PENDAHULUAN 1.1. Latar Belakang

SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER

BAB I PENDAHULUAN I - 1

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN.

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM

BAB I PENDAHULUAN 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Pemilihan presiden merupakan momen penting bagi setiap negara, salah satunya

Agus Soepriadi, 2 Meta Permata. Jurusan Teknik Informatika, STMIK Bandung, Bandung, Indonesia

BAB 1 PENDAHULUAN. Universitas Indonesia. Klasifikasi topik menggunakan..., Dyta Anggraeni

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

BAB I PENDAHULUAN. informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentimen

1 BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1 PENDAHULUAN

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

TEXT MINING DALAM ANALISIS SENTIMEN ASURANSI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. Bab ini menjelaskan latar belakang yang mendasari dilakukannya

BAB 1 PENDAHULUAN Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB III METODELOGI PENELITIAN

PEMBANGUNAN APLIKASI ANALISIS SENTIMEN BERITA MENGGUNAKAN METODE NAIVE BAYES

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

BAB 2 TINJAUAN PUSTAKA

Oleh: ARIF DARMAWAN NIM

ANALISIS SENTIMEN BERBAHASA INDONESIA DENGAN PENDEKATAN LEXICON-BASED PADA MEDIA SOSIAL

HERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT.

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir

Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISA SENTIMEN MENGGUNAKAN NAÏVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP KENAIKAN HARGA JUAL ROKOK PADA MEDIA SOSIAL TWITTER

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

BAB 3 LANDASAN TEORI

SENTIPOL: Dataset Sentimen Komentar Pada Kampanye PEMILU Presiden Indonesia 2014 Dari Facebook Page

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN UKDW

BAB 3 LANDASAN TEORI

SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER

BAB I PENDAHULUAN. diwilayah jawa timur. Dengan jumlah penduduk pada tahun 2010 sebanyak

PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB 3 LANDASAN TEORI

BAB III METODOLOGI PENELITIAN

SISTEM ANALISIS SENTIMEN POSITIF DAN NEGATIF MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES PADA KASUS TOKOH PUBLIK CAPRES INDONESIA 2014

Klasifikasi Akun Prostitusi Berdasarkan Skoring Tweet

PENGUKURAN TINGKAT KEPOPULARITASAN PARTAI POLITIK DI INDONESIA BERDASARKAN DATA DARI TWITTER

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Liu opini merupakan pernyataan subyektif yang mencerminkan sentimen orang atau persepsi tentang entitas dan peristiwa [1]. Opini atau pendapat orang lain terhadap suatu obyek menjadi penting dalam pengambilan keputusan. Misalnya seseorang akan membeli suatu produk, biasanya dia akan bertanya kepada orang lain bagaimana pendapat mereka tentang produk tersebut. Seiring dengan perkembangan teknologi dan internet, saat ini kita tidak perlu bertanya tentang pendapat orang lain secara langsung. Telah banyak orang yang berbagi informasi tentang pendapat dan pengalaman bahkan kritik mereka terhadap suatu obyek tertentu melalui website, blog atau media sosial. Salah satu media sosial yang cukup terkenal yaitu Twitter. Twitter merupakan media sosial yang dibuat oleh Biz Stone, Evan Willliams, dan Jack Dorsey pada tahun 2006. Twitter memiliki pengguna lebih dari 200 juta dan diperkirakan akan terus bertambah. Pengguna Twitter sekarang ini bukan hanya kalangan pribadi atau perseorangan saja. Tetapi kalangan corporate dan politikus juga memanfaatkan Twitter sebagai media komunikasi dengan masyarakat. Menurut data yang dilansir oleh semiocast.com pada tahun 2012, Indonesia menjadi negara dengan pengguna Twitter ke-5 terbanyak di dunia dengan total 29 juta akun di bawah Inggris, Jepang, Brazil, dan Amerika Serikat. Tahun 2014 merupakan tahun politik bagi Indonesia, karena Indonesia akan menggelar pesta demokrasi Pemilu (Pemilihan Umum). Masyarakat Indonesia akan menggunakan hak pilihnya untuk memilih para calon legislatif dari tingkat pusat hingga daerah dan memilih calon presiden Republik Indonesia. Banyak dari calon legislatif yang memanfaatkan media sosial Twitter sebagai media untuk mempromosikan diri mereka. Tidak ketinggalan para calon presiden juga memanfaatkan Twitter untuk menaikkan elektabilitas mereka. Hal ini menimbulkan banyak tanggapan berupa opini dari masyarakat yang diungkapkan melalui sebuah tweet tentang para calon presiden tersebut. Namun sebagian besar pengguna Twitter menuliskan tweet mereka menggunakan bahasa yang tidak 1

baku. Dimana penggunaan kata dalam menuliskan tweet bersifat bebas dan terbatas hanya 140 karakter, sehingga banyak istilah-istilah tidak baku maupun paduan simbol-simbol yang ditemukan pada tweet. Berdasarkan pada paparan diatas terdapat potensi besar pada media sosial Twitter untuk dilakukan opinion mining. Dengan tujuan untuk mengetahui pendapat orang lain tentang obyek tertentu, yang dapat dimanfaatkan dalam proses pengambilan keputusan. Dalam opinion mining untuk menentukan sentimen dikenal adanya metode berbasiskan machine learning, berbasiskan kamus (lexicon-based) atau gabungan keduanya. Beberapa penelitian yang sudah ada sekarang ini kebanyakan menggunakan machine learning baik dengan Naïve Bayes, Support Vector Machine ataupun yang berbasiskan kamus (lexicon-based). Pada penelitian ini akan dilakukan opinion mining dengan mengklasifikasikan tweet ke dalam kategori sentimen positif atau negatif menggunakan kombinasi antara pendekatan lexicon-based dan algoritma naïve bayes classifier. Dengan melakukan kombinasi antara pendekatan berbasiskan lexicon dan algoritma naïve bayes classifier diharapkan dapat meningkatkan akurasi pada proses pengklasifikasian opini. 1.2 Rumusan Masalah Berdasarkan latar belakang di atas, rumusan masalah yang akan dibahas dalam penelitian tugas akhir ini adalah : 1. Bagaiamana melakukan ekstraksi dan normalisasi data tweet? 2. Bagaimana mengkombinasikan lexicon-based dan algoritma naïve bayes classifier untuk mengklasifikasikan data tweet ke dalam kategori sentimen positif atau negatif dan seberapa besar akurasinya? 1.3 Tujuan Tujuan dalam penelitian tugas akhir ini adalah melakukan opinion mining pada data tweet dengan mengklasifikasikan kedalam kategori sentimen positif atau negatif menggunakan kombinasi metode lexicon-based dan algoritma naïve bayes classifier. 2

1.4 Batasan Masalah Batasan masalah dalam penelitian tugas akhir ini dengan beberapa ketentuan sebagai berikut : 1. Data latih (training) dan data uji (testing) yang digunakan dalam penelitian ini berasal dari media sosial Twitter berbahasa Indonesia. 2. Klasifikasi data tweet dikategorikan menjadi dua kategori opini, yaitu opini positif dan opini negatif. 3. Topik dari data tweet merupakan tweet post tentang calon presiden Indonesia. 4. Tidak melakukan pemrosesan emoticon. 5. Kamus lexical dibangun menggunakan cara manual. 1.5 Metodologi Metodologi yang digunakan dalam penyelesaian penelitian tugas akhir ini, diantaranya : 1. Studi Pustaka dan Pengumpulan Data Pada tahap ini dilakukan pemahaman konsep dan teori pendukung penelitian mengenai text mining, opinion mining, sentiment analysis, lexicon-based, Twitter API dan klasifikasi. Serta dilakukan juga pengumpulan data-data yang akan digunakan untuk proses klasifikasi. Data-data yang dikumpulkan merupakan data tekstual tweet yang diambil dari media sosial Twitter dengan memanfaatkan Twitter API yang sudah disediakan. 2. Analisa Sistem Pada tahap ini dilakukan analisa terhadap proses klasifikasi yanag akan dilakukan oleh sistem dan analisa kebutuhan sistem baik kebutuhan fungsional maupun non fungsional untuk pembangunan sistem. Selain itu juga dilakukan analisa terhadap data tweet yang akan digunakan dalam proses klasifikasi. 3

3. Perancangan Sistem Pada tahap ini dilakukan perancangan sistem metode kombinasi antara lexicon-based dan algoritma naïve bayes classifier yang akan diimplementasikan dalam proses klasifikasi. Perancangan sistem meliputi training dan testing. Dalam proses training data tweet akan diklasifikasikan secara manual kedalam kategori sentimen positif atau sentimen negatif untuk membentuk data training dari algoritma naïve bayes classifier. Pada proses testing akan dilakukan klasifikasi terhadap data tweet dengan mengkombinasikan metode lexicon-based dan algoritma naïve bayes classifier. Sebelum diklasifikasikan data tweet harus melewati tahap preprocessing. Pada tahap preprocessing akan dilakukan beberapa hal diantaranya : a. Case Folding adalah proses pengubahan setiap karakter huruf menjadi huruf kecil. b. Cleansing adalah proses membersihkan tweet dari kata atau karakter yang tidak diperlukan untuk mengurangi noise. Kata atau karakter yang dihilangkan adalah angka, simbol, emoticon, hashtag, username, alamat url, dan alamat email. c. Tokenisasi adalah proses pemotongan kalimat menjadi beberapa kata. d. Replacement adalah proses penggantian kata tidak baku dengan kata baku yang tersedia pada kamus. e. Stopword Removal adalah proses menghilangkan kata-kata yang tidak berpengaruh pada klasifikasi data. 4. Implementasi Pada tahap ini dilakukan implementasi atau penerapan sistem berdasarkan perencanaan sistem yang telah dibuat sebelumnya dengan menggunakan bahasa pemrograman PHP dan MySQL sebagai basisdata. 5. Pengujian Pada tahap ini dilakukan uji coba terhadap sistem yang telah dibangun. Pengujian dilakukan dengan menguji fungsionalitas sistem dan pengujian keberhasilan sistem berdasarkan hasil klasifikasi, apakah opini 4

diklasifikasikan secara benar. Serta dilakukan perhitungan akurasi dari klasifikasi yang telah dilakukan. 6. Dokumentasi Pada tahap ini dilakukan pembuatan laporan untuk dokumentasi penelitian sehingga dapat dipergunakan sebagai pedoman untuk penelitian lanjutan. 1.6 Sistematika Penulisan Penulisan tugas akhir ini terdiri dari atas lima bagian pembahasan, yaitu Pendahuluan, Landasan Teori, Analisa dan Perancangan Sistem, Implementasi dan Pengujian, serta Penutup. Kelima bagian pembahasan tersebut adalah sebagai berkut : BAB I Pendahuluan Bab ini membahas latar belakang penelitian, rumusan masalah, batasan masalah, tujuan, metodologi dan sistematika penulisan laporan Tugas Akhir. BAB II Landasan Teori Bab ini membahas konsep dasar dan teori-teori yang menjadi dasar acuan atas pembahasan permasalahan yang berkaitan dengan dengan pengerjaan Tugas Akhir. Isi pada bagian ini didapat melalui studi pustaka dari berbagai sumber dan referensi. BAB III Analisa dan Perancangan Sistem Bab ini membahas analisa kebutuhan sistem dan rancangan sistem yang akan dibangun. BAB IV Implementasi dan Pengujian Sistem Bab ini membahas tentang implementasi atau penerapan dan pengujian dari rancangan sistem yang telah dibuat. BAB V Penutup Bab ini berisi kesimpulan dan saran tentang hasil perancangan dan implementasi terhadap aplikasi yang telah dibuat. 5