BAB I PENDAHULUAN Latar Belakang

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak

1. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar belakang

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam.

BAB I PENDAHULUAN 1 PENDAHULUAN

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

SENTIPOL: Dataset Sentimen Komentar Pada Kampanye PEMILU Presiden Indonesia 2014 Dari Facebook Page

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( )

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang,

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1. Latar belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

2016 SISTEM PRED IKSI SPAM ACCOUNT PAD A MED IA SOSIAL TWITTER D ENGAN MENGGUNAKAN ALGORITMA C4.5

BAB I PENDAHULUAN. diwilayah jawa timur. Dengan jumlah penduduk pada tahun 2010 sebanyak

BAB I PENDAHULUAN.

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

BAB I PENDAHULUAN. informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentimen

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. masalah kecerdasan, desain, pemilihan, implementasi, dan monitoring (Tripathi,

BAB 1 PENDAHULUAN. mudah berpartisipasi, berbagi, dan menciptakan isi meliputi blog, jejaring sosial, wiki,

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

UKDW BAB I PENDAHULUAN

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN. ilmu tertentu dengan menggunakan kaidah-kaidah yang berlaku dalam bidang

ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES

BAB I PENDAHULUAN. jurusan ditentukan berdasarkan standar kriteria tiap jurusan.

BAB I PENDAHULUAN 1.1. Latar Belakang Rendy, 2013

BAB 1 PENDAHULUAN Latar Belakang

1. Pendahuluan 1.1 Latar Belakang

BAB I PENDAHULUAN I-1

PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1.Latar Belakang

3.1 Desain Penelitian

BAB I PENDAHULUAN. Pesatnya pertumbuhan internet saat ini berdampak pada melimpahnya

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UNTUK TOPIC DETECTION AND TRACKING PADA MICROBLOG TWITTER

BAB II TINJAUAN PUSTAKA. salah satu persoalan penting dalam bidang affective computing. Deteksi emosi dapat

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Hal ini dibuktikan dengan adanya fakta yang diungkap oleh World Health

BAB I PENDAHULUAN. 1.1 Latar Belakang. Mikroblog adalah salah satu bentuk blog yang memungkinkan

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

BAB I PENDAHULUAN. 1.1 Latar Belakang

ANALISIS SENTIMEN DATA KRITIK DAN SARAN PELATIHAN APLIKASI TEKNOLOGI INFORMASI (PATI) MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN I-1

BAB I PENDAHULUAN. 1.1 Pendahuluan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Dunia internet kian pesat berkembang saat ini. Aliran informasi pun semakin

BAB I PENDAHULUAN. Dari hari ke hari pengguna internet semakin bertambah. sebenarnya apa

BAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy).

Transkripsi:

BAB I PENDAHULUAN 1.1. Latar Belakang Apa yang orang lain pikirkan telah menjadi sesuatu yang penting untuk menjadi pertimbangan dalam pengambilan keputusan (Pang and Lee, 2006). Sesuatu yang orang lain pikirkan dan diutarakan dalam bentuk suatu opini ataupun sentimen yang bersifat subjektif. Opini ataupun sentimen ini dimanfaatkan di dalam berbagai aspek. Di dalam aspek bisnis dan marketing contohnya, suatu perusahaan memanfaatkan opini user terkait produknya yang baru saja dirilis. Begitu juga pada aspek yang lain seperti aspek politik, para pengamat politik menggunakan opini atau sentimen orang-orang untuk mengamati polaritas sentimen pro-kontra terhadap suatu isu politik ataupun tokoh publik. Dengan adanya internet yang mendukung orang-orang untuk mengakses dan bertukar informasi, sehingga memunginkan untuk menemukan berbagai opini atau sentimen yang lebih bervariasi dari berbagai macam kalangan (Pang and Lee, 2006). Berbagai wadah digunakan oleh pengguna internet (netizen) dalam mengutarakan opini dan sentimen, salah satunya adalah media sosial. Fitur-fitur yang ada pada media sosial membolehkan netizen untuk melakukan aktivitas microblogging, yaitu aktivitas di mana netizen sebagai pengguna suatu layanan blog atau media mengirim dan mempublikasi pesan teks singkat kepada sesama pengguna layanan lainnya. Salah satu platform microblogging yang terkenal yaitu Twitter, di mana orang-orang menuliskan sesuatu yang mereka alami secara online dan real-time pada keseharian mereka dan menjadi sumber data yang menyimpan berbagai jenis informasi (Agarwal et al., 2011). Berdasarkan berita yang dilansir dari cnnindonesia.com, Indonesia menjadi salah satu negara dengan pengguna Twitter terbanyak didunia 1

2 dengan jumlah pengguna sekitar 50 juta (Hasibuan, 2015). Para netizen Indonesia ini menggunakan Twitter dengan mengunggah tweet, yaitu teks pendek yang tidak lebih dari 140 karakter untuk mendiskusikan berbagai isu, gaya hidup, tokoh-tokoh terkenal yang viral dan tren di tengah masyarakat. Terlebih dari itu, tak jarang para pengguna twitter ini bersentimen terhadap hal-hal yang didiskusikan tersebut. Keberagaman topik yang diangkat oleh kalangan pengguna Twitter ini tentunya mempengaruhi jumlah tweet yang diunggah. Jumlah tweet yang diunggah setiap harinya sangatlah besar. Ketersediaan data sangat besar inilah yang menjadi faktor pendukung penelitian-penelitian yang dilakukan pada domain pengklasifikasian teks. Para peneliti yang melakukan riset dalam bidang text mining khususnya klasifikasi teks, baik berfokuskan pada pemecahan suatu kasus baru maupun dengan pengembangan ataupun perbandingan kinerja algoritma. Beberapa algoritma yang popular seperti Support Vector Machine, Naïve- Bayes, dan Decision Tree yang diimplementasikan pada penelitian yang fokus pada analisis sentimen seperti pengekstraksian topik penentu sentimen pada tokoh publik (Sunni dan Widyantoro, 2012) dan analisis sentimen pada Twitter mengenai penggunaan transportasi darat dalam kota (Novantirani et al., 2015a). Masing-masing penelitian tersebut menggunakan Naïve-Bayes dan Support Vector Machine dikarenakan kemudahan untuk pengimplementasian dan juga tergolong efektif dalam kasus klasifikasi. Selain itu, beberapa peneliti lainnya juga melakukan pengembangan terhadap algoritma tersebut dalam meningkatkan efektivitas dalam implementasi khusus pada klasifikasi teks. Penelitian yang dilakukan oleh Rennie et al. (2003) pengembangan pada algoritma Naïve-Bayes, yaitu Transformed Weight-normalized Complement Naïve- Bayes dalam hal menangani permasalahan-permasalahan pengklasifikasian teks. Permasalahan yang ditangani pada penelitian tersebut mencakup beberapa hal seperti pengaruh panjang dokumen pada data latih dan keseimbangan pembagian jumlah data

3 latih pada hasil pengklasifikasian. Demikian juga suatu penelitian dilakukan oleh Trstenjak et al. (2014) yang mengembangkan salah satu algoritma lazy learning yaitu k-nearest Neighbor dalam lingkungan klasifikasi teks. Walaupun kedua algoritma ini memiliki akurasi pengklasifikasian yang relatif lebih rendah dibandingkan dengan algoritma sophisticated seperti Support Vector Machine seperti yang dilakukan pada penelitian sebelumnya, kedua algoritma ini tergolong algoritma yang populer dan mudah dipahami. Namun di antara kedua algoritma ini belum diketahui secara pasti mana yang memiliki performa pengklasifikasian yang lebih baik. Penelitian ini dilakukan dengan tujuan untuk membandingkan performa yang diukur pada suatu variabel atau metric tertentu melalui analisis hasil pengujian klasifikasi dari algoritma Tranformed Weight-normalized Complement Naïve-Bayes dan K-nearest Neighbor dalam mengklasifikasi sentimen pada tweet pengguna Twitter pada suatu domain diskusi yang telah ditentukan. 1.2. Rumusan Masalah Dari latar belakang yang telah dipaparkan sebelumnya, berbagai masalah yang telah dirumuskan dan akan dijawab dengan penelitian ini. Berikut adalah berbagai rumusan masalah yang digunakan pada penelitian ini. 1. Bagaimana melakukan pengklasifikasian sentimen dari tweet netizen yang dipublikasi dalam bahasa Indonesia pada Twitter terhadap suatu topik yang ditentukan? 2. Pendekatan machine learning algorithm manakah yang memiliki performa lebih baik dalam mengklasifikasi sentimen, apakah algoritma Transformed Weighted-normalized Complement Naïve-Bayes atau K-nearest Neighbor?

4 1.3. Batasan Masalah Untuk menghindari pembahasan riset yang terlalu luas, maka dari itu ditetapkanlah beberapa batasan masalah untuk penelitian ini. 1. Pemilihan objek untuk analisis sentimen, data mentah tweet Twitter yang diambil mengandung topik mengenai salah satu tokoh pejabat Republik Indonesia yaitu Gubernur Jakarta Basuki Tjahaja Purnama atau Bapak Ahok dengan menggunakan query untuk data crawling terdiri atas "#pilgubdki2017", "ahok", "#ahok", "@basuki_btp", "#temanahok", "teman ahok". 2. Penentuan label kelas sentimen terhadap tweet dilakukan pada tiga polaritas yaitu: a). Sentimen positif yang mengandung opini positif terhadap objek pembicaraan, b). Sentimen negatif yang mengandung opini negatif terhadap objek pembicaraan, dan c). Tanpa sentimen atau netral yang tetap berada pada topik terkait objek pembicaraan namun tidak mengandung ekspresi sentimen di dalamnya. 1.4. Tujuan Penelitian Tujuan dari riset ini adalah sebagai berikut. 1. Membangun suatu model yang mengekstraksi serta mengklasifikasi sentimen dari teks tweet berbahasa Indonesia. 2. Menemukan algoritma pengklasifikasian yang memiliki performa lebih baik antara algoritma Transformed Weighted-normalized Complement Naïve- Bayes (TWCNB) dan K-nearest Neighbor (KNN).

5 1.5. Manfaat Penelitian Dengan dilakukannya penelitian, diharapkan tercapainya beberapa manfaat sebagai berikut. 1. Penelitian ini mampu memberikan pemahaman yang baik mengenai pengimplementasian algoritma-algoritma populer pada kasus klasifikasi sentimen. 2. Memicu terlaksananya penelitian-penelitian lain yang bertujuan untuk mengembangkan algoritma TWCNB maupun KNN dari segi apapun, yang nantinya diharapkan kedua algoritma ini dapat digunakan secara praktis untuk berbagai kasus. 1.6. Metodologi Penelitian Metodologi yang digunakan pada penelitian ini adalah sebagai berikut. 1. Studi Pustaka Studi pustaka dilakukan dengan mengumpulkan informasi-informasi dalam bentuk metode, teknik, maupun teori dari penelitian sebelumnya untuk memahami proses klasifikasi dan analisis sentimen beserta berbagai algoritma yang digunakan pada penelitian tersebut. Literatur diperoleh dari jurnaljurnal, paper, maupun karya tulis ilmiah. 2. Analisis dan Perancangan Analisis dilakukan untuk memahami alur kerja dari proses ekstraksi dari data tweet yang telah dikumpulkan dan disimpan pada database dan proses klasifikasi sentimen berdasarkan algoritma-algoritma yang ditentukan pada penelitian, yaitu TWCNB dan KNN beserta rancangan dari masing-masing proses pengklasifikasian.

6 3. Implementasi Implementasi berupa penulisan kode dari rancangan model yang telah dibangun berdasarkan proses analisis sebelumnya. Kode ditulis menggunakan bahasa pemrograman PHP dengan framework Laravel. 4. Pengujian Pengujian dilakukan menggunakan beberapa dataset pengujian telah dilewatkan pada suatu tahap normalisasi untuk melihat proses klasifikasi sentimen beserta menguji efisiensi dari algoritma penelitian, yaitu TWCNB dan KNN. 1.7. Sistematika Penulisan Penelitian ini terdiri atas tujuh bab dengan sistematika masing-masing bab adalah sebagai berikut. BAB I PENDAHULUAN Bab ini memuat latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, metodologi penelitian yang digunakan, dan sistematika penulisan. BAB II TINJAUAN PUSTAKA Bab ini memuat berbagai penelitian-penelitian sebelumnya terkait topik permasalahan dari penelitian dan menjadi bahan referensi dalam penelitian ini. BAB III LANDASAN TEORI Bab ini memuat teori-teori yang digunakan pada penelitian ini. BAB IV ANALISIS DAN RANCANGAN Bab ini memuat penjelasan terkait analisis permasalahan, perancangan model berdasarkan algoritma penelitian terhadap implementasi yang akan dilakukan.

7 BAB V IMPLEMENTASI Bab ini memuat penjelasan dari kode pengimplementasian yang telah dikembangkan berdasarkan perancangan yang dibuat sebelumnya. BAB VI HASIL DAN PEMBAHASAN Bab ini memuat penjelasan dari hasil penelitian dan pengujian dari implementasi beserta analisis hasil pengujian. BAB VII KESIMPULAN DAN SARAN Bab ini berisi penjelasan mengenai kesimpulan akhir dari penelitian dan berbagai saran untuk penelitian yang akan datang.