BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

dokumen-dokumen yang mirip
BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam.

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN Latar Belakang

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN.

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODE PENELITIAN

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN I - 1

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

TEXT MINING DALAM ANALISIS SENTIMEN ASURANSI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

1. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS SENTIMEN HATESPEECH PADA TWITTER DENGAN METODE NAÏVE BAYES CLASSIFIER DAN SUPPORT VECTOR MACHINE

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

DETEKSI SUBJEKTIFITAS TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE LEXICON RULE BASED

BAB I PENDAHULUAN. 1.1 Latar Belakang

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X

BAB IV HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,

BAB I PENDAHULUAN 1.1 Latar Belakang

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

BAB I PENDAHULUAN. 1.1 Latar Belakang. Mikroblog adalah salah satu bentuk blog yang memungkinkan

Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE

BAB I PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

KLASIFIKASI KALIMAT TANYA BERDASARKAN TAKSONOMI BLOOM MENGGUNAKAN SUPPORT VECTOR MACHINE TUGAS ASKHIR

BAB I PENDAHULUAN. sistem perangkat lunak komputer yang menggunakan ilmu, fakta, dan teknik

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

MULTINOMIAL NAÏVE BAYES CLASSIFIER UNTUK MENENTUKAN REVIEW POSITIF ATAU NEGATIF PELANGGAN WEBSITE PENJUALAN

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

Analisis Kinerja Kombinasi Metode Berbasis Lexicon dan Metode Berbasis Learning pada Analisis Sentimen Twitter

ANALISIS SENTIMEN DATA KRITIK DAN SARAN PELATIHAN APLIKASI TEKNOLOGI INFORMASI (PATI) MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentimen

IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR

Analisis Sentimen Menggunakan Support Vector Machine dan Maximum Entropy. Sentiment Analysis Using Support Vector Machine and Maximum Entropy Method

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang,

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET

Uji Perbandingan Akurasi Analisis Sentimen Pariwisata menggunakan Algoritma Support Vektor Machine dan Naive Bayes

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Jumlah spam di dunia semakin meningkat secara eksponensial.

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENGEMBANGAN METODE EKTRAKSI FITUR DALAM PENINGKATAN HASIL PERFORMA KLASIFIKASI SENTIMEN TWITTER

BAB I PENDAHULUAN. ilmu tertentu dengan menggunakan kaidah-kaidah yang berlaku dalam bidang

BAB I PENDAHULUAN. banyak informasi yang tersedia di internet, maka akan semakin sulit juga untuk

Analisis Sentimen Calon Gubernur DKI Jakarta 2017 Di Twitter

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis

ANALISIS SENTIMEN PADA REVIEW RESTORAN DENGAN TEKS BAHASA INDONESIA MENGUNAKAN ALGORITMA NAIVE BAYES

BAB 1 PENDAHULUAN UKDW

KLASIFIKASI PADA TEXT MINING

Analisis Sentimen untuk Komentar pada Sistem Pencarian Kost Menggunakan Metode Support Vector Machine (SVM)

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. Universitas Indonesia. Klasifikasi topik menggunakan..., Dyta Anggraeni

1. Pendahuluan 1.1 Latar Belakang

PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA

Transkripsi:

1 BAB I PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan media sosial menawarkan pengguna kesempatan untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan tidak lagi memiliki kontrol atas konten yang sudah dimuat di dunia maya (Kaplan dan Haenlein, 2010). Pelanggan atau klien yang merasa tidak puas dengan layanan atau produk yang ditawarkan oleh sebuah perusahaan biasanya akan menuliskan keluhannya di media sosial. Di sisi lain, ada juga pelanggan yang merasa puas, yang mengekspresikan sikap positif mereka terhadap sebuah produk di media sosial. Disadari atau tidak, opini-opini pelanggan yang dituliskan di media sosial, sedikit atau pun banyak, akan memberikan pengaruh pada calon pelanggan. Seperti yang kita ketahui, seseorang biasanya akan terlebih dahulu mencari tahu bagaimana tanggapan orang lain mengenai suatu produk tertentu, sebelum akhirnya memutuskan untuk membeli produk tersebut. Oleh sebab itu, penting bagi sebuah perusahaan untuk mengetahui dan memantau bagaimana opini publik terhadap produk yang ditawarkan oleh perusahaan. Dari berbagai opini tersebut, perusahaan dapat mengetahui sentimen dari masyarakat terhadap produk yang ditawarkan. Hal ini akan berguna sebagai salah satu parameter analisis, misalnya untuk memprediksi angka penjualan dan menentukan jumlah produksi. Akan tetapi, memantau dan mengorganisasi opini dari masyarakat juga bukanlah hal yang mudah. Opini yang dimuat di media sosial jumlahnya terlalu banyak untuk diproses secara

2 manual. Oleh sebab itulah, diperlukan sebuah metode atau teknik khusus yang mampu mengkategorikan review-review tersebut secara otomatis, apakah termasuk positif atau negatif, berdasarkan sebuah properti. Analisis sentimen adalah salah satu cabang bidang studi text mining yang mempelajari tentang sentiment, emotion, dan attitude seseorang yang terkandung dalam teks opini. Prinsip dasar dari analisis sentimen adalah melakukan klasifikasi polaritas dari teks yang diberikan dan menentukan apakah opini yang dikemukakan dalam bentuk teks tersebut bernilai positif atau negatif. Seperti yang kita ketahui, indikator yang paling penting dalam menentukan sentiment sebuah teks adalah sentiment words. Sentiment words adalah kata-kata yang umum digunakan untuk mengekspresikan sentiment. Contohnya good, wonderful, dan amazing adalah kata-kata yang biasanya digunakan untuk menyatakan sesuatu yang sifatnya positif, sedangkan bad, poor, dan terrible digunakan untuk menyatakan sesuatu yang sifatnya negatif. Meskipun sentiment words penting dalam menentukan sentiment dari sebuah teks, akan tetapi menggunakan sentiment words saja masih belum cukup. Permasalahannya jauh lebih kompleks. Sentiment words yang sifatnya positif atau negatif bisa saja memiliki orientasi yang berlawanan jika digunakan pada domain yang berbeda. Misalnya kata suck biasanya mengindikasikan sesuatu yang negatif, seperti pada kalimat This camera sucks, akan tetapi kata suck juga dapat mengindikasikan sesuatu yang positif jika digunakan pada domain yang berbeda, misalnya pada kalimat This vacuum cleaner really sucks. Untuk menghindari permasalahan tersebut, pada penelitian ini hanya digunakan satu domain, yaitu sistem

3 operasi Windows Phone. Pemilihan Windows Phone sebagai domain pada penelitian ini didasarkan pada beberapa alasan. Alasan pertama, Windows Phone (WP) adalah sistem operasi untuk perangkat bergerak (mobile device) yang masih terbilang baru jika dibandingkan dengan sistem operasi yang lain. Dengan statusnya sebagai sistem operasi baru tentunya rasa ingin tahu masyarakat akan sistem operasi ini masih tinggi. Alasan yang kedua, pada kuartal ketiga tahun 2013, Gartner melaporkan bahwa WP memegang pangsa pasar dunia sebesar 3.6%, yang mana angka tersebut meningkat sebesar 123% dari periode sebelumnya di tahun 2012 dan melampaui angka pertumbuhan Android (Gralla 2013). Hal ini menunjukkan bahwa antusiasme masyarakat terhadap sistem operasi ini sangatlah tinggi. Dalam analisis sentimen terdapat dua pendekatan yang umum digunakan, yaitu pendekatan berdasarkan kamus (lexicon based) dan pendekatan berdasarkan machine learning. Hasil eksperimen yang dilakukan oleh Pak dan Paroubek (2010) mengungkapkan bahwa machine learning methods, seperti Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) menunjukkan hasil yang baik dalam hal klasifikasi teks. 1.2 Perumusan Masalah Masalah yang dirumuskan berdasarkan penjelasan latar belakang adalah menganalisis unjuk kerja dari penggunaan metode Support Vector Machine (SVM) dalam mengklasifikasikan teks review pengguna sistem operasi Windows Phone.

4 1.3 Batasan Masalah Beberapa batasan yang dilakukan dalam penelitian ini adalah: 1. batasan subyek penelitian, menggunakan kumpulan teks review pengguna sistem operasi Windows Phone yang berbahasa Inggris sebagai dataset, 2. batasan sistem, penelitian menggunakan Weka versi 3.6.10 untuk pengolahan dan analisis data. Metode klasifikasi yang digunakan adalah Support Vector Machine (SVM) dengan kernel polinomial. Metode evaluasi yang digunakan dalam penelitian adalah metode 10 fold cross validation. 1.4 Pertanyaan Penelitian 1. Bagaimana penerapan metode SVM dalam proses klasifikasi teks review? 2. Bagaimana pengaruh penggunaan metode undersampling dan oversampling pada hasil klasifikasi teks review? 3. Apakah penggunaan metode tokenisasi dan algoritme stemmer yang berbeda dapat mempengaruhi proses klasifikasi teks review? 4. Apakah penggunaan metode tokenisasi, algoritme stemmer, dan nilai C yang berbeda berpengaruh pada tingkat akurasi yang diperoleh? 1.5 Tujuan Penelitian Tujuan yang ingin dicapai dari penelitian ini adalah sebagai berikut. 1. Mempelajari penerapan metode klasifikasi SVM (Support Vector Machine) dalam analisis sentimen, khususnya pada teks review pengguna sistem operasi Windows Phone.

5 2. Melakukan analisis performa dan mengetahui tingkat akurasi dari metode SVM (Support Vector Machine) dalam analisis sentimen. 3. Mengetahui efek dari penggunaan metode tokenisasi, algoritme stemmer, dan nilai C yang berbeda terhadap tingkat akurasi yang dihasilkan. 1.6 Manfaat Penelitian Penelitian ini diharapkan dapat menjadi dasar dalam pengembangan aplikasi untuk analisis sentimen. Keberadaan aplikasi untuk analisis sentimen diharapkan dapat memberikan kemudahan dalam proses klasifikasi teks opini, sehingga dapat mempersingkat waktu proses klasifikasi. 1.7 Keaslian Penelitian Penelitian mengenai analisis sentimen telah banyak dilakukan oleh penelitipeneliti sebelumnya dengan menggunakan berbagai macam metode. Support Vector Machine (SVM) dan Naïve Bayes Classifier (NBC) merupakan metode yang paling populer dan paling sering digunakan dalam analisis sentimen. Sejumlah peneliti mengklaim bahwa mereka mendapatkan tingkat akurasi yang lebih baik dengan menggunakan metode SVM. (Pang, dkk, 2002; Pak dan Paroubek, 2010; Saraswati, 2011). Beberapa penelitian mengenai analisis sentimen yang pernah dilakukan sebelumnya dapat diringkas seperti pada Tabel 1.1.

6 Tabel 1.1 Ringkasan Penelitian tentang Analisis Sentimen No. Author Judul Penelitian Hasil / Output Pang menggunakan metode Naïve Bayes Classification (NBC), Maximum Entropy (ME), dan Support Vector Machine (SVM) untuk 1 Pang, dkk. (2002) Thumbs up? Sentiment Classification Using Machine Learning Techniques. mengklasifikasikan review film ke dalam kelas positif dan negatif. Hasil eksperimen Pang menunjukkan metode SVM memiliki tingkat akurasi yang paling tinggi dibanding dengan metode lainnya, yakni sebesar 82,7%. Yang melakukan penelitian mengenai analisis sentimen dengan menggunakan metode SVM dan CRF (Conditional Random Field). Dari penelitian 2 Yang, dkk. (2007) Emotion Classificatin Using Web Blog Corpora tersebut disimpulkan bahwa opini yang terdapat pada kalimat terakhir suatu dokumen, berperan penting untuk menentukan kelas suatu dokumen, apakah dokumen tersebut tergolong positif atau negatif.

7 Tabel 2.1 Ringkasan Penelitian tentang Analisis Sentimen (Lanjutan) Pak dan Paroubek mengungkapkan bahwa Pak dan Twitter as a Corpus for machine learning methods, 3 Paroubek. (2010) Sentiment Analysis and Opinion Mining. seperti Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) menunjukkan hasil yang baik dalam hal klasifikasi teks. Text Mining dengan Metode Saraswati menyatakan bahwa 4 Saraswati. (2011) Naive Bayes Classifier dan Support Vector Machines untuk metode SVM memiliki tingkat akurasi yang lebih tinggi daripada metode NBC untuk Sentiment Analysis pengujian data opini positif. Mierzwa menggunakan metode SVM untuk melakukan klasifikasi terhadap sentimen 5 Mierzwa (2012) Measuring Customer Sentiment on Twitter pelanggan yang dieksperikan melalui Twitter dan memperoleh nilai presisi sebesar 82% untuk kelas objektif, 59% untuk kelas positif, dan 54% untuk kelas negatif. Sebagian besar dari penelitian-penelitian di atas menunjukkan bahwa penggunaan metode SVM dalam analisis sentimen menunjukkan hasil yang baik. Oleh sebab itu, penelitian ini menggunakan metode SVM untuk menentukan kategori dari teks review, apakah review tersebut bernilai positif atau negatif.

8 1.8 Sistematika Penulisan BAB I : PENDAHULUAN Bab ini menjelaskan latar belakang, rumusan masalah, batasan, tujuan, manfaat, dan keaslian dari penelitian yang dilakukan. BAB II : TINJAUAN PUSTAKA DAN DASAR TEORI Bab ini menjelaskan mengenai teori-teori dan penelitian-penelitian terdahulu yang digunakan sebagai acuan dan dasar dalam penelitian. BAB III : METODE PENELITIAN Bab ini menjelaskan mengenai metode yang digunakan dalam penelitian meliputi langkah kerja, alat dan bahan, serta alur penelitian. BAB IV : HASIL DAN PEMBAHASAN Bab ini memaparkan hasil penelitian beserta dengan pembahasannya. BAB V : KESIMPULAN DAN SARAN Bab ini berisikan kesimpulan akhir dari penelitian yang dilakukan dan juga saran untuk perkembangan penelitian lebih lanjut.