ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE

dokumen-dokumen yang mirip
BAB II TINJAUAN PUSTAKA

ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES

BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS SENTIMEN DATA KRITIK DAN SARAN PELATIHAN APLIKASI TEKNOLOGI INFORMASI (PATI) MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

BAB I PENDAHULUAN. 1.1 Latar Belakang

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM

BAB III METODE PENELITIAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES

1. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN.

BAB I PENDAHULUAN 1.1 Latar Belakang

Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I. Pendahuluan. 1. Latar Belakang Masalah

ANALISIS SENTIMEN DAN KLASIFIKASI KATEGORI TERHADAP TOKOH PUBLIK PADA TWITTER

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( )

BAB I PENDAHULUAN Latar Belakang

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

BAB I PENDAHULUAN Latar Belakang

ABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODELOGI PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN

ANALISIS SENTIMEN PENGGUNA TWITTER MENGGUNAKAN METODE SUPPORT VECTOR MACHINE BERBASIS CLOUD COMPUTING

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB 1 PENDAHULUAN 1.1 Latar Belakang

ANALISIS SENTIMEN PUBLIK PADA MEDIA SOSIAL TWITTER TERHADAP PELAKSANAAN PILKADA SERENTAK MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I.PENDAHULUAN Latar Belakang Masalah Perumusan Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

BAB III METODOLOGI PENELITIAN

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Pemilihan presiden merupakan momen penting bagi setiap negara, salah satunya

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

SISTEM ANALISIS SENTIMEN POSITIF DAN NEGATIF MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES PADA KASUS TOKOH PUBLIK CAPRES INDONESIA 2014

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA

BAB I PENDAHULUAN. banyak informasi yang tersedia di internet, maka akan semakin sulit juga untuk

MULTINOMIAL NAÏVE BAYES CLASSIFIER UNTUK MENENTUKAN REVIEW POSITIF ATAU NEGATIF PELANGGAN WEBSITE PENJUALAN

TEXT MINING DALAM ANALISIS SENTIMEN ASURANSI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

Klasifikasi Akun Prostitusi Berdasarkan Skoring Tweet

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan

Agus Soepriadi, 2 Meta Permata. Jurusan Teknik Informatika, STMIK Bandung, Bandung, Indonesia

BAB IV HASIL DAN PEMBAHASAN

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN I-1

JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG

ANALISA SENTIMEN MENGGUNAKAN NAÏVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP KENAIKAN HARGA JUAL ROKOK PADA MEDIA SOSIAL TWITTER

SENTIPOL: Dataset Sentimen Komentar Pada Kampanye PEMILU Presiden Indonesia 2014 Dari Facebook Page

JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER

IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA

Analisis Sentimen Twitter untuk Teks Berbahasa Indonesia dengan Maximum Entropy dan Support Vector Machine

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes

IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang,

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN 1.1. Latar Belakang

3.1 Desain Penelitian

KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR

BAB II LANDASAN TEORI

ISSN: Akhmad Pandhu Wijaya 1, Heru Agus Santoso 2

Transkripsi:

DRAFT JURNAL ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE SENTIMENT ANALYSIS FOR TWITTER ABOUT ONLINE INDONESIAN TRANSPORTATION WITH SUPPORT VECTOR MACHINE Nabila Safina¹, Aris Marjuni² Universitas Dian Nuswantoro Semarang Jurusan Teknik Informatika, FIK UDINUS, Semarang Email:111201307743@mhs.dinus.ac.id¹,aris.marjuni@dsn.dinus.ac.id² Abstrak Transportasi online di Indonesia kini menjadi fenomena,kemudahan yang ditawarkan oleh transportasi membuat banyak masyarakat yang menggunakan jasa transportasi online. Melalui media sosial twitter pada masing masing akun transportasi online, masyarakat dapat memberikan respon terhadap jasa transportasi online yang dapat dibuat sebagai analisis sentimen tentang respon masyarakat terhadap jasa transportasi online. Respon masyarakat di twitter tersebut diklasifikasikan menjadi 2 kelas tweet tingkat dasar yaitu positif dan negatif. Data dikumpulkan dari twitter dengan tweet sebanyak 1000. Pemberian label tidak dilakukan secara manual tetapi menggunakan metode clustering yang membagi 1000 data kedalam dua kelompok. Cluster 1 sebagai kelompok tweet positif dan Cluster 2 sebagai kelompok tweet negatif. 900 untuk data pelatihan dan 100 untuk data pengujian. Tahap pre-processing pada data meliputi tokenisasi, casenormalization, deteksi stop word, dan stemming. Proses klasifikasi menggunakanmetode Support Vector Machine (SVM). Akurasi SVM menunjukkan hasil yaitu 87%. Kata kunci : : Analisis Sentimen, Trasportasi Online,Twitter, K Means,SVM. Abstract Online Transportation in Indonesia has now become a phenomenon, the convenience offered by transportation makes a lot of people who use online transportation services. Through social media twitter on each online transport account, people can respond to online transport services that can be made as an analysis of sentiments about the response of the community to online transport services. The public response on twitter is classified into 2 classes of basic level tweets that are positive and negative. Data is collected from twitter with a tweet of 1000. Labeling is not done manually but using clustering method that divides 1000

data into two groups. Cluster 1 as a positive tweet group and Cluster 2 as a negative tweet group. 900 for training data and 100 for testing data. Pre-processing stages in the data include tokenization, case normalization, stop word detection, and stemming. The classification process uses the Support Vector Machine (SVM) method. SVM accuracy showed 87%. Key words: Sentiment analysis,twitter, Online transportation,k Means, SVM. 1. PENDAHULUAN Transportasi merupakan penunjang kehidupan manusia dan sangat erat hubungannya dengan kemacetan terutama untuk daerah daerah perkotaan besar di Indonesia, solusi dari kemacetan salah satunya adalah penggunaan angkutan umum, jika berhasil membuat pengguna kendaraan pribadi beralih ke transportasi umum akan mengurangi jumlah kendaraan di jalan yang tentunya akan mengurangi kemacetan. Namun kebanyakan masyarakat masih enggan menggunakan transportasi umum dan lebih memilih menggunakan kendaraan pribadi dikarenakan beberapa alasan seperti fasilitas dan sarana yang tidak memadai dan lamanya waktu tempuh. [1]. Sebagai solusinya kendaraan-kendaraan pribadi tersebut dapat dijadikan sebagai fasilitas transportasi umum berfungsi sebagai transportasi alternatif lain yang dapat menjawab kegagalan pelayanan angkutan umum[2]. Dengan mendaftarkan diri sebagai driver transportasi online baik kendaraan pribadi roda dua maupun roda empat, kendaraan pribadi tersebut mampu bermanfaat sebagaimananya angkutan umum yang bisa di order oleh masyarakat, memanfaatkan akses teknologi smartphone. Selain itu aplikasi transportasi online ini tidak hanya dijadikan alat transportasi untuk masyarakat tapi juga bisa sebagai jasa pengirim barang dan delivery makanan. Fenomena transportasi online ini menjadi cepat populer karena menawarkan inovasi-inovasi terbaru mengenai transportasi yang digabungkan dengan teknologi komunikasi secara online sehingga memberikan kemudahan bagi masyarakat untuk memesan transportasi ojek dimana saja dan kapan saja[3] Dengan fenomena transportasi online tersebutpara pengguna banyak memberikan berbagai macam pendapat baik itu pujian maupun keluhan diberbagai media sosial, salah satunya twitter. Twitter merupakan salah satu situs media sosial yang cukup populer di indonesia dalam menyampaikan suatu keluh kesah didalam dunia maya, terbukti dengan data yang terkumpul oleh situs A World of Tweets Dot Com sejak November 2010 berjumlah 383 juta profil pengguna twitter dan data tersebut menempatkan Indonesia sebagai negara ketiga terbanyak di dunia dalam kepopuleran twitter [4]. Dengan ketenaran twitter tersebut maka tidak heran banyak orang yang memberikan pendapatnya tentang berbagai hal termasuk pendapat pengguna ojek online dalam pelayanan jasa transportasi online dan twitter juga berfokus pada pengembangan pendekatan analisis sentimen yang dirancang khusus untuk tweet. Analisis sentimen adalah proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang terkandung dalam suatu kalimat opini baik yang bersifat positif, negatif maupun netral[5]. Bidang penelitian analisis sentimen cukup popular, dikarenakan memberikan keuntungan untuk berbagai aspek, mulai dari

politik, prediksi penjualan dan pengambilan keputusan para investor dan juga dalam kasus ini yaitu bidang bisnis online[6]. Penelitian mengenai analisis sentimen pada twitter mengenai jasa transportasi online (ojek online) tersebut sudah pernah dilakukan dengan menggunakan metode Naive Bayes yang dengan akurasi yang dihasilkan sebesar 80% berdasarkan 800 data tweet yang terdiri atas 300 data latih dan 500 data uji. Terdapat kesalahan pada data uji fitur yang muncul tidak sesuai dengan klasifikasinya. Akurasi klasifikasi dapat ditingkatkan dengan menambah jumlah data latih[7]. Metode svm digunakan untuk mengklasifikasikan data opini yang termasuk ke dalam kelas bersentimen positif atau negatif[1]. Dikarenakan banyak penelitian mengenai metode svm yang lebih unggul dari Naive bayes diantaranya analisis sentiment telah banyak dilakukan yaitu Penelitian sebelumnya yaitu dengan judul Perbandingan Teknik SVM Vs Naif-Bayes untuk Analisis Sentimen Dan Klasifikasi Kategori Terhadap Tokoh Publik Pada Twitter.. Metode klasifikasi yang digunakan dalam penelitian ini adalah Naive Bayes Classifier dan dikombinasikan dengan term frequency serta TF-IDF. Klasifikasi sentimen terdiri dari positif dan negatif sedangkan klasifikasi kategori terdiri dari kapabilitas, integritas, dan akseptabilitas. Hasil pengujian Klasifikasi dengan tools RapidMiner metode Naive Bayes dan fitur term frequency diperoleh sebesar 73,81% sedangkan dengan fitur TF- IDF diperoleh sebesar 71.11%. Klasifikasi dengan Support Vector Machine menghasilkan akurasi 83,14% untuk fitur term frequency dan 82,69% untuk fitur TF-IDF. Metode Support Vector Machine menghasilkan akurasi performansi yang lebih baik daripada metode Naive Bayes baik dalam klasifikasi sentimen maupun dalam klasifikasi kategori [8]. Penelitian lainnya tentang perbandingan metode svm dan naive bayes mengenai analisis sentimen wacana politik media masa online. Menghasilkan akurasi NB menghasilkan rata-rata akurasi sebesar 59,98 % dan nilai tertinggi akurasi sebesar SVM 90,50%[9]. 2. METODE PENELITIAN

1. Crawling data : Mengambil data dari twitter(internet) dengan bahasa R melalui akun twitter @gojekindonesia dan @grabid 2. Melakukan proses preprocessing dengan tahap tahap: Formalization: mengubah kata informal menjadi formal, mengahapus #, @, jam, angka yang berdiri sendiri, merubah emoji Stopword Remover : Menghilangkan kata sambung, kata depan, kata kata yang tidak memiliki makna Stemming: Merubah kata menjadi kata dasar Sentiment scoring : Memberikan bobot berdasarkan kamus positif dan negatif. 3. Melakukan kluster dengan memperhatikan pembobotan sentiment scoring dengan metode K-Means 4. Proses Klasifikasi menggunakan LibSVM 3. HASIL DAN PEMBAHASAN Dengan menggunakan 1000 data yang diambil dari twitter melalui mention akun @gojekindonesia @GrabID. Peneliti melabeli dengan metode clustering menggunakan algoritma k-means, dimana terdiri kelompok positif dan kelompok negatif. Kumpulan kata positif dan kumpulan kata negatif yang digunakan sebagai rumus untuk menghitung jumlah kata positif dan kata negatif yang terdapat di tiap tweet. 1000 tweet tersebut akan dibagi menjadi 2 bagian yaitu data pelatihan sebesar 90% atau berjumlah 900 dan data pengujian sebesar 10% atau berjumlah 100. Pada data pengujian

mengahsilkan 450 kalimat positif dan 450 kalimat negatif dan pada data pelatihan menghasilkan 50 kalimat positif dan 50 kalimat negatif. Dan menghasilkan akurasi, presisi, recall, F-Measure sebagai berikut: A B Label 4 3 7 A = C1(positif) 6 44 B = C2(negatif)

Kelas tweet Presisi (%) Recall (%) F-Measure (%) Positif 87,8 86 87 Negatif 86 88 87 4. KESIMPULAN Berdasarkan penelitian yang diuraikan dalam skripsi ini, data berasal dari twitter dengan kata kunci mention dari akun @gojekindonesia dan @GrabID berjumlah 1000 data 900 data pelatihan dan 100 data pengujian. Proses diawali dengan pre-processing, proses selanjutnya dilakukan proses pemberian label dengan metode clustering yaitu membagi data kedalam dua kelompok. Cluster 1 sebagai kelompok data berlabel positif dan Cluster 2 sebagai kelompok data berlabel negatif. Klasifikasi dilakukan dengan metode SVM menggunakan LibSVM. Penulis menyimpulkan bahwa klasifikasi tweet tentang transportasi online yaitu 87%. 6. 5. SARAN Data yang digunakan dalam penelitian ini diambil dengan proses crawling melalui akun @gojekindonesia dan @grabid. Peneliti selanjutnya diharapkan bisa mengambil data secara realtime. Penelitian selanjutnya juga kedepannya dapat menggunakan metode lain untuk pelabelan data agar tidak melakukan pelabelan secara manual.proses preprocessing dalam penelitian ini masih belum sempurna dalam penyaringan kata.

7. DAFTAR PUSTAKA [1] A. Novantirani et al., Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine, pp. 1 7. [2] F. D. Amajida, KREATIVITAS DIGITAL DALAM MASYARAKAT RISIKO PERKOTAAN : STUDI TENTANG OJEK ONLINE GO-JEK DI JAKARTA, 2014. [3] M. Arisanty, ANALISIS PENERAPAN TEKNOLOGI KOMUNIKASI TEPAT GUNA PADA, vol. 2, pp. 712 729, 2016. [4] F. Ugm and F. Ugm, Analisis Sentimen Twitter untuk Teks Berbahasa Indonesia dengan Maximum Entropy dan Support Vector Machine, vol. 8, no. 1, pp. 91 100, 2014. [5] I. F. Rozi, S. Hadi, and E. Achmad, Implementasi Opinion Mining ( Analisis Sentimen ) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi, vol. 6, no. 1, pp. 37 43, 2012. [6] V. Chandani, F. I. Komputer, and U. D. Nuswantoro, Komparasi Algoritma Klasifikasi Machine Learning Dan Feature Selection pada Analisis Sentimen Review Film, vol. 1, no. 1, pp. 56 60, 2015. [7] O. Online, Analisis Sentimen pada Jasa Ojek Online... (Nugroho dkk.), pp. 156 161, 2015. [8] A. F. Hidayatullah et al., Analisis sentimen dan klasifikasi kategori terhadap tokoh publik pada twitter, vol. 2014, no. semnasif, pp. 115 122, 2014. [9] T. Mining, MEDIA MASA ONLINE MENGGUNAKAN ALGORITMA, vol. 1, no. 1, pp. 1 7, 2015. [10] Y. T. Arifin, KOMPARASI FITUR SELEKSI PADA ALGORITMA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN REVIEW, vol. 3, no. September, pp. 191 199, 2016. [11] E. Kontopoulos, C. Berberidis, T. Dergiades, and N. Bassiliades, Expert Systems with Applications Ontology-based sentiment analysis of twitter posts, vol. 40, pp. 4065 4067, 2013. [12] C. Chang and C. Lin, LIBSVM : A Library for Support Vector Machines, pp. 1 39, 2013.