Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

dokumen-dokumen yang mirip
BAB 3 ANALISIS MASALAH DAN PERANCANGAN

3.1 Desain Penelitian

BAB I PENDAHULUAN. Perkembangan teknologi informasi yang semakin meningkat memberi

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( )

JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER

SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISA SENTIMEN MENGGUNAKAN NAÏVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP KENAIKAN HARGA JUAL ROKOK PADA MEDIA SOSIAL TWITTER

JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG

BAB III METODOLOGI PENELITIAN

Oleh: ARIF DARMAWAN NIM

BAB III ANALISIS DAN DESAIN SISTEM

BAB III ANALISIS DAN PERANCANGAN

BAB III METODE PENELITIAN. Penelitian ini dilakukan di Jurusan Ilmu Komputer Fakultas Matematika Dan Ilmu

Jurnal Informatika Mulawarman Vol. 10 No. 1 Februari

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES

BAB III METODELOGI PENELITIAN

BAB I PENDAHULUAN. informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentimen

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang,

Implementasi Algoritma Jaro-Winkler Distance Untuk Sistem Pendeteksi Plagiarisme Pada Dokumen Skripsi

BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS SENTIMEN PADA SOSIAL MEDIA TWITTER TERHADAP POLITIK DI INDONESIA MENGGUNAKAN TEXT MINING DENGAN METODE NAIVE BAYES CLASSIFIER

PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA

BAB III METODOLOGI PENELITIAN

BAB II LANDASAN TEORI

BAB I PENDAHULUAN.

BAB IV HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN 1.1 Latar Belakang

METODE PENELITIAN. penelitian adalah pada Semester Genap Tahun Akademik mendukung dan menunjang pelaksanaan penelitian.

BAB III METODE PENELITIAN. penelitian adalah pada semester Genap Tahun Pelajaran

BAB III METODOLOGI PENELITIAN

ANALISIS DAN DESAIN SISTEM

BAB 3 LANDASAN TEORI

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP

BAB III ANALISIS DAN PERANCANGAN SISTEM

EKSTRAKSI DATA GEO-SPATIAL TWITTER (STUDI KASUS: BADAN PENYELENGGARA JAMINAN SOSIAL KESEHATAN )

BAB I PENDAHULUAN. Peminatan atau bidang peminatan adalah sebuah jurusan yang harus di

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 3. METODOLOGI PENELITIAN

BAB I PENDAHULUAN 1.1. Latar Belakang

Text Pre-Processing. M. Ali Fauzi

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

ARTIKEL KLASIFIKASI KONTEN BERITA SURAT KABAR BERDASARKAN JUDUL DENGAN TEXT MINING MENGGUNAKAN METODE NAÏVE BAYES (STUDI KASUS : RADAR KEDIRI)

SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER

Agus Soepriadi, 2 Meta Permata. Jurusan Teknik Informatika, STMIK Bandung, Bandung, Indonesia

BAB III METODOLOGI PENELITIAN. Berikut tahapan penelitian yang dilakukan: 1. Menentukan kebutuhan data yang akan digunakan.

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak

APLIKASI SISTEM INFORMASI PENGOLAHAN DATA PADA DIREKTORAT RESERSE KRIMINAL KHUSUS POLDA SUMBAR

ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS SPAM DENGAN MENGGUNAKAN NAÏVE BAYES

BAB I PENDAHULUAN Latar Belakang

BAB II LANDASAN TEORI

BAB III ANALISA DAN PERANCANGAN

Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram

BAB III METODOLOGI PENELITIAN

ABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA

BAB III METODOLOGI PENELITIAN

BAB IV HASIL DAN UJI COBA

BAB I PENDAHULUAN 1.1 Latar Belakang

HERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT.

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

3.2. Analisa Masalah 3-1.

@UKDW BAB 1 PENDAHULUAN

BAB III METODOLOGI PENELITIAN

BAB V Model Perancangan dan Implementasi Perangkat Lunak

BAB III ANALISIS DAN PERANCANGAN

BAB I PENDAHULUAN Latar Belakang

BAB III ANALISA DAN PERANCANGAN SISTEM. Pada bab ini akan dibahas mengenai analisa dan perancangan dari sistem.

PENENTUAN POLA ALUMNI DARI DATA TWITTER DENGAN MENGGUNAKAN NAÏVE BAYES (Studi Kasus : Penanganan Alumni di Program Studi Teknik Informatika)

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor

KLASIFIKASI ARTIKEL BERITA MENGGUNAKAN METODE TEXT MINING DAN NAIVE BAYES CLASSIFIER

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

Transkripsi:

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma 2) Dosen Ilmu Komputer 3) Dosen Ilmu Komputer. Jl Jend A.Yani No.12 Plaju, Palembang 30264 Email: eka.retnawiyati@gmail.com 1) fatoni@binadarma.ac.id 2), edisuryanegara@binadarma.ac.id 3) Abstrak. Perkembangan teknologi informasi yang semakin meningkat memberi dampak pada pertukaran informasi dan komunikasi yang semakin mudah. Hal ini ditandai dengan munculnya media sosial seperti Twitter, Facebook, Yahoo, Google, Youtube, Instagram, Path. Pertumbuhan media sosial ini juga mendorong adanya informasi tekstual yang besar sehingga muncul kebutuhan penyajian data yang memudahkan pengguna mendapatkan informasi yang cepat dan akurat. Pengguna twitter yang semakin meningkat ini terlihat dari jutaan tweets yang di posting setiap harinya dengan berbagai topik yang berbeda. Data tweets dapat berupa persepsi publik baik politik, ekonomi, perilaku sosial, fenomena alam serta perdagangan yang terjadi diseluruh dunia. Data yang besar tersebut bisa dijadikan sebagai objek penelitan. Penelitan ini mencoba melakukan analisis sentimen data dengan mengklasifikasi data twitter berbahasa Indonesia pada suatu produk. Data tersebut akan diproses dengan text mining untuk menghindari data yang kurang sempurna kemudian data tweet diklasifikasi menjadi klasifikasi positif, negatif, dan netral. Klasifikasi ini menggunakan algoritma Naïve Bayes Classifier. 1. Pendahuluan 1.1. Latar Belakang Perkembangan teknologi informasi yang semakin meningkat memberi dampak pada pertukaran informasi dan komunikasi yang semakin mudah. Hal ini ditandai dengan dengan munculnya media sosial seperti Twitter, Facebook, Yahoo, Google, Youtube, Instagram, Path. Pertumbuhan media sosial ini juga mendorng adanya informasi tekstual yang besar sehingga muncul kebutuhan penyajian data yang memudahkan pengguna mendapatkan informasi yang akurat. Media sosial twitter merupakan salah satu media komunikasi populer saat ini. Hal ini terlihat dari peningkatan pengguna twitter yang tercatat di seluruh dunia. Berdasarkan data yang dirilis infografis (tahun 2014-2015) Twitter memiliki 302 juta pengguna aktif yang 80 persennya berasal dari perangkat mobile. Dari angka itu, 37 persen pengguna Twitter berusia 18-29 tahun, sedangkan 25 persen lainnya berada di rentan usia 30-49 tahun[2]. Dengan jumlah pengguna aktif sebanyak itu, Twitter

menerima kicauan sebanyak 500 juta setiap harinya. Sebanyak 68 persen berupa kicauan balasan, 26 persen berupa kicauan, dan 6 persen adalah kicauan ulang [2]. Pengguna twitter yang semakin meningkat ini terlihat dari jutaan tweets yang di posting setiap harinya dengan berbagai topik yang berbeda. Data tweets ini dapat berupa persepsi publik baik ekonomi, perilaku sosial, fenomena alam, perdagangan yang terjadi diseluruh dunia [1]. Hasil penelitian mengenai peristiwa jatuhnya pesawat AirAsia QZ8501 yang terjadi tanggal 28 Desember 2014 di Selat Karimata memperlihatkan dari negara mana saja yang ikut mengamati peristiwa jatuhnya pesawat tersebut berdasarkan bahasa yang digunakan pada saat mengunggah tweets, mengidentifikasi tipe pengguna twitter, rentang usia pengguna serta jenis kelamin [1]. Berdasarkan penelitian yang telah ada sebelumnya, penelitan ini mencoba melakukan analisis sentimen data dengan mengklasifikasi data twitter berbahasa Indonesia pada suatu produk. Data tersebut akan diproses dengan text mining untuk menghindari data yang kurang sempurna kemudian mengklasifikasi data tweet ke dalam tiga klasifikasi yaitu klasifikasi positif, negatif, netral. Klasifikasi ini menggunakan algoritma Naïve Bayes Classifier. adapun rumusan permasalahan dalam penelitian ini Bagaimana Menganalisis dan mengklasifikasi Sentimen Pada Data Twitter Menggunakan Text Mining terhadap Suatu Produk.? 2. Analisa dan Perancangan 2.1 Analisis Sistem Analisis sistem yang digunakan untuk menyelesaikan masalah pada penelitan ini terdiri dari beberapa langkah langkah yaitu: 1. Analisis masalah 2. Pengumpulan data 3. Proses Text Mining 4. Penerapan metode Klasifikasi naïve Bayes Classifier 2.1.1. Analisis Masalah Informasi yang terkandung dalam tweets dapat digunakan sebagai nilai jual bagi pelaku usaha. Salah satu contoh perusahaan yang ingin mengetahui nilai jual produknya laku dipasaran atau tidak. Kita sebut saja perusahan yang memproduksi kosmetik seperti lipstick wardah, sabun cuci seperti Rinso. Perusahaan ini akan mencari opini dari pengguna produk tersebut apakah produknya di nilai positif atau negatif. Hal ini dilakukan untuk mengambil langkah strategis agar produknya tetap diminati masyarakat. Penilaian produk pada suatu perusahaan disebut dengan analisis sentimen. Analisis sentiment yang ada sekarang dilakukan secara manual. Oleh karena itu untuk mendapatkan nilai sentiment secara otomatis dari suatu produk tersebut memiliki tantangan. Tantangan berupa teks yang tidak formal yang digunakan oleh pengguna twitter dalam mengeluarkan opini. Untuk itu dari penelitian ini menggunakan proses text mining yang di dalamnya terdapat tahapan preprocessing dan Ekstraksi fitur serta naïve bayes classifier sebagai metode klasifikasi nilai sentimen apakah opini bernilai positif atau negatif.

2.1.2. Pengumpulan Data Pada penelitian ini pengumpulan data dimulai dengan penarikan data tweet dari server twitter yang kemudian disimpan kedalam MongoDB. Penarikan data tweet dilakukan dengan menggunakan fasilitas Application Programming Interface (API). API adalah fasilitas yang telah disediakan oleh twitter. Application Programming Interface (API) ini mengambil data kotor tweet dari server twitter, yang selanjutnya akan dipilih menjadi data tweet bersih. Data tweet ini akan disimpan di dalam database MongoDB. Berikut adalah gambar proses pengumpulan data : Penarikan Data tweet dengan API Server twitter Simpan di MongoDB Gambar 1. Proses pengumpulan data tweet 2.1.3. Proses Text Mining Pada proses text mining membutuhkan 2 (dua) tahapan yaitu : 1. Preprocessing ini dilakukan untuk menghindari data yang kurang sempurna, gangguan pada data, dan data-data yang tidak konsisten[3] Tahapan pada text preprocessing yang dilakukan adalah: a. Melakukan Cleaning menghilangkan kata yang tidak diperlukan agar dokumen bersih. b. Case folding dengan mengubah semua huruf dalam dokumen menjadi huruf kecil. Hanya huruf a sampai dengan z yang diterima. Karakter selain huruf dihilangkan dan dianggap delimiter[4]. c. Tahap tokenizing / parsing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. d. Filtering adalah tahap mengambil kata-kata penting dari hasil token. Bisa menggunakan algoritma stoplist (membuang kata yang kurang penting) atau wordlist (menyimpan kata penting). Stoplist/stopword adalah kata-kata yang tidak deskriptif yang dapat dibuang dalam pendekatan bag-of-words. Contoh stopwords adalah yang, dan, di, dari, dan seterusnya[4]. e. Ekstraksi Fitur 2.1.4. Metode Klasifikasi Klasifikasi pada penelitian ini menggunakan Naïve Bayes Classifier.Pada tahapan ini akan dilakukan klasifikasi dengan menggunakan algoritma naïve bayes classiefier. Algoritma ini akan menghitung nilai sentimen positif, negatif atau netral. 2.2. Perancangan Pada analisis sentimen ini terdiri dari 1 aktor yaitu pengguna twitter. Berikut gambaran diagram use case dari analisis sentiment data twitter :

Gambar 2. diagram Use Case Gambar di atas menunjukkan alur kerja analisis sentiment penelitian ini dengan penjelasan sebagai berikut : Halaman Utama : merupakan proses untuk masuk ke tahapan selanjutnya. Tokenizing : merupakan proses yang terdiri dari praproses yang didalamnya ada cleaning dan case folding untuk membersihkan data tweet. Data tweet bersih akan dikategorikan secara manual sebagai data latih yang selanjutnya disimpan di MongoDb. Klasifikasi : merupakan proses pengklasifikasian twitter dengan data tweet yang belum diketahui kategorinya dimana proses ini melewati tahapan preprocessing dan proses naïve bayes classifier sehingga menghasilkan kategori sentimen positif, negatif ataupun netral. 3. Hasil dan Pembahasan 3.1. Hasil 3.1.1. Implementasi sistem Setelah dilakukan analisa dan perancangan sistem maka akan dilakukan implementasi sistem analisa sentiment data twitter dengan menggunakan text mining pada suatu produk. Adapun spesifikasi perangkat keras dan lunak yang digunakan untuk mendukung penelitian ini adalah sebagai berikut : 1. Satu unit laptop dengan spesifikasi sebagai berikut : Prosesor Core i5 3337U 1.8 GHz, 14 HD Color Shine, RAM 4 GB DDR3, Harddisk 500 GB, VGA Nvidia Geforce GT720M 2 GB, DVDRW, Wi-Fi, OS Windows 7. 2. Software yang digunakan adalah sebagai berikut : NetBeans IDE 7.4, Mongo DB, Java. Seteleh Aplikasi dijalankan akan tampil Halaman beranda yang berisi menu pilihan untuk masuk ke form tokenizing dan form klasifikasi. 3.1.2. Pengujian Pada tahap pngujian sistem akan mencari nilai klasifikasi terhadap data tweet secara otomatis. Nilai yang diperoleh berupa sentimen positif, sentiment negative atau netral pada setiap tweet yang ditampilkan. Pengujian ini menggunakan form klasifikasi dengan cara memasukkan trend dan jumlah data yang akan di analisa. Sebagai sampel data uji akan menggunakan produk makanan yaitu : tekwan dengan

jumlah 100 tweet. Berikut tampilan hasil cari trend mengenai tekwan sebelum dianalisa pada gambar 3 : Gambar 3. Tampilan hasil mencari tweet Setelah dapat 100 tweet kita klik tombol analisa untuk mencari nilai dari setiap tweet dengan tampilan hasil sebagai berikut : 4. Kesimpulan Dan Saran Gambar 4. Tampilan hasil klasifikasi tweet 4.1. Kesimpulan Dari hasil penelitian terhadap analisis sentimen data twitter dengan menggunakan text mining pada suatu produk dapat disimpulkan sebagai berikut : 1. Algoritma Naïve Bayes sebagai algoritma untuk mencari nilai probabilitas dari setiap tweet yang di analisa.

2. Dari hasil uji analisis sentimen pada data twitter didapat tweet dengan tiga kategori yaitu kategori positif, negatif dan netral. 3. Analisis sentiment dengan menggunakan text mining yang didalamnya terdapat tahapan preprocessing dan ekstraksi fitur untuk menghasilkan tweet kotor menjadi tweet bersih. 4. Semakin banyak data latih atau data yang ditoken saat training maka nilai sentimen yang didapat akan semakin akurat. 5. Penelitian ini bisa digunakan untuk mencari minat masyarakat terhadap suatu produk. Referensi 1. Cahyanti, O.D., Saksono, P.H., Suryayusra, Negara, E.S., Social Media Analytics Pemanfaatan Data Media Sosial Untuk Penelitian, Palembang (2015). 2. Grafelly, Delvit Bagaimana perkembangan Twitter saat ini?. Diakses 10 Desember 2015, dari http://www.techno.id/social/bagaimana-perkembangan-twitter-saat-ini-1509122.html. 3. Hemalatha, I., Varma, P.G., dan Govardhan, A., 2012, Preprocessing the Informal Text for Efficient Sentiment Analysis, International Journal of Emerging Trends & Technology in Computer Science (IJETTCS), Vol.1, July August 2012, ISSN 2278-6856 4. Triawati, Chandra, Metode Pembobotan Statistical Concept Based untuk Klastering dan Kategorisasi Dokumen Berbahasa Indonesia, Institut Teknologi Telkom, Bandung (2009).