2016 SISTEM PRED IKSI SPAM ACCOUNT PAD A MED IA SOSIAL TWITTER D ENGAN MENGGUNAKAN ALGORITMA C4.5

dokumen-dokumen yang mirip
DAFTAR ISI. PERNYATAAN... Error! Bookmark not defined. KATA PENGANTAR... Error! Bookmark not defined.

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. komputer ataupun perangkat mobile mereka dari manapun dan kapanpun. Setelah

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

UNTUK TOPIC DETECTION AND TRACKING PADA MICROBLOG TWITTER

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang. Mikroblog adalah salah satu bentuk blog yang memungkinkan

BAB I PENDAHULUAN. yang digunakan dalam melakukan pertukaran pesan melalui perangkat mobile. pesan pendek Non-Teks (Katankar and Thakare, 2010).

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Manusia sebagai makhluk sosial mempunyai kebutuhan yang paling dasar

BAB II LANDASAN TEORI

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

Panduan Singkat Twitter

PROPOSAL TUGAS BESAR KECERDASAN BUATAN MENDETEKSI SPAMMING

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB 1 PENDAHULUAN 1.1 Latar Belakang

Tre n S e r a n g a n di Media S o s i a l

BAB I PENDAHULUAN. memungkinkan penggunanya untuk membuat profil, melihat daftar

BAB 3 LANDASAN TEORI

AdWords. Kebijakan Situs Panduan untuk Pemula

BAB I PENDAHULUAN. menjalar keseluruh dunia. Rata-rata masyarakat modern, seperti orang-orang yang

BAB I PENDAHULUAN 1.1. Latar Belakang Rendy, 2013

BAB III METODE PENELITIAN

BAB I PENDAHULUAN. manusia tidak pernah terlepas dari suatu proses komunikasi. Sejarah komunikasi

BAB I PENDAHULUAN Latar Belakang Penelitian. Dari tahun ke tahun penggunaan internet semakin penting dan menjadi

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Pemilihan presiden merupakan momen penting bagi setiap negara, salah satunya

2016 PREDIKSI TINGKAT KEMATANGAN EMOSIONAL SESEORANG MELALUI AKTIVITAS DI MEDIA SOSIAL TWITTER MENGGUNAKAN ALGORITMA C4.5

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

Modul Praktikum Media Pembelajaran Menggunakan Wordpress

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

Anda dapat mengirimkan video.

BAB I PENDAHULUAN. 1.1 Latar Belakang Penelitian

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

MODUL 12 Model Prediktif

BAB I PENDAHULUAN. 1.1 Latar Belakang

SENTIPOL: Dataset Sentimen Komentar Pada Kampanye PEMILU Presiden Indonesia 2014 Dari Facebook Page

Menu Dasbor Beranda berfungsi sebagai navigasi ke halaman utama admin

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. Dijelaskan oleh Enda Nasution pengertian dari kata media pada social media

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 LATAR BELAKANG PENELITIAN

BAB II TINJAUAN PUSTAKA

UPAYA MEMINIMALISASI PADA LAYANAN LAPAN BANDUNG

BAB I PENDAHULUAN I-1

BAB I PENDAHULUAN. Universitas Sumatera Utara. 1 Universitas Sumatera Utara

BAB I PENDAHULUAN. dipakai masyarakat umum adalah electronic mail ( ). Pada akhir tahun 1990,

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah. Informasi merupakan kebutuhan yang sangat penting dalam era

Materi Sim Dig KD 3.2. Menerapkan Komunikasi Daring (3. Kewargaan Digital (Digital Citizenship)

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis

DAMPAK NEGATIF dan POSITIF SOCIAL NETWORKING

BAB II TINJAUAN PUSTAKA

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan

Kegiatan Pengabdian Kepada Masyarakat LPPM STT Ibnu Sina Batam :

MANUAL PENGGUNAAN JTWITTER

BAB I PENDAHULUAN. Bisnis online dan perkembangan dunia online memang sudah sangat pesat

BAB 1 PENDAHULUAN. namun juga di negara berkembang salah satunya Indonesia. internet. Internet (singkatan dari interconnected networking)

BAB I PENDAHULUAN 1.1. Latar Belakang

Aturan. Kunjungi: safety.twitter.com Twitter

BAB II TINJAUAN PUSTAKA

Twitter for BlackBerry Smartphones. Versi: 5.0. Panduan Pengguna

2015 HUBUNGAN KETERAMPILAN SOSIAL D ENGAN INTENSITAS PENGGUNAAN TWITTER PAD A REMAJA D I KOTA BAND UNG

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. sistem peredaran darah orang lain. Sebelum ditransfusikan, periksa kembali sifat

BAB 1 PENDAHULUAN. Hal itu bisa dirasakan dengan semakin banyaknya ditemukan sistem yang berbasiskan

Abstrak. Kata Kunci : Aplikasi Chat, Text Mining, Spam filtering. vii

Penyalahgunaaan TIK serta Dampaknya

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

4 Langkah untuk Mulai Berjualan Online Sampai Berhasil Mendapatkan Pembeli

PETUNJUK PENGGUNAAN S I D E KA ( S I S T E M I NFORMASI DESA DAN KAWASAN)

1. BAB I PENDAHULUAN 1.1. Latar Belakang ,

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

BAB I PENDAHULUAN. Gambaran Umum Objek Penelitian

Twitter APA ITU TWITTER?

BAB I PENDAHULUAN 1.1 Latar Belakang

KLASIFIKASI SPAM MENGGUNAKAN NAÏVE BAYES

BAB I PENDAHULUAN. tahun ke tahun. Situasi pertumbuhan industri tercermin dari pasar otomotif yang

BAB I PENDAHULUAN. menyebabkan perkembangan informasi yang sangat cepat serta mempermudah. individu dalam berkomunikasi satu dengan lainnya.

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. I.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN 1-1

Transkripsi:

1 BAB I PENDAHULUAN Dalam bab ini akan dibahas latar belakang dilaksanakannya penelitian, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian sistematika penulisan. 1.1 Latar Belakang Media sosial online mengalami pertumbuhan dengan sangat cepat dan menjadi populer dikalangan masyarakat dalam beberapa tahun terakhir ini. Berawal dari Friendster dan MySpace yang banyak digunakan di zamannya sampai media sosial yang mempunyai jutaan bahkan miliaran pengguna seperti Facebook dan Twitter. Orang-orang menggunakan media sosial untuk berkomunikasi dengan teman dan keluarga, mencari berita, menyebarkan informasi, dan lain lain. Twitter merupakan salah satu media sosial yang lahir pada tahun 2006. Twitter kini telah dihuni 645 juta pengguna terdaftar pada 2014, mempunyai 115 juta pengguna aktif setiap bulannya dengan 58 juta tweet dikirim setiap hari dan pencarian lebih dari 2,1 juta miliar pencarian perharinya (Statisticbrain, 2014). Indonesia menjadi negara ke-5 terbesar yang menghuni Twitter dengan 24,9 juta pengguna dan Jakarta merupakan kota yang paling aktif dengan menghasilkan lebih dari 2% tweet yang ada di Twitter (Semiocast, 2012). Dengan statistik tersebut, Twitter termasuk media yang sangat populer digunakan baik itu dalam penyebaran informasi maupun media diskusi tentang banyak hal seperti berita, kejadian, lelucon, iklan bahkan ungkapan perasaan. Twitter memberikan layanan yang dapat mengirimkan pesan singkat sebanyak 140 karakter untuk setiap tweet-nya, maka dari itu Twitter juga sering disebut microblogging. Penyebaran informasi di Twitter memiliki dampak positif maupun negatif. Dampak positif yang terjadi yaitu informasi yang lebih cepat serta mudah disebarkan dan didapatkan. Namun, banyaknya informasi dan cepatnya dan

2 penyebaran tentu ada dampak negatif yang ditimbulkan seperti keakuratan informasi dan spamming. Dampak negatif tersebut ditimbukan oleh orang orang yang memanfaatkan Twitter sebagai media untuk melakukan cyber crime. Cyber crime di Twitter meliputi spamming, hijacking (pembajakan), pencurian identitas dan lain lain (Chu, dkk, 2012). Spam merupakan salah satu dampak negatif di twiter. Spam secara umum dapat digambarkan sebagai sesuau yang tidak diminta dan tindakan berulang yang berdampak negatif terhadap pengguna lain termasuk berbagai bentuk interaksi dan perilaku akun otomatis serta upaya untuk menyesatkan atau menipu pengguna (Twitter, 2015). Sebanyak 9,3% tweet adalah spam (Networked Insights, 2014). Salah satu kasus populer yang terjadi tentang spam Twitter adalah akun palsu yang berusaha melakukan spamming untuk menciptakan trending topic berbau pornografi yang dimulai oleh situs meme populer 4chan. Wiki menunjukkan bahwa mereka menggunakan script, yang ditulis untuk melakukan spam hashtag (CNET, 2009). Para pelaku cyber crime menggunakan akun yang sengaja dibuat untuk tujuan spam. Pelaku yang melakukan spam bisa disebut sebagai spammer. Spammer menyebarkan malicious, phising, atau konten iklan yang tidak sesuai dalam tweet-nya. Dalam penyebaran spam, pelaku menggunakan bot. Di Twitter bot melakukan follow secara acak terhadap beberapa pengguna dengan harapan mendapat follow back dan kemudian tweet spam akan muncul di linimasa pengguna. Bot berisi tweet yang mengandung konten yang menarik dengan tautan dalam tweet-nya yang mana tautan tersebut biasanya tidak sesuai dengan konten yang ditulis didalam tweet yang dikirimkan bot. Tautan tersebut akan mengantarkan pengguna ke situs situs berbahaya atau spam. Hal ini tentu mengganggu pengguna. Berdasarkan aturan Twitter, indikator dari profil spam dapat dilihat dari perilaku mengikuti banyak pengguna dalam periode pendek. Tweet berisi banyak tautan dan hashtag (#) populer yang digunakan dalam tweet yang tidak terkait

3 dengan informasi didalamnya juga merupakan salah satu dari sekian banyak indikator (Twitter, 2015). Twitter memiliki layanan yang memfasilitasi pengguna untuk melaporkan spam account ke Twitter yaitu dengan melakukan post tweet ke akun @spam. Namun dalam peraturan Twitter tidak ada indikasi jelas dari proses, apakah proses dilakukan secara otomatis atau administrator mengandalkan laporan pengguna. Walaupun diyakini bahwa pendekatan yang digunakan adalah keduanya (Verma, M., dkk., 2014). Twitter berusaha dengan serius untuk melawan spam. Twitter memiliki tim anti-spam yang terus berkembang untuk menanggapi bentuk-bentuk baru dari spam agar tercipta lingkungan yang bebas spam di Twitter (Twitter, 2015). Namun terlepas dari sistem anti-spam Twitter yang hanya dapat digunakan oleh internal Twitter dan keterbatasan pengguna yang hanya terlibat dalam melaporkan spam ke pihak Twitter, tidak ada sistem lain yang bisa digunakan untuk mengkategorikan spammer dan non-spammer di Twitter. Melakukan prediksi terhadap spam account bisa dilakukan secara otomatis dengan menggunakan teknik data mining. Data mining merupakan proses dalam menggali pengetahuan baru dari sekumpulan data yang besar. Dengan menggunakan kumpulan data dari akun-akun palsu, kita bisa menemukan pola dari kumpulan data dan menemukan pengetahuan baru didalamnya. Dan dengan metode klasifikasi, kita bisa memprediksi jenis akun, apakah merupakan spammer atau non-spammer. Sebuah sistem yang dapat melakukan klasifikasi spam account tentu sangat berguna bagi para pengguna awam untuk melakukan pencegahan dini dari spam. Sistem ini juga dapat dikembangkan untuk tujuan lain yang masih berhubungan dengan antisipasi spam dan peningkatan efektifitas dan efisiensi dari pencegahan spam. Beberapa penelitian sebelumnya tentang klasifikasi spammer menunjukkan hasil akurasi yang cukup baik. Dengan memilih fitur berdasarkan

4 konten tweet dan pengguna, hasil akurasi yang didapat yaitu 87,6 % dengan menggunakan SVM (Support Vector Machine) classifier (Benevenuto, F, dkk. 2010). Penelitian yang menggunakan Bayesian classifier untuk klasifikasi spam, mendapatkan akurasi sebesar 88,6 % berdasarkan 18 fitur yang dipilih (Yang, C., 2011). Penelitian lain yang memilih hanya 2 fitur yaitu URL rate dan interaction rate mendapatkan akurasi sebesar 86% menggunakan algoritma J48 (Lin, P., dkk, 2013). Dalam penelitian ini, penulis menggunakan algoritma C4.5 dalam proses klasifikasi. Algoritma C4.5 adalah salah satu algoritma Decision Tree (pohon keputusan) yang merupakan peningkatan dari algoritma ID3. Peningkatan pada C.45 salah satunya adalah penanganan numeric attribute. Tentu ini sangat berguna karena banyaknya fitur yang akan digunakan bersifat numerik. Selain itu pohon keputusan yang dihasilkan akan memberikan representasi dari konsep yang menarik karena membuat proses klasifikasi lebih jelas. 1.2 Rumusan Masalah Rumusan masalah yang akan dibahas pada penelitian ini adalah sebagai berikut. 1. Apa saja karakteristik yang dimiliki oleh sebuah akun twitter yang tergolong sebagai akun spam dan akun non-spam 2. Bagaimana membangun sistem klasifikasi akun dengan menggunakan algoritma C4.5. 3. Bagaimana kinerja sistem dalam melakukan klasifikasi akun ke dalam kategori akun spam dan akun non-spam. 1.3 Batasan Masalah Batasan masalah dalam penelitian ini adalah sebagai berikut. 1. Sumber data diperoleh dari media sosial Twitter. 2. Data diambil dari beberapa kumpulan akun Twitter. 1.4 Tujuan Tujuan dari penelitian ini adalah sebagai berikut.

5 1. Mengetahui karakteristik yang dimiliki sebuah akun Twitter yang termasuk kategori akun spam dan akun non-spam. 2. Membangun sistem yang dapat melakukan klasifikasi akun Twitter ke dalam kategori akun spam dan akun non-spam 3. Mengetahui kinerja sistem dalam melakukan klasifikasi akun ke dalam kategori akun spam dan akun non-spam. 1.5 Manfaat Penelitian Dengan dilakukannya penelitian ini diharapkan dapat memberikan manfaat sebagai berikut : 1. Membuat standarisasi untuk karakteristik dari akun spammer dan nonspammer di Twitter. 2. Memberikan sistem yang dapat melakukan klasifikasi akun Twitter spammer dan non-spammer secara lebih mudah, cepat dan akurat 3. Dapat menjadi acuan dalam penentuan efektifitas sebuah kampanye (campaign) produk maupun kejadian di media sosial Twitter. 4. Dapat menjadi rujukan bagi penelitian selanjutnya yang memiliki keterkaitan dengan penelitian ini baik secara langsung maupun tidak langsung. 1.6 Sistematika Penulisan Sistematika penulisan dalam penelitian ini adalah sebagai berikut.: BAB 1 PENDAHULUAN Bab ini berisi latar belakang penelitian, identifikasi masalah, tujuan penelitian, manfaat penelitian, dan sistematika penulisan dokumen proposal tugas akhir ini. BAB 2 TINJAUAN PUSTAKA Bab ini berisi materi-materi hasil literature, teori-teori tentang Twitter dan data mining, definisi kutipan dan istilah yang digunakan dalam penelitian. BAB 3 METODOLOGI PENELITIAN

6 Bab ini berisi penjelasan langkah-langkah yang akan dilakukan dalam penelitian. BAB IV HASIL PENELITIAN DAN PEMBAHASAN Bab ini berisi uraian tentang hasil penelitian dan pembahasan terhadap hasil penelitian yang dilakukan BAB V KESIMPULAN DAN SARAN Bab ini berisi kesimpulan dari keseluruhan penelitian yang telah dilakukan, serta saran dari penulis untuk kegiatan penelitian selanjutnya terkait dengan topik yang sedang dibahas.