BAB I PENDAHULUAN 1.1 Latar Belakang

dokumen-dokumen yang mirip
1. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UNTUK TOPIC DETECTION AND TRACKING PADA MICROBLOG TWITTER

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB III METODE PENELITIAN

BAB I PENDAHULUAN.

BAB I PENDAHULUAN. 1.1 Latar Belakang. Mikroblog adalah salah satu bentuk blog yang memungkinkan

BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. Universitas Indonesia. Klasifikasi topik menggunakan..., Dyta Anggraeni

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA

BAB I PENDAHULUAN 1.1. Latar Belakang Rendy, 2013

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

UKDW BAB I PENDAHULUAN

BAB 1 PENDAHULUAN Latar Belakang

BAB 3 LANGKAH PEMECAHAN MASALAH. dengan pembeli dan memungkinkan mereka untuk melakukan transaksi yang aman dan

BAB I PENDAHULUAN 1.1 Latar Belakang

2016 SISTEM PRED IKSI SPAM ACCOUNT PAD A MED IA SOSIAL TWITTER D ENGAN MENGGUNAKAN ALGORITMA C4.5

BAB III METODELOGI PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. menghasilkan beberapa karya yang mempermudah urusan manusia. Dan salah

BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

BAB 1 PENDAHULUAN Latar Belakang

ANALISIS SENTIMEN DATA KRITIK DAN SARAN PELATIHAN APLIKASI TEKNOLOGI INFORMASI (PATI) MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB 3 LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN UKDW

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III ANALISIS DAN PERANCANGAN

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB IV HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy).

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Pemilihan presiden merupakan momen penting bagi setiap negara, salah satunya

BAB I PENDAHULUAN. 1.1 Latar Belakang

SENTIPOL: Dataset Sentimen Komentar Pada Kampanye PEMILU Presiden Indonesia 2014 Dari Facebook Page

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. komputer ataupun perangkat mobile mereka dari manapun dan kapanpun. Setelah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. Bab ini menjelaskan latar belakang yang mendasari dilakukannya

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Hal ini dibuktikan dengan adanya fakta yang diungkap oleh World Health

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1 PENDAHULUAN

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang,

DAFTAR ISI. PERNYATAAN... Error! Bookmark not defined. KATA PENGANTAR... Error! Bookmark not defined.

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

HASIL DAN PEMBAHASAN. B fch a. d b

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB I PENDAHULUAN A. Latar Belakang

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini, microblogging menjadi sangat popular untuk alat komunikasi antara pengguna internet. Setiap hari jutaan pesan muncul di website penyedia microblogging diantaranya Twitter, Facebook, dan Tumblr. User tersebut menuliskan pesan tentang kehidupan sehari-harinya, opini dari beberapa topik bahkan membicarakan tentang isu-isu terkini yang sedang hangat. Karena format pesan yang gratis dan mudah untuk diakses, pengguna internet cenderung meninggalkan alat komunikasi yang tradisional (blog, mail) dan beralih menggunakan microblogging, salah satunya twitter. Hingga bulan Oktober 2016 terdapat lebih dari 500 juta pengguna terdaftar di twitter, 317 juta diantaranya adalah pengguna aktif. Pada okber 2016, pengguna Twitter mengirimkan lebih dari 500 juta kicauan per hari (Morscheck, 2016). Sedangkan Indonesia menjadi negara yang menduduki peringkat ke 4 dalam mengakses situs twitter hingga saat ini. Twitter merupakan salah satu media sosial yang efektif dan cepat dalam mengabarkan keadaan yang sedang terjadi di ibu kota DKI Jakarta salah satunya ketika terjadi bencana. Bencana yang sering melanda ibu Kota Jakarta adalah bencana Banjir. Banjir menurut KBBI berarti berair deras dan banyak, kadang kadang meluap yang disebabkan oleh sungai karena hujan yang turun terus menerus. Menurut fakta (data.jakarta.co.id), Tahun 2016, 25 Kecamatan di DKI Jakarta masih terendam banjir. Rata-rata waktu banjir di DKI Jakarta yaitu 2 hari. Angka tersebut telah berkurang jika dibanding tahun-tahun sebelumnya dimana banjir bisa terjadi selama 20 hari. Masyarakat menuliskan informasi tentang banjir melalui media twitter dalam bentuk tweet. Media sosial termasuk twitter memiliki kredibilitas yang rendah sebagai penyedia informasi (Oktafiani dkk, 2012). Informasi yang tidak benar dapat menimbulkan masalah. Seperti contoh 1

2 Gambar 1.1 menunjukkan tweet tentang banjir menunjukkan tweet yang bukan kategori bencana. Gambar 1. 1 Contoh tweet bukan bencana Padahal informasi bencana banjir secara nyata dan cepat dibutuhkan untuk mengantisipasi banjir yang berkelanjutan. Akan tetapi, tidak terstrukturnya data pada tweet membuat tweet tidak bisa secara langsung dipergunakan. Oleh karena itu diperlukan sistem yang dapat mengubah data tweet yang tidak terstruktur menjadi data yang lebih terstruktur dengan mengenali entitas yang ada pada tweet sehingga dapat mengidentifikasi secara otomatis tweet banjir termasuk dalam kategori bencana atau banjir dalam arti lain. Dalam penelitian ini akan dilakukan analisis dengan menggunakan teknik klasifikasi multinomial naïve bayes dan support vector machine (SVM). Multinomial naïve bayes adalah metode dengan memperhitungkan frekuensi masing-masing kemunculan dalam sebuah dokumen dan probabilitas. Menurut Huang (2013) Algorima naïve bayes memiliki akurasi yang bagus ketika terbatasnya memori dan CPU. Multinomial naïve bayes memiliki keunggulan pada kemudahan komputasi dan komputasi yang tidak memakan banyak sumber daya. Kelebihan algoritma ini sangat cocok di diterapkan untuk mengolah data dari twitter untuk mengindetifikasi tweet banjir yang membutuhkan komputasi yang cepat. Sedangkan klasifikasi SVM memiliki beberapa kelebihan tersendiri diantara lain generalisasi atau kemampuan mengklasifikasi suatu pattern. (Nugroho, 2003). Menurut Joachim (1998) masalah kategori teks seperti identifikasi tweet dapat dipisahkan secara linier menggunakan SVM. Keuntungan lainnya ialah SVM memiliki sedikit fitur yang tidak relevan karena SVM menganggap setiap fitur memiliki bobot yang tidak nol. Untuk mengetahui akurasi dari identifikasi tweet banjir yang dilakukan, maka diperlukan performa evaluasi yang dapat mengetahui

3 seberapa baik performa dari algoritma yang digunakan. Salah satu metode yang digunakan adalah k-fold cross validation. Dengan digunakana metode tersebut akan di ketahui nilai akurasi, precision, recall, dan f-measure untuk mengetahui performa dari algoritma klasifikasi yang digunakan. Dalam penelitian ini diharapkan akan diketahui identifikasi banjir di ibu kota Jakarta, apakah kata banjir yang di posting setiap user masuk kedalam kategori bencana atau bukan bencana. Dengan menggunakan algoritma naïve bayes classification dan support vector machine yang akan dibandingkan akurasinya. 1.2 Rumusan Masalah Berdasarkan latar belakang diatas, maka dapat diambil sebuah permasalahan utama yaitu bagaimana mengidentifikasi tweet banjir masuk kedalam kategori bencana atau bukan bencana dan seberapa banyak jumlah banjir kategori bencana atau bukan. 1.3 Batasan Masalah Adapun batasan-batasan masalah pada penelitian ini adalah: 1. Data yang digunakan adalah data yang diambil dari tweet dalam kurun waktu 12 November 2014 sampai 25 Januari 2015 di Twitter. 2. Setiap posting tweet tersebut mengandung kata banjir yang terjadi di Jakarta 3. Identifikasi banjir hanya dilakukan kepada tweet berbahasa Indonesia. 4. Data tweet yang dilakukan merupakan data offline (tidak terintegrasi langsung dengan twitter secara online). 5. Fitur yang digunakan adalah unigram dengan seleksi fitur menggunakan metode TF-IDF 6. Proses identifikasi menggunakan algoritma multinomial naive bayes dan dilakukan komparasi terhadap algoritma support vector machine

4 7. Evaluasi performansi dilakukan dengan cara menghitung nilai akurasi, precision, recall, dan f-measure dari hasil analisis identifikasi tweet banjir 1.4 Tujuan Penelitian Adapun tujuan penelitian ini adalah: - Membuat analisis untuk mengidentifikasi tweet banjir masuk dalam kategori bencana atau banjir dengan arti lain menggunakan metode multinomial naïve bayes dan support vector machine. - Mengetahui dan membandingkan akurasi yang dihasilkan dari algoritma multinomial naive bayes dan support vector machine. 1.5 Manfaat Penelitian Manfaat penelitian ini berupa kontribusi pada identifikasi tweet banjir menggunakan multinomial naïve bayes dan support vector machine, sedangkan manfaat kepada masyarakat adalah memberikan kemudahan dalam mengidentifikasi tweet banjir sehingga dapat memberikan informasi banjir yang nyata ketika ada banjir di ibu kota. 1.6 Sistematika Penulisan Sistematika penulisan yang digunakan dalam penyusunan tugas akhir ini adalah sebagai berikut; BAB I: PENDAHULUAN Bab ini menjelaskan tentang latar belakang, perumusan masalah, batasan masalah, tujuan penelitian, dan manfaat penelitian. BAB II: TINJAUAN PUSTAKA Bab ini memuat uraian mengenai penjelasan penelitian sebelumnya yang terkait dengan penelitian ini. Selain itu juga menjadi referensi dalam penelitian ini. BAB III: LANDASAN TEORI Bab ini memuat pengertian-pengertian yang diperlukan untuk pembahasan di bab-bab berikutnya.

5 BAB IV: ANALISIS DAN PERANCANGAN SISTEM Bab ini menguraikan analisis sistem yang akan dibangun serta penjelasan mengenai perancangan sistem berdasarkan hasil analisis yang telah dilakukan. BAB V: IMPLEMENTASI SISTEM Bab ini menjelaskan tentang implementasi dari sistem sesuai dengan rancangan yang telah dibangun dan berdasarkan tools yang dipakai. BAB VI: HASIL DAN PEMBAHASAN Pada bab ini berisi hasil penelitian berdasarkan pengujian yang dilakukan. BAB VII: KESIMPULAN DAN SARAN Pada bab ini berisi kesimpulan yang diambil dari hasil pembahasan serta saran-saran untuk pengembangan sistem selanjutnya.