BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

dokumen-dokumen yang mirip
TESIS RESPONS TWEET OTOMATIS UNTUK FEEDBACK

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN I - 1

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam.

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

1. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. sistem peredaran darah orang lain. Sebelum ditransfusikan, periksa kembali sifat

BAB I PENDAHULUAN 1.1 Latar Belakang

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. Hal ini dibuktikan dengan adanya fakta yang diungkap oleh World Health

BAB II LANDASAN TEORI

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN I-1

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I Pendahuluan BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. komputer. Dalam hal ini komputer sangat berperan aktif dalam penyebaran

Implementasi Pengembangan Smart Helpdesk di UPT TIK UNS Menggunakan Algoritma Naive Bayes Classifier

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

2016 SISTEM PRED IKSI SPAM ACCOUNT PAD A MED IA SOSIAL TWITTER D ENGAN MENGGUNAKAN ALGORITMA C4.5

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 3. METODOLOGI PENELITIAN

BAB I PENDAHULUAN. ilmu tertentu dengan menggunakan kaidah-kaidah yang berlaku dalam bidang

BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP

BAB 1 PENDAHULUAN 1.1. Latar belakang

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. komputer ataupun perangkat mobile mereka dari manapun dan kapanpun. Setelah

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1-1

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. Kehidupan manusia tidak lepas dari penggunaan internet, dikarenakan akses internet era sekarang penggunaannya cukup mudah.

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang,

1. BAB I PENDAHULUAN 1.1. Latar Belakang

Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1-1

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Teknologi informasi pada saat ini telah berkembang sangat pesat sehingga

BAB IV HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN I.1. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

BAB III METODOLOGI PENELITIAN

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

BAB I PENDAHULUAN I-1

BAB 1 PENDAHULUAN Latar Belakang

KLASIFIKASI PADA TEXT MINING

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Perkembangan teknologi saat ini semakin pesat, sehingga dapat mengubah gaya

KLASIFIKASI PADA TEXT MINING

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES

SKRIPSI. Disusunoleh : NOVTORI WICAKSONO NPM :

BAB 1 PENDAHULUAN 1.1. Latar belakang

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB I PENDAHULUAN. mempermudah pekerjaan terutama untuk sebuah instansi pemerintahan atau

BAB I PENDAHULUAN 1.1 Latar Belakang

Terkait dengan klasifikasi trafik jaringan komputer, beberapa penelitian telah dilakukan dengan fokus pada penerapan data mining. Penelitian tentang

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

BAB I PENDAHULUAN. Jumlah spam di dunia semakin meningkat secara eksponensial.

BAB 1 PENDAHULUAN Latar Belakang

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini media sosial seperti Twitter telah berkembang pesat. Data global menyebut pada akhir Desember 2014 Twitter memiliki 284 juta pengguna aktif. Dick Costolo selaku CEO Twitter menuturkan bahwa jumlah pengguna Twitter di Indonesia mencapai 50 juta orang dan jumlahnya makin bertambah (Azis, 2015). Express Group sebagai perusahaan penyedia layanan taksi adalah salah satu pengguna Twitter. Express Group menggunakan Twitter sebagai sarana komunikasi dengan pelanggannya. Melalui akun Twitter perusahaan Express Group dapat menerima feedback pelanggan taksi berupa penilaian atas layanan yang telah mereka berikan kepada pelanggan, termasuk menerima penilaian terhadap perilaku sopir sebagai partner kerja mereka. Feedback pelanggan (atau tweet) yang diterima oleh Express Group ada beberapa kategori, antara lain keluhan, pujian, follow dan unknown. Tweet kategori keluhan merupakan tweet yang menginformasikan ketidaknyamanan yang dirasakan oleh pengguna layanan. Tweet kategori pujian merupakan tweet yang menginformasikan kepuasan pengguna atas layanan yang diberikan. Sedangkan kategori follow merupakan tweet yang menginformasikan permintaan follow akun Twitter milik pengguna layanan. Selain dari ketiga kategori tersebut maka tweet termasuk dalam tweet kategori unknown. Saat ini Express Group merespons tweet dengan cara manual, artinya tweet direspons oleh beberapa operator dengan standar respons yang dimiliki dan biasa digunakan oleh perusahaan Express Group. Jika tweet yang diterima mengandung pujian maka pihak customer care akan merespons dengan standar respons Terima kasih atas apresiasinya. Semoga bisa terus memberikan yang terbaik dan masih ada beberapa standar responnya lainnya. Contoh tweet pengguna ditunjukkan pada Gambar 1.1. 1

2 Gambar 1.1 menunjukkan bahwa tweet mengandung keluhan dan direspons dengan standar respons keluhan. Pada Gambar 1.1 juga menunjukkan bahwa respons yang dikirimkan secara manual terdapat kelemahan, yakni ada beberapa tweet yang direspons setelah beberapa jam tweet diterima, pun ada respons yang diberikan sehari setelah tweet diterima, bahkan ada tweet yang tidak direspons sampai akhirnya pelanggan merasa kesal sehingga mengirimkan tweet seperti pada Gambar 1.2. Gambar 1.1 Contoh tweet dan respons Gambar 1. 2 Contoh tweet Oleh karena adanya kelemahan pada cara manual maka dalam penelitian ini mengusulkan respons tweet otomatis untuk tweet taksi Express Group. Data tweet taksi yang telah diterima oleh pihak Express Group sudah sangat banyak, data

3 tersebut dapat digunakan untuk data pelatihan yang kemudian dapat digunakan untuk merespons tweet baru dengan beberapa rule yang dirancang. Sistem respons tweet secara otomatis menerapkan kombinasi metode pembelajaran Naïve Bayes Classifier (NBC) dan Rocchio Classifier. NBC digunakan dalam penelitian ini karena antara tweet yang satu dengan yang lain ada kemungkinan (atau probabilitas) termasuk dalam suatu kelas tertentu. Thakur dan Mann (2014) menyatakan bahwa Naïve Bayes Classifier merupakan metode pembelajaran probabilitas. Devi dan Ranjan (2014) menyatakan bahwa NBC dapat digunakan untuk multiclass classification, sehingga NBC cocok digunakan dalam penelitian ini yang mengklasifikasikan tweet ke lebih dari dua kelas. Ting dkk. (2011) mengklasifikasikan teks dokumen ke dalam empat kategori, dan menyatakan bahwa Naives Bayes Classifier menjadi classifier terbaik jika dibandingkan dengan Support Vector Machine, Nearest Neighbor, Decision Tree. Hasil uji coba menunjukkan bahwa Naïve Bayes Classifier memiliki akurasi tertinggi dengan pencapaian nilai sebesar 96,9% dan membutuhkan waktu yang lebih sedikit jika dibandingkan dengan classifier lainnya. Hal yang sama dijelaskan oleh Han dan kamber (2006) bahwa Naïve Bayes mempunyai tingkat kecepatan dan akurasi yang tinggi. Selain menerapkan NBC juga menerapkan Rocchio Classifier. Rocchio Classifier merupakan salah satu supervised learning. Rocchio classifier digunakan dalam proses klasifikasi karena menurut Widjojo dkk. (2014) menghasilkan sistem klasifikasi dokumen renungan harian yang baik dengan akurasi yang cukup tinggi. Begitu juga pada penelitian Lumbanraja (2013) yang mengklasifikasi dokumen teks, Rocchio Classifier memiliki performansi yang baik dengan akurasi yang cukup tinggi. 1.2 Rumusan Masalah Berdasarkan latar belakang yang dijelaskan terdapat kelemahan pada respons yang dikirimkan secara manual, ada beberapa feedback pelanggan yang direspons secara lambat oleh operator, feedback pelanggan direspons beberapa jam atau sehari kemudian, bahkan ada feedback pelanggan yang tidak direspons sampai

4 akhirnya pelanggan merasa tidak puas, sehingga dibutuhkan sistem yang dapat merespons tweet pelanggan secara otomatis dengan menggunakan metode klasifikasi Naïve Bayes Classifier dan Rocchio Classifier untuk mendapatkan kelas daripada feedback pelanggan. 1.3 Batasan Masalah Batasan penelitian adalah : 1. Data tweet yang digunakan adalah tweet bahasa Indonesia yang berasal dari official account Twitter perusahaan Express Group, tweet yang mengandung mention username Twitter perusahaan Express Group. 2. Data respons diambil dari standar respons yang selama ini digunakan oleh perusahaan Express Group. 1.4 Tujuan dan Manfaat Penelitian Tujuan penelitian adalah mengembangkan sistem respons tweet otomatis menggunakan Naïve Bayes Classifier dan Rocchio Classifier. Manfaat penelitian adalah membantu pihak Express Group dalam merespons tweet secara otomatis, khususnya untuk membantu bagian operator yang bertugas merespons tweet. 1.5 Keaslian Penelitian Penelitian mengenai respons Twitter sudah pernah dilakukan sebelumnya oleh Shin dkk. (2014) dan Sordoni dkk. (2015). Shin dkk. (2014) mengekplorasi respons otomatis yang tergantung pada konteks dengan Statistic Machine Translation. Sordoni dkk. (2015) menggunakan arsitektur Neural Network untuk response generation data-driven dari percakapan media sosial. Penelitian ini berbeda dengan penelitian sebelumnya, penelitian ini mengusulkan respons tweet secara otomatis dengan mengimplementasikan kombinasi algoritma classifier yaitu Naïve Bayes Classifier dan Rocchio Classifier. Kemudian dilanjutkan dengan menggunakan beberapa rule dalam merespons feedback tweet. Naïve Bayes Classifier telah digunakan dalam penelitian Rodiansyah (2012), Ling dkk. (2014), Lestari dkk. (2013). Rocchio Classifier juga pernah digunakan dalam penelitian Widjojo dkk. (2014) dan Lumbanraja (2013).

5 Penelitian tersebut tidak membahas klasifikasi teks secara bertingkat. Penelitian yang diajukan akan membahas klasfikasi secara bertingkat, artinya akan dilakukan klasifikasi dalam dua tahapan. Tahap pertama untuk menentukan kelas pujian, keluhan, follow atau unknown dengan menggunakan NBC. Klasifikasi tahap kedua adalah tahap lanjutan dari kelas keluhan yang dihasilkan oleh NBC. Klasifikasi tahap kedua menentukan kelas keluhan sopir atau keluhan umum dengan menggunkan Rocchio Classifier. Setelah itu tweet yang diklasifikasikan akan direspons secara otomatis berdasarkan hasil kelas tweet. 1.6 Metode Penelitian Penelitian ini dilakukan dengan beberapa tahapan sebagai berikut : 1. Kajian pustaka dan studi literatur Kegiatan pada tahap ini adalah melakukan pengumpulan berbagai bahan referensi, seperti jurnal penelitian, tesis/disertasi, buku-buku teori dan sumbersumber lain termasuk informasi yang diperoleh dari internet sebagai sumber data dan informasi yang terkait dengan penelitian. 2. Pengumpulan Data Melakukan pengumpulan data tweet yang mengandung mention username @express_group, yaitu official account Twitter perusahaan Express Group. Pengumpulan tweet dilakukan dengan memanfaatkan Twitter API yang disediakan oleh Twitter. Adapun data tweet yang diambil adalah id tweet, isi tweet, username, tanggal dan waktu tweet. Data tersebut selanjutnya disimpan dalam database. 3. Perancangan Sistem Pada tahap ini dilakukan perancangan sistem meliputi perancangan DFD, perancangan database dan perancangan antarmuka pengguna. Proses perancangan ini dilakukan dengan mendeskripsikan secara tekstual dan menggunakan diagram pemodelan. 4. Implementasi Sistem yang akan dibangun dalam penelitian ini merupakan sistem berbasis web. Sistem akan diimplementasikan menggunakan bahasa pemrogram PHP dan basis data relasional MySQL.

6 5. Pengujian Sistem Pengujian ini betujuan untuk mengetahui efektifitas model klasifikasi yang dihasilkan classifier algorithm. Pengujian ini dilakukan dengan menghitung presicion, recall dan f-measusre dan akurasi.. Pengujian membutuhkan data uji dengan label yang telah diketahui. Selain itu akan dilakukan pengujian respons feedback tweet yang dikirimkan oleh sistem apakah respons tersebut berkesinambungan. 1.7 Sistematika Penulisan Sistematika penulisan laporan penelitian ini terdiri 7(tujuh) bab dengan masing-masing berisi rincian sebagai berikut : Bab I Pendahuluan Bab ini berisi latar belakang penelitian, rumasan masalah, batasan masalah, tujuan dan manfaat penelitian, keaslian penelitian, metode penelitian dan sistematika penulisan laporan penelitian. Bab II Tinjauan Pustaka Bab ini berisi tinjauan pustaka yang memuat uraian sistematis tentang informasi hasil penelitian yang pernah dilakukan terkait topic yang diteliti. Sejumlah literature dan publikasi ilmiah yang berhasil dikumpulkan mengenai respons otomatis, text classification, metode Naïve Bayes Classifier dan Rocchio Classifier. Bab III Landasan Teori Bab ini menguraikan dasar-dasar teori yang digunakan sebagai bahan referensi dalam penelitian. Dasar teori tersebut antara lain, text mining, klasifikasi, dan metode yang digunakan yakni Naïve Bayes Classifier dan Rocchio Classifier. Bab IV Analisis dan Perancangan Sistem Bab ini menguraikan tentang analisis dana rancangan sistem. Rancangan sistem yang dibuat adalah rancangan sistem, rancangan DFD, rancangan basis data, rancangan antarmuka sistem. Bab V Implementasi

7 Bab ini berisi tentang implementasi yang telah dilakukan berdasarkan rancangan yaitu implementasi metode Naïve Bayes Classifier dan Rocchio Classifier untuk memeberikan respons tweet secara otomatis. Bab VI Hasil Penelitian dan Pembahasan Bab ini menguraikan pengujian dan evaluasi terhadap hasil-hasil penelitian. Bagian-bagian yang diuraikan meliputi pengujian model klasifikasi Naïve Bayes Classifier dan Rocchio Classifier dan pengujian hasil respons tweet yang dilakukan oleh sistem. Bab VII Kesimpulan dan Saran Bab ini berisi kesimpulan dari hasil penelitian dan saran-saran yang diajukan untuk pengembangan atau penellitian lanjutan.