BAB II LANDASAN TEORI
|
|
|
- Liana Hartanto
- 8 tahun lalu
- Tontonan:
Transkripsi
1 BAB II LANDASAN TEORI 2.1 Tinjauan Pustaka Berikut ini beberapa studi sebelumnya yang terkait dengan penelitian ini adalah sebagai berikut : Analisis Sentimen Masyarakat terhadap Calon Presiden Indonesia 2014 berdasarkan Opini dari Twitter Menggunakan Metode Naïve Bayes Classifier[8]. Dalam penelitian ini, penulis meneliti opini masyarakat terhadap calon presiden Indonesia tahun 2014 yaitu pasangan Prabowo Subianto-Hatta Rajasa dan Joko Widodo-Jusuf Kalla. Penulis menggunakan Naïve Bayes untuk pengklasifikasian dokumen, selain sederhana metode ini mempunyai akurasi yang tinggi jika diaplikasikan dalam data yang besar dan beragam. Data dalam penelitian ini diambil dalam tiga periode yaitu sebelum pemilu legislatif, saat diadakan pemilu legislatif dan setelah deklarasi pengumuman pemilu legislatif kemudian dari data tersebut penulis mengelompokkan opini masyarakat apakah bersifat positif, negatif atau netral. Hasil dari polaritas sentimen, Prabowo Subianto-Hatta Rajasa mendapatkan 47,7% untuk sentimen positif, 26,4% untuk sentimen negatif dan 25,9% untuk sentimen netral sedangkan Joko Widodo-Jusuf Kalla mendapatkan 37,6% sentimen positif, 34,4% sentimen negatif dan 27,9% sentimen netral dengan tingkat akurasi sebesar 90%.
2 Penerapan Algoritma Genetika Untuk Seleksi Fitur Pada Analisis Sentimen Review Jasa Maskapai Penerbangan Menggunakan Naïve Bayes[9]. Dalam penelitian ini peneliti menerapkan algoritma genetika untuk melakukan seleksi fitur pada dokumen dan algoritma naïve bayes untuk klasifikasi. Penggabungan keduanya bertujuan untuk meningkatkan akurasi. Tokenization, Stopword Removing, Stemming adalah pre-pocessing yang dilakukan sebelum melakukan seleksi fitur. Nilai akurasi yang dihasilkan metode naïve bayes berbasis algoritma genetika adalah 89.5% dan AUC sebesar metode tersebut berhasil meningkatkan akurasi sebesar 29.5% dan AUC sebesar dari percobaan tanpa menggunakan algoritma genetika sebagai seleksi fitur yang hanya menghasilkan nilai akurasi sebesar 60%. An Ensemble Sentiment Classification System of Twitter Data for Airline Services Analysis[7]. Penelitian ini menggunakan enam metode untuk klasifikasi yaitu Lexicon-based classifier, Naïve Bayes, Bayesian Network, SVM (Support Vector Machine), C4.5 (Decision Tree), Random Forest serta satu metode yang disebut dengan Ensemble Classifier yang menggabungkan lima metode (Naïve Bayes, Bayesian Network, SVM, C4.5 dan Random Forest) untuk mendapatkan akurasi yang lebih tinggi. Dalam penelitian ini terdapat empat kelas yaitu kelas positif (4288 tweet), negatif (35876 tweet), netral (40987 tweet) dan irrelevant (26715 tweet). Perolehan akurasi masing-masing saat tidak dikombinasikan dengan dataset dua kelas (menghilangkan kelas netral dan irrelevant) adalah Lexicon Based 67.9%, Naïve Bayesian 90%, Bayesian Network 91.4%, SVM 84.6%, Random Forest 89.8%.
3 Metode Lexicon Based tidak ikut dalam kombinasi karena perolehan akurasinya paling sedikit yaitu 67,9%, perolehan akurasi ensemble dengan dataset dua kelas yaitu 91.7% sedangkan perolehan akurasi ensemble untuk dataset tiga kelas yaitu 84.2%. Klasifikasi Teks dengan Naïve Bayes Classifier (NBC) untuk Pengelompokkan Teks Berita dan Abstrak Akademis[10]. Metode Naïve Bayes Classifier (NBC) untuk mengkategorikan dokumen berita dengan 1000 dokumen dan abstrak akademis 450 dokumen, masing-masing dilakukan percobaan sebanyak 7 kali pada percobaan pertama untuk dokumen berita memperoleh akurasi 91% dengan 900 data latih dan 100 data uji, percobaan kedua memperoleh akurasi 87% dengan 800 data latih dan 200 data uji, percobaan ketiga memperoleh akurasi 85% dengan 700 data latih dan 300 data uji, percobaan keempat memperoleh akurasi 84% dengan 600 data latih dan 400 data uji, percobaan kelima memperoleh akurasi 84% dengan 500 data latih dan 500 data uji, percobaan keenam memperoleh akurasi 81% dengan 400 data latih dan 600 data uji, percobaan yang terakhir memperoleh akurasi 74% dengan 300 data latih dan 700 data uji. Sedangkan untuk abstrak akademis pada percobaan pertama memperoleh akurasi 82% dengan 405 data latih dan 45 data uji, pada percobaan memperoleh akurasi 81% dengan 360 data latih dan 90 data uji, pada percobaan ketiga memperoleh akurasi 78% dengan 315 data latih dan 135 data uji, pada percobaan keempat memperoleh akurasi 75% dengan 270 data latih dan 180 data uji, pada percobaan kelima memperoleh akurasi 75% dengaan 225 data latih dan 225 data uji, pada percobaan keenam memperoleh akurasi 68% dengan 180 data latih dan 270 data uji dan pada percobaan terakhir memperoleh akurasi
4 65% dengan 135 data latih dan 315 data uji. Semakin banyak data latih maka semakin besar akurasi yang didapatkan. Analisis Opini Terhadap Fitur Smartphone pada Ulasan Website Berbahasa Indonesia[11] Pengumpulan data dilakukan dengan cara web scraping yaitu mengambil data review dari website target. Yang termasuk dalam target analisa adalah BOLT 4G Powerphone IVO, Samsung Galaxy Grand I9082 White, Apple iphone 5S 16GB Gold White, Microsoft Lumia Orange dan Nokia Lumia 520 Black. Sebelum dilakukan analisa data yang diperoleh dari web harus melalui tahap preprocessing agar memperoleh review data bersih kemudian Lexicon based, rule bahasa dan score function digunakan untuk menganalisis opini. Dari hasil pengujian diperoleh rata-rata nilai recall dan precision masing-masing sebesar 0.63 dan 0.72 sedangkan akurasinya sebesar 81.76%. Tabel 2. 1 Penelitian Terkait No Peneliti Tahun Judul Metode Hasil 1 Faishol 2013 Analisis Sentimen POS (Part-of- Dalam Nurhuda, Masyarakat terhadap speech) penelitian ini, Sari Calon Presiden Tagging untuk peneliti Widya Indonesia 2014 ekstraksi opini mengambil data Sihwi, berdasarkan Opini dan Naïve yang berupa Afrizal dari Twitter Bayes opini masyarakat Doewes menggunakan Classifier dari twitter Metode Naïve Bayes untuk kemudian
5 Classifier 2 Risa Wati 2016 Penerapan Algoritma Genetika Untuk Seleksi Fitur Pada Analisis Sentimen Review Jasa Maskapai Penerbangan Menggunakan Naïve Bayes klasifikasi dan mengukur tingkat akurasi. Algoritma Genetika untuk seleksi fitur pada dokumen dan Naïve Bayes untuk klasifikasi. diklasifikasi menggunakan metode Naïve Bayes. Hasil yang didapatkan dari pengujian 100 data random yang sudah diklasifikasi polaritas secara manual dengan menggunakan 1400 data training mendapatkan akurasi sebesar 90%. Penulis menggabungkan Algoritma Genetika sebagai seleksi fitur dan Algoritma Naïve Bayes untuk klasifikasi yang bertujuan untuk meningkatkan akurasi. Hasil
6 akurasi sebelum menggunakan pemilihan fitur Algoritma Genetika sebesar 60%, adapun hasil setelah menggunakan pemilihan fitur Algoritma Genetika sebesar 89.5% dan AUC sebesar maka terjadi peningkatan akurasi sebesar 29.5% dan AUC sebesar Yun Wan, 2015 An Ensemble Lexicon-based Metode The Dr. Sentiment classifier, Ensemble Qigang Classification Naïve Bayes Classifier yaitu Gao System of Twitter Classifier, metode yang Data for Airline Bayesian menggabungkan Sevices Analysis Network 5 metode classifier, sekaligus (naïve SVM, C4.5 bayes, Bayesian Decision Tree, network, SVM,
7 Random Forest, Ensemble Classifier The C4.5 dan Random Forest) memperoleh akurasi tertinggi yaitu sebesar 91.7%, metode Lexicon-based classifier memperoleh akurasi paling rendah yaitu sebesar 67.9% saja. Untuk tingkat akurasi metode lainnya yaitu Naïve Bayes sebesar 90%, Bayesian Network sebesar 91.4%, SVM sebesar 84.6%, C4.5 sebesar 86% dan Random Forest sebesar 89.8% perolehan akurasi tersebut berdasarkan
8 dataset yang menggunakan dua kelas (kelas positif dan negatif) sedangkan perolehan akurasi untuk dataset yang menggunakan tiga kelas (ditambahkan kelas netral) sama saja urutannya tetapi nilai akurasi pada masingmasing metode sedikit menurun. 4 Amir 2012 Analisa Klasifikasi Naïve Bayes Dilakukan Hamzah Teks dengan Naïve Classifier sebanyak 7 kali Bayes Classifier percobaan untuk (NBC) untuk dokumen berita Pengelompokkan maupun Teks Berita dan dokumen abstrak Abstrak Akademis akademis pada percobaan pertama dengan
9 jumlah data latih dan data uji 9:1 dari dokumen seluruhnya meghasilkan akurasi yang paling tinggi kemudian data latih dikurangi jumlahnya akurasinya berkurang juga. Penggunaan data latih sebesar 50% dari data seluruhnya memperoleh hasil akurasi lebih dari 75%. 5 Doni 2016 Analisis Opini Lexicon based, Hasil akurasi yag Setyawan, terhadap Fitur rule bahasa didapatkan Edi Smartphone pada dan score dalam penelitian Winarko Ulasan Website function. ini adalah Berbahasa Indonesia 81.76% dengan nilai recall dan precisionnya masing-masing adalah 0.63 dan
10 0.72. Pengumpulan data dilakukan web scraping yaitu dengan mengumpulkan review opini masyarakat di web target. 2.2 Landasan Teori Twitter Twitter adalah sosial media yang dibatasi dengan 140 karakter untuk sekali berkicau. Twitter disebut jejaring sosial berupa microblog karena situs ini memungkinkan penggunanya mengirim dan membaca pesan blog[12]. Selain siapa saja dapat menggunakan twitter dan penggunaannya yang mudah (user friendly) banyak sekali informasi yang ada di twitter seperti berita apa yang sedang ramai diperbincangkan dunia, informasi mengenai pekerjaaan, artis favorit dan teman teman kita. Berikut adalah dampak positif dan negatif yang ditimbulkan twitter: Positif : Sebagai media informasi, promosi dan komunikasi. Tanpa melakukan login sudah mendapatkan update informasi yang ada di twitter. Untuk meraih kepopuleran, misalnya kita meng-upload sesuatu yang membuat user lain suka dan simpati maka kita mendapatkan kepopuleran lewat twitter.
11 Banyak teman baru yang dapat kita peroleh melalui twitter. Negatif : Dapat menimbulkan konflik antar pengguna. Banyaknya spam yang ada di twitter sehingga membuat penggunanya tidak nyaman. Jika kecanduan dengan twitter menyebabkan rasa malas API Twitter Karena twitter menghasilkan jutaan tweet setiap harinya developer menyediakan API Twitter (Application Programming Interface) untuk menyimpan tweet tersebut agar mempermudah seseorang untuk mengakses informasi yang ada didalamnya untuk tujuan pengembangan aplikasi. Untuk dapat mengakses API Twitter dibutuhkan Consumer Key dan Consumer Secret keduanya berfungsi agar twitter mengetahui aplikasi yang kita buat [6]. Langkah pertama yang dilakukan adalah login dengan akun twitter ang kita miliki ke dan lalu ikuti langkah-langkah yang ada didalamnya dan sediakan nomor handphone yang aktif untuk mendapatkan kode konfirmasi. Setelah mendapatkan API key, API secret, Access token dan Access token secret, API Twitter dapat diakses Text Mining Text Mining dapat diartikan sebagai penambangan teks yang bertujuan untuk mendapatkan data berupa dokumen yang tidak terstruktur sehingga dapat dilakukan analisis agar dokumen menjadi
12 terstruktur dan informasi dapat diperoleh dari dokumen tersebut. Kegiatan riset untuk text mining antara lain ekstraksi dan penyimpanan teks, preprocessing akan konten teks, pengumpulan data statistic serta indexing analisis sentimen[13]. Contoh pemanfaatan text mining antara lain untuk menyaring spam di , pencarian lirik lagu di google, mengklasifikasi dokumen Sentimen Analisis Sentimen analisis adalah ungkapan perasaan yang diubah menjadi bentuk tekstual yang memiliki tujuan untuk menganalisis, memahami, mengolah dan mengekstrak data tekstual yang berupa opini terhadap entitas seperti produk, servis, organisasi, individu dan topik tertentu. Tugas dasar dalam analisis sentimen adalah mengelompokkan popularitas dari teks yang ada dalam dokumen, apakah pendapat yang dikemukakan bersifat positif, negatif atau netral[16]. Sentimen analisis atau dapat disebut juga opinion mining dapat mempengaruhi sikap seseorang terhadap suatu objek dan dimanfaatkan untuk mengetahui kelebihan dan kekurangan objek tersebut Situs Belanja Online Situs belanja online adalah website yang menjual produk secara elektronik menggunakan bantuan jaringan internet dan alat elektronik lainnya untuk melakukan transaksi. Ada empat macam e- commerce yaitu : a. C2C (Customer to Customer) adalah situs e-commerce yang penjualnya mendaftarkan diri kesebuah market place yang meyediakan tempat penjual dan pembeli untuk bertemu jadi penjual yang sudah memilki akun dapat menjual barang miliknya yang baru maupun bekas dengan meng-upload gambar ke website market place agar menarik pembeli, jika pembeli tertarik dengan
13 barang yang ditawarkan mereka dapat menghubungi kontak yang tersedia. Pihak market place tidak bertanggung jawab atas pengiriman barang, contohnya seperti KasKus, OLX, Jualo. b. B2B (Bussiness to Bussiness) hampir sama seperti yang pertama hanya saja bukan individu yang menjual barang melainkan perusahaan yang berperan sebagai produsen/distributor yang menawarkan barangnya ke perusahaan lain, contohnya seperti Alibaba, Indonetwork. c. B2C (Bussiness to Customer) perusahaan menjual barang kepada customer secara langsung tanpa perantara market place dengan kata lain perusahaan memiliki toko online sendiri mereka bertangung jawab pada pengiriman barang, transaksi transfer uang meskipun barang yang dijual bukan produk dari perusahaan mereka sendiri, contohnya seperti Matahari Mall, Berrybenka, Zalora. d. B2B2C (Bussiness to Bussiness to Customer) hampir sama seperti yang ketiga perbedaannya perusahaan/individu yang bertidak sebagai distributor dapat meng-upload gambar barang yang akan dijual ke website market place transaksi dilakukan melalui pihak market place kemudian baru diberikan pada pihak distributor, contohnya seperti Tokopedia, Sociolla, Shopee, Lazada, Bukalapak. Berikut adalah kelebihan dan kelemahan situs belanja online : Kelebihan : Tidak dibatasi wilayah jika ingin membeli dan dapat diakses kapan saja dimana saja. Seringkali diadakan diskon, kupon potongan untuk berbelanja dan gratis ongkos kirim.
14 Menghemat biaya akomodasi karena tidak usah datang ke toko. Menambah keuntungan bagi penjual karena tidak usah membangun toko sungguhan. Kekurangan : Transaksi bergantung pada rasa saling percaya, adanya jaringan internet, listrik dan rekening/atm. Sering terjadi penipuan yang dilakukan oleh penjual maupun pembeli. Tidak dapat mengecek barang. Banyak situs belanja online yang tidak mau bertanggung jawab jika ada pembeli yang ingin menukar barang Prepocessing Data tweet yang telah diambil dari twitter masih berupa data mentah maka dari itu dilakukan tahap preprocessing untuk mendapatkan data bersih agar dapat diproses ke tahap selanjutnya. Tahapan yang dilakukan adalah cleansing data, case folding, tokenizing dan filtering yang terdiri dari stopword removal serta stemming Cleansing Data Dilakukan untuk mengurangi noise pada data tweet. Kata-kata yang tidak penting dihilangkan seperti URL, hashtag (#), username (@username), , emoticon ( :@, :*, :D ), tanda baca seperti koma (,), titik (.) dan juga tanda baca lainnya[14]. Tabel 2. 2 Contoh cleansing data Input
15 @LazadaIDCare kecewa dengan pelayanan dari CS Lazada, kemarin saya diinfokan bisa loh utk aktivasi kembali akun. Output kecewa dengan pelayanan dari CS Lazada kemarin saya diinfokan bisa loh utk aktivasi kembali akun Case Folding Dalam penulisan tweet, pasti terdapat perbedaan bentuk huruf, tahapan ini merupakan proses merubah bentuk huruf menjadi huruf kecil (lower case) atau dapat disebut juga penyeragaman bentuk huruf. Tabel 2. 3 Contoh Case Folding Input kecewa dengan pelayanan dari CS Lazada kemarin saya diinfokan bisa loh utk aktivasi kembali akun Output kecewa dengan pelayanan dari cs lazada kemarin saya diinfokan bisa loh utk aktivasi kembali akun Tokenizing Proses tokenizing atau parsing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. Pada dasarnya proses tokenizing adalah pemenggalan kalimat menjadi kata. Tabel 2. 4 Contoh tokenizing Input kecewa dengan pelayanan dari cs lazada kemarin saya diinfokan bisa loh utk aktivasi kembali akun
16 Output kecewa, dengan, pelayanan, dari, cs, lazada, kemarin, saya, diinfokan, bisa, loh, untuk, aktivasi, kembali, akun Stopword Removal Stopword Removal merupakan proses menghilangkan daftar kata-kata yang tidak mendeskripsikan sesuatu yang semestinya dihilangkan seperti yang, di, ke, itu dan lain sebagainya. Tabel 2. 5 Contoh stopword removal Input kecewa, dengan, pelayanan, dari, cs, lazada, kemarin, saya, diinfokan, bias, loh, untuk, aktivasi, kembali, akun Output kecewa pelayanan cs lazada kemarin saya info bisa aktivasi kembali akun Stemming. Stemming adalah tahapan untuk membuat kata berimbuhan menjadi kata dasar sesuai dengan aturan Bahasa Indonesia yang benar. Tabel 2. 6 Contoh stemming Input kecewa pelayanan cs lazada kemarin saya bisa aktivasi kembali akun Output kecewa pelayanan lazada kemarin saya bisa aktif kembali akun
17 Convert Negation Dalam Bahasa Indonesia terdapat kata tidak, nggak, tak, kurang, tanpa yang disebut kata negasi yaitu kata yang dapat membalikan arti dari kata yang sebenarnya. Tabel 2. 7 Contoh convert negation Input nggak suka belanja di lazada kualitas barang jelek Output nggak_suka belanja di lazada kualitas barang jelek Opinion Word Adalah kumpulan kamus kata positif dan negatif dalam Bahasa Indonesia. Dibuat pertama kali oleh Liu dalam penelitiannya kemudian diterjemahkan ke dalam Bahasa Indonesia yang berguna untuk menghitung kata sentimen dalam sebuah kalimat. Agar selanjutnya dapat digunakan sebagai rumus untuk menghitung jarak centroid dengan dokumen dalam proses clustering. Dalam kamus kata opinion word terdapat kurang lebih 2400 kata negatif dan 1900 kata positif. Tabel 2. 8 Kumpulan kata positif a+ Ajaib Amat apresiasi bakat Acungan Aklamasi Ambisius Asli bangga Adaptif Akomodatif Andal aspirasi bantuan Adil Akurat Aneh asyik banyak Afinitas alam mimpi Anggun bagos banyak akal Afirmasi Alhamdulillah angin sepoi bagus barang baru
18 Agilely allahu akbar Angkat bahagia batu permata Agung Altruistis Antusias baik bebas Ahli Aman Antusiasme baik diposisikan bebas masalah Ahlinya Amanah Pik baik sekali bebas pulsa Tabel 2. 9 Kumpulan kata negatif Abnormal agresor amat panas Anarki anjlok Absurd Aib Ambigu Anarkis anomali Acak air terjun Ambivalen Anarkisme antagonis acakacakan Akurat ambivalensi Ancaman antagonisme Acuh Alarm Amoral Aneh antek acuh tak Alas an Amoralitas aneh lagi antiacuh Adiktif alat permainan Ampun Anehnya anti- Amerika Adil Alergi Amuk Angkuh anti-israel Agresi Alergik anak nakal Angriness anti-kita Agresif amat ketakutan anak yatim Anjing antipendudukan Clustering Data mentah yang diperoleh dari twitter termasuk data unsupervised, yaitu data yang belum memiliki label maka dari itu dilakukan proses clustering untuk memberikan label data yang telah diberikan label disebut data supervised.
19 K-Means Langkah-langkah perhitungan clustering dengan menggunakan metode k-means : 1. Menentukan jumlah dokumen yang akan di clustering. 2. Menentukan pusat cluster (centroid) secara acak. Dalam perhitungan kali ini terdiri dari dua pusat cluster yaitu C1 sebagai centroid negatif dan C2 sebagai centroid positif.. 3. Setiap dokumen dihitung jaraknya ke centroid menggunakan persamaan euclidean distance. Rumus euclidean distance, yaitu : ( ) ( ) ( ) Dimana : ( ) = jarak antara dokumen i dan j ( ) = selisih kuadrat jarak antara dokumen i dan j pada dokumen yang pertama ( ) = selisih kuadrat jarak antara dokumen i dan j pada dokumen yang kedua. e. Menghitung jarak cluster C1 (positif) f. Menghitung jarak cluster C2 (negatif) 4. Mengelompokkan semua dokumen berdasarkan jarak yang terkecil. 5. Menghitung nilai rata-rata dari dokumen yang ada pada centroid yang sama untuk menentukan centroid baru.
20 6. Kemudian hitung kembali jarak antara dokumen dengan centroid menggunakan euclidean distance. 7. Jika centroid baru tidak sama dengan centroid lama maka kembali ke langkah dua Klasifikasi Klasifikasi adalah proses menemukan model dari sebuah data. Tujuan dari klasifikasi adalah untuk mengambil suatu keputusan dengan memprediksi suatu kasus berdasarkan hasil klasifikasi yang diperoleh. Dalam proses pengklasifikasian terdapat 2 proses yang dilakukan yaitu : a. Proses training Pada proses ini dilakukan training set yang sudah diketahui label-labelnya untuk membangun model[15]. b. Proses testing Proses ini untuk mengetahui keakuratan model yang dibangun pada proses training, umumnya digunakan data yang disebut data test set untuk memprediksi label[15] Naïve Bayes Classifier Naïve Bayes Classifier adalah algoritma kalsifikasi yang mudah, sederhana dan paling umum digunakan untuk klasikasi dokumen. Langkah perhitungan Naïve Bayes Classifier adalah : Tabel Contoh data latih Dok Teks label
21 D1 terimakasih lazada barang pesanan saya C2(positif) sudah sampai dengan selamat pengemasan barang juga bagus. Good. D2 ngeri belanja di lazada banyak barang palsu C1(negatif) D3 suka belanja di lazada lengkap kualitas C2(positif) bagus harganya murah D4 barang di lazada jelek seperti dipasar C1(negatif) 1. Menentukan data uji Tabel Data Uji kapok belanja di lazada sudah transfer uang barang tidak dikirim 2 Menentukan probabilitas kategori dari data latih P(+) = P(-) = 3 Menghitung probabilitas kosakata (tf) dari data latih Tabel Frekuensi kata Kata D1 D2 D3 D4 Terimakasih Lazada Barang pesan Sampai Selamat Kemas
22 Bagus Ngeri Belanja Palsu Suka Lengkap Kualitas Harga Murah Jelek Pasar Menghitung probabilitas untuk setiap kelas data latih P(wk) = Dimana, P(wk) = probabilitas term Pk+1 = query + angka satu agar hasil perhitungan tidak nol n = semua jumlah kata yang muncul di outcome dokumen vocab = total kata keseluruhan a. Probabilitas untuk sentimen positif P(terimakasih +) = P(lazada +) = P(barang +) = P(pesan +) =
23 P(sampai +) = P(selamat +) = P(kemas +) = P(bagus +) = P(ngeri +) = P(belanja +) = P(palsu +) = P(suka +) = P(lengkap +) = P(kualitas +) = P(harga +) = P(murah +) = P(jelek +) = P(pasar +) = b. Probabilitas untuk sentimen negatif P(terimakasih -) = P(lazada -) = P(barang -) = P(pesan -) = P(sampai -) =
24 P(selamat -) = P(kemas -) = P(bagus -) = P(ngeri -) = P(belanja -) = P(palsu -) = P(suka -) = P(lengkap -) = P(kualitas -) = P(harga -) = P(murah -) = P(jelek -) = P(pasar -) = 5 Menentukan Vmap untuk data uji Vmap= P(wk c)xp(c) a. Vmap untuk sentimen positif P(positif) x P(kapok +) x P(belanja +) x P(lazada +) x P(uang +) x P(barang +) x P(- kirim +) = b. Vmap untuk sentimen negatif
25 P(negatif) x P(kapok -) x P(belanja -) x P(lazada -) x P(uang -) x P(barang -) x P(- kirim -) = (ini masuknya data uji) 6 Kasifikasi data uji Jadi data uji tersebut termasuk dalam kategori kelas negatif (-) karena nilai P(-) > P(+) Evaluasi dan Validasi Proses evaluasi dan validasi yamg digunakan yaitu K-Fold Cross Validation. Dataset dibagi menjadi sejumlah K-buah partisi secara acak. Kemudian dilakukan sejumlah K-kali percobaan, dimana masing-masing percobaan menggunakan data partisi ke-k sebagai data uji dan memanfaatkan sisa partisi lainnya sebagai data latih. Contohnya diambil 8 data untuk proses k-fold validation seperti dibawah ini : Tabel Dataset K1 K2 K3 K4 K5 K6 K7 K8 Tabel Data Eksperimen Data eksperimen Data Latih Data Uji ke- 1 K2,K3,K4,K5,K6,K7,K8 K1 2 K1,K3,K4,K5,K6,K7,K8 K2 3 K1,K2,K4,K5,K6,K7,K8 K3 4 K1,K2,K3,K5,K6,K7,K8 K4 5 K1,K2,K3,K4,K6,K7,K8 K5
26 6 K1,K2,K3,K4,K6,K7,K8 K6 7 K1,K2,K3,K4,K5,K6,K8 K7 8 K1,K2,K3,K4,K5,K6,K7 K8 Akurasi Akurasi = Dimana : TP (True Positive) merupakan jumlah data kelas positif yang diklasifikasikan sebagai kelas positif. TN (True Negative) merupakan jumlah data kelas negatif yang diklasifikasikan sebagai kelas negatif. FP (False Positive) merupakan jumlah data kelas negatif yang diklasifikasikan sebagai kelas positif. FN (False Negative) merupakan jumlah data kelas positif yang diklasifikasikan sebagai kelas negatif. Berikut ini contoh jika menggunakan data: Tabel Contoh Kalimat Tweet Kelas sebenarnya Kelas prediksi Hasil ayo belanja aman positif Positif TP tolong respon keluh konsumen positif negatif TN cari cewek ol cocok positif Positif FP call bicara robot bicara keluh negatif negatif FN
27 a. Pada dokumen pertama kelas sebenarnya adalah positif dan setelah di prediksi menunjukkan kelas positif maka hasil nilai prediksi benar (correct result) atau TP. b. Pada dokumen kedua kelas sebenarnya adalah positif dan setelah di prediksi menunjukkan kelas negatif maka hasil nilai prediksi tidak ada yang benar (correct absence result) atau TN. c. Pada dokumen pertama kelas sebenarnya adalah positif dan setelah di prediksi menunjukkan kelas positif dengan data tidak sesuai maka hasil tidak sesuai dengan nilai prediksi (unexpeted result) atau FP. d. Pada dokumen pertama kelas sebenarnya adalah negatif dan setelah di prediksi menunjukkan kelas negatif dengan data tidak sesuai maka hasil prediksi salah (missing result) atau FN Kerangka Pemikiran Tabel Kerangka Pikir
28 Masalah Konsumen sering kali bingung untuk menentukkan situs belanja online mana yang akan dipilih untuk berbelanja, sering membaca opini tetapi tidak dapat menyimpulkan karena data terlalu banyak. Tujuan Menyimpulkan opini masyarakat tentang situs belanja online yang memberikan pelayanan paling baik dengan menggunakan metode k- means untuk klastering dan metode naïve bayes untuk klasifikasi. Pendekatan Data Metode 1200 data yang sudah melalui K-means untuk clustering dan proses pre-pocessing dan Naïve Bayes Classifier untuk pemberian kelas dengan clustering klasifikasi. dibagi menjadi 2, 800 sebagai data latih dan 400 sebagai data uji dengan perbadingan yang sama setiap situs belanja online. Pengujian Pengujian metode dilakukan dengan k-fold cross validation Hasil Mengetahui situs belanja online mana yang terbaik menurut opini masyarakat dan mengetahui kinerja metode k-means dan naïve bayes.
29
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Situs belanja online sering disebut juga dengan situs e-commerce yaitu suatu proses membeli dan menjual produk-produk secara elektronik oleh konsumen dan dari perusahaan
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Liu opini merupakan pernyataan subyektif yang mencerminkan sentimen orang atau persepsi tentang entitas dan peristiwa [1]. Opini atau pendapat orang lain terhadap
BAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Kehadiran teknologi web yang interaktif telah merubah cara orang mengekspresikan pandangan dan opininya. Saat ini pengguna dapat menulis ulasan suatu produk pada situs
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan
BAB I PENDAHULUAN 1.1 Latar Belakang
1. BAB I PENDAHULUAN 1.1 Latar Belakang website adalah salah satu layanan yang bisa digunakan untuk melakukan pencarian berbagai informasi, sehingga sangat dibutuhkan untuk keperluan pengguna dalam pencarian
BAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER
JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER Oleh: AGUNG PRAMONO PUTRO 12.1.03.03.0276 Dibimbing oleh : 1. NURSALIM, S.Pd,. MH 2. ARIE NUGROHO, S.Kom.,
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1. 1.1 Latar Belakang Perkembangan dunia telekomunikasi meningkat secara signifikan dalam kurun waktu satu dekade terahir. Tidak hanya dari segi jumlah pengguna, jenis layanan yang ditawarkanpun
BAB 3 ANALISIS MASALAH DAN PERANCANGAN
BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk
BAB I PENDAHULUAN.
BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini smartphone telah berevolusi menjadi komputer pribadi kecil dan portabel yang memungkinkan pengguna untuk melakukan penjelajahan internet, mengirim e-mail
SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER
SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER Agung Pramono 1, Rini Indriati 2, Arie Nugroho 3, 1,2,3 Sistem Informasi, Fakultas Teknik, Universitas Nusantara PGRI Kediri E-mail: 1 [email protected],
BAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi dewasa ini sudah mempengaruhi kebutuhan manusia modern, hal ini ditandai dengan penggunaan teknologi disetiap aspek kehidupan manusia yang berguna
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database
BAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA Penelitian terdahulu sangat penting bagi penulis untuk mengetahui referensi dan hubungan antara penelitian terdahulu dengan penelitian yang dilakukan saat ini, sehingga hal duplikasi
3.1 Desain Penelitian
24 BAB 3 METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian merupakan tahapan yang akan dilakukan penulis dalam melakukan penelitian. Tahapan penelitian yang digunakan
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini, microblogging menjadi sangat popular untuk alat komunikasi antara pengguna internet. Setiap hari jutaan pesan muncul di website penyedia microblogging diantaranya
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan media online mendorong munculnya informasi tekstual yang tidak terbatas, sehingga muncul kebutuhan penyajian tanpa mengurangi nilai dari informasi tersebut.
BAB III METODOLOGI PENELITIAN
28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian
ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES
Analisis Sentimen pada Jasa Ojek Online... (Nugroho dkk.) ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES Didik Garbian Nugroho *, Yulison Herry Chrisnanto, Agung Wahana Jurusan
BAB I PENDAHULUAN 1.1. Latar Belakang
3 BAB I PENDAHULUAN 1.1. Latar Belakang Semakin banyaknya pengunaan teknologi informasi pada pemerintahan, dapat mempermudah masyarakat dalam pelayanan masyarakat itu sendiri. Seperti misalnya ketika sesorang
TEXT MINING DALAM ANALISIS SENTIMEN ASURANSI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER
F.7 TEXT MINING DALAM ANALISIS SENTIMEN ASURANSI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER Luthfia Oktasari *, Yulison Herry Chrisnanto, Rezki Yuniarti Program Studi Informatika, Fakultas Matematika dan
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah
BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang
1 BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang Intelligent agent, sebagai bagian dari kecerdasan buatan yang dapat diterapkan pada sistem dalam menyelesaikan sebuah permasalahan. Agen yang diterapkan
BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan
1 BAB I PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan media sosial menawarkan pengguna kesempatan untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan tidak lagi memiliki
UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah
1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja
ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES
F.4 ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES Raflialdy Raksanagara*, Yulison Herry Chrisnanto, Asep Id Hadiana Jurusan Informatika, Fakultas Matematika dan Ilmu Pengetahuan
BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Sumber opini teks saat ini tersedia berlimpah di internet akan tetapi belum sepenuhnya dimanfaatkan karena masih kurangnya tool yang ada, sedangkan perkembangan
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 1.1. Rancangan Penelitian Rancangan penelitian adalah rencana dan struktur penyelidikan yang disusun sedemikian rupa sehingga penelitian akan memperoleh jawaban untuk pertanyaan-pertanyaan
Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK
Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Opini adalah pendapat pribadi yang tidak obyektif dan tidak melalui proses verifikasi (Quirk et al., 1985). Opini orang lain tentang suatu hal menjadi penting dalam
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Text mining Menurut Feldman dan Sanger (Feldman dan Sanger, 2007), text mining dapat didefinisikan secara luas sebagai proses pengetahuan intensif yang memungkinkan pengguna berinteraksi
BAB II TINJAUAN PUSTAKA
digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter
Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor
Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Yusra 1, Dhita Olivita 2, Yelfi Vitriani 3 1,2,3 Jurusan Teknik
Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine
Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine Anita Novantirani 1, Mira Kania Sabariah S.T., M.T 2, Veronikha Effendy,
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Informasi telah menjadi kebutuhan utama dalam kehidupan manusia. Informasi bisa dikatakan sebagai pengetahuan yang didapatkan dari pembelajaran, pengalaman, atau instruksi.
PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES
1 BAB I PENDAHULUAN Dalam bab ini akan dibahas latar belakang dilaksanakannya penelitian, identifikasi masalah, batasan masalah, tujuan penelitian, manfaat penelitian, dan sistematika penulisan. Latar
Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk
Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma
ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE
DRAFT JURNAL ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE SENTIMENT ANALYSIS FOR TWITTER ABOUT ONLINE INDONESIAN TRANSPORTATION WITH
BAB IV IMPLEMENTASI DAN PENGUJIAN
90 BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Sistem Tahap ini merupakan tahap dari implementasi program serta implementasi dari setiap proses tahap penelitian. 4.1.2 Persiapan Arsitektur Pada
BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
BAB I PENDAHULUAN. 1.1 Latar belakang
BAB I PENDAHULUAN 1.1 Latar belakang Dalam beberapa tahun terakhir teknologi informasi dan telekomunikasi berkembang dengan pesat. Masyarakat mendapatkan manfaat dari tekonologi informasi dan telekomunikasi
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Selain sebagai media komunikasi, Twitter memberikan akses bagi pihak ketiga yang ingin mengembangkan aplikasi yang memanfaatkan layanannya melalui Twitter API. Salah
BAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)
BAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait Penelitian terkait dengan topik analisis sentimen cukup banyak, berikut beberapa penelitian yang tekait dengan analisa sentimen yang menggunakan seleksi
BAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1 Penelitian Terkait Pada bagian ini akan dipaparkan beberapa penelitian dengan domain yang sama, yakni terkait dengan analisis sentimen terhadap pelayanan perusahaan ataupun analisis
KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO
F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan
BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan
BAB I PENDAHULUAN 1.1 Latar Belakang Social media merupakan salah satu tren yang berkembang di masyarakat sebagai tempat untuk berinteraksi. Selain untuk berinteraksi dengan lingkungan sosialnya pengguna
BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak
BAB I PENDAHULUAN 1.1 Latar Belakang Berkembangnya teknologi informasi yang begitu pesat ini, banyak memberikan dampak positif maupun negatif khususnya di Indonesia. Dampak positifnya seperti, masyarakat
JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG
KLASIFIKASI ENTERTAINER BERDASARKAN TWEET MENGGUNAKAN METODE SCORING BERBASIS LEXICON BASED TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah
Agus Soepriadi, 2 Meta Permata. Jurusan Teknik Informatika, STMIK Bandung, Bandung, Indonesia
Jurnal Teknologi Informasi dan Komunikasi Vol. 4 No, Juni 05 SENTIMENT ANALYSIS UNTUK MENILAI KEPUASAN MASYARAKAT TERHADAP KINERJA PEMERINTAH DAERAH MENGGUNAKAN NAIVE BAYES CLASSIFIER (STUDI KASUS: WALIKOTA
Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram
Jurnal Ilmiah Teknologi dan Informasia ASIA (JITIKA) Vol.10, No.1, Februari 2016 ISSN: 0852-730X Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram Denny Nathaniel
Analisis Opini Terhadap Fitur Smartphone Pada Ulasan Website Berbahasa Indonesia
IJCCS, Vol.10, No.2, July 2016, pp. 183~194 ISSN: 1978-1520 Analisis Opini Terhadap Fitur Smartphone Pada Ulasan Website Berbahasa Indonesia 183 Doni Setyawan* 1, Edi Winarko 2 1 Program Studi S2 Ilmu
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Pemilihan Gubernur serentak untuk memilih para pemimpin rakyat akan dilaksanakan pada tahun 2017. Ini merupakan pemilihan kepala daerah serentak ke dua yang akan diselengarakan
BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA
BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA 3. Analisis Masalah Analisis masalah adalah suatu gambaran masalah yang diangkat dalam penulisan skripsi tentang Analisis sentimen pengguna twitter pada
Jurnal Evolusi Volume 4 Nomor lppm3.bsi.ac.id/jurnal
Penerapan Algoritma Genetika Untuk Seleksi Fitur Pada Analisis Sentimen Review Jasa Maskapai Penerbangan Menggunakan Naive Bayes Risa Wati Program Studi Manajemen Informatika, AMIK BSI Tasikmalaya [email protected]
BAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA Pada bab ini menjelaskan topik taksonomi yang merupakan pengorganisasian informasi yang penting karena merupakan dasar dalam memahami suatu informasi. Taksonomi membantu memahami
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini media sosial seperti Twitter telah berkembang pesat. Data global menyebut pada akhir Desember 2014 Twitter memiliki 284 juta pengguna aktif. Dick Costolo
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Apa yang orang lain pikirkan telah menjadi sesuatu yang penting untuk menjadi pertimbangan dalam pengambilan keputusan (Pang and Lee, 2006). Sesuatu yang orang lain
BAB I PENDAHULUAN I - 1
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dunia pendidikan merupakan dunia yang memerlukan perhatian khusus karena pendidikan merupakan faktor yang sangat mempengaruhi kualitas para calon penerus bangsa
ANALISA SENTIMEN MENGGUNAKAN NAÏVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP KENAIKAN HARGA JUAL ROKOK PADA MEDIA SOSIAL TWITTER
ANALISA SENTIMEN MENGGUNAKAN NAÏVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP KENAIKAN HARGA JUAL ROKOK PADA MEDIA SOSIAL TWITTER PUBLIKASI ILMIAH Disusun sebagai salah satu syarat menyelesaikan
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic
BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua
BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen
commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media
BAB III METODOLOGI PENELITIAN. Dataset
BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar
Bandung, Indonesia Bandung, Indonesia
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6353 Analisis dan Implementasi Pengklasifikasian Pesan Singkat pada Penyaringan SMS Spam Menggunakan Algoritma Multinomial Naïve
ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( )
ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. (0927050) Jurusan Sistem Komputer, Fakultas Teknik, Jalan Prof. Drg. Suria Sumantri
BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN Pada bagian ini akan dijelaskan tentang pendahuluan dalam penyusunan Laporan Penelitian. Pendahuluan meliputi latar belakang masalah, rumusan masalah, tujuan penelitian, batasan masalah,
BAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Seiring berkembangnya teknologi informasi saat ini maka berkembang pula perangkat perangkat yang mendukung guna akses informasi yang semakin dibutuhkan dalam waktu
ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA
ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA Prawidya Destarianto 1, Wahyu Kurnia Dewanto 2, Hermawan Arief Putranto 3 1,2,3 Jurusan, Teknologi
BAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan
ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED
ISSN : 2355-9365 e-proceeding of Engineering : Vol.3, No.2 Agustus 2016 Page 3654 ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED ASPECT LEVEL SENTIMENT CLASSIFICATION
Jurnal Evolusi Volume 4 Nomor lppm3.bsi.ac.id/jurnal
Penerapan Algoritma Genetika Untuk Seleksi Fitur Pada Analisis Sentimen Review Jasa Maskapai Penerbangan Menggunakan Naive Bayes Risa Wati Program Studi Manajemen Informatika, AMIK BSI Tasikmalaya [email protected]
IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA
IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,
BAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1 Analisis sentimen Analisis sentimen atau opinion mining merupakan proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen
2016 SISTEM PRED IKSI SPAM ACCOUNT PAD A MED IA SOSIAL TWITTER D ENGAN MENGGUNAKAN ALGORITMA C4.5
1 BAB I PENDAHULUAN Dalam bab ini akan dibahas latar belakang dilaksanakannya penelitian, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian sistematika penulisan. 1.1 Latar Belakang
BAB I. Pendahuluan. 1. Latar Belakang Masalah
BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan merupakan salah satu aspek penting di dalam kehidupan. Oleh karena itu, pendidikan mendapat perhatian besar dalam kehidupan masyarakat dan negara. Pendidikan
BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang,
BAB I PENDAHULUAN Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, metodologi, dan sistematika penulisan. 1.1 Latar Belakang
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan
BAB I PENDAHULUAN. 1.1 Latar Belakang. Mikroblog adalah salah satu bentuk blog yang memungkinkan
1.1 Latar Belakang BAB I PENDAHULUAN Mikroblog adalah salah satu bentuk blog yang memungkinkan penggunanya untuk berbagi konten digital. 1 Perbedaan mikroblog dengan blog biasa terletak pada ukuran posting.
Gambar 1. 1 Logo BukaLapak
BAB I PENDAHULUAN 1.1 Gambaran Umum Objek 1.1.1 Bukalapak Bukalapak merupakan salah satu online marketplace terkemuka di Indonesia yang dimiliki dan dijalankan oleh PT. Bukalapak. Seperti halnya situs
BAB III ANALISA DAN PERANCANGAN SISTEM
3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal
HERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT.
HERU SUSANTO 2209 105 030 Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT. LATAR BELAKANG Peran media jejaring sosial pada perkembangan teknologi komunikasi dan informasi;
1. BAB I PENDAHULUAN 1.1 Latar Belakang
1. BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini dunia telah memasuki era dimana masyarakat dapat secara bebas menyuarakan pendapat mereka di berbagai media, salah satunya melalui media sosial. Masyarakat
BAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1 Penelitian Terkait Pada bab ini akan dipaparkan penelitian terkait analisa sentiment, teknik atau metode dalam perancangan penilitian serta hal-hal terkait penilitian yang perlu
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Salah satu faktor penting penunjang globalisasi ialah internet. Semakin majunya teknologi internet menyebabkan banyaknya pengembang perangkat lunak membuat berbagai
EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN
EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik
BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma.
BAB II DASAR TEORI Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma. 2.1. Microsoft Visual Studio Microsoft Visual Studio adalah sebuah software yang
IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR
IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas
