PENGEMBANGAN METODE EKTRAKSI FITUR DALAM PENINGKATAN HASIL PERFORMA KLASIFIKASI SENTIMEN TWITTER

Ukuran: px
Mulai penontonan dengan halaman:

Download "PENGEMBANGAN METODE EKTRAKSI FITUR DALAM PENINGKATAN HASIL PERFORMA KLASIFIKASI SENTIMEN TWITTER"

Transkripsi

1 PENGEMBANGAN METODE EKTRAKSI FITUR DALAM PENINGKATAN HASIL PERFORMA KLASIFIKASI SENTIMEN TWITTER Amalia Anjani A. 1) dan Aris Tjahyanto 2) 1) Program Studi Magister Sistem Informasi, Institut Teknologi Sepuluh Nopember Jl. Jalan Raya ITS, Sukolilo, Surabaya, 60111, Indonesia 2) Jurusan Sistem Informasi, Institut Teknologi Sepuluh Nopember Jl. Jalan Raya ITS, Sukolilo, Surabaya, 60111, Indonesia ABSTRAK Saat ini jejaring sosial merupakan lumbung informasi bagi banyak pihak. Hal ini dikarenakan masyarakat lebih jujur dalam menyampaikan opininya melalui jejaring sosial yang salah satunya twitter. Hingga saat ini banyak penelitian dilakukan untuk menggali informasi tersebut yang salah satunya adalah klasifikasi sentimen. Dari banyak klasifikasi sentimen yang telah dilakukan, penelitian dengan menggunakan data jejaring sosial berbahasa Indonesia masih sedikit. Selain itu, klasifikasi sentimen pesan jejaring sosial berbahasa indonesia memiliki tantangan tersendiri yakni dari sisi penggunaan bahasa yakni bahasa dalam bentuk tidak baku. Dalam penelitian ini digunakan data pesan dari jejaring sosial twitter yang banyak digunakan oleh masyarakat Indonesia. Penelitian ini terfokus pada metode ekstraksi fitur dari pesan-pesan twitter yang menggunakan bahasa tidak baku. Metode esktraksi fitur ini merupakan kombinasi dari penghapusan stopwords, penghapusan karakter berulang, konversi emoticon, stemming modifikasi untuk bahasa tidak baku, dan konversi bahasa tidak baku menjadi bahasa baku. Metode ekstraksi fitur ini mengolah bahasa dengan struktur tidak baku tersebut menjadi fitur-fitur yang mampu mendukung peningkatan hasil klasifikasi. Pengklasifikasi yang digunakan adalah support vector machine yang telah terkenal keandalannya dalam klasifikasi teks. Dalam penelitian ini, hasil ekstraksi fitur yang dilakukan mampu mendukung hasil klasifikasi hingga akurasi sebesar 94.51%, persisi dan recall sebesar 94.50%, serta ROC Area sebesar Kata kunci: Ekstraksi Fitur, Klasifikasi Sentimen, SVM, Twitter. PENDAHULUAN Internet telah menjadi bagian bagi hampir sebagian besar masyarakat Indonesia, dibuktikan ditempatinya peringkat ke-enam sebagai pengguna Internet terbesar sedunia. Tingginya pengguna internet ini juga berbanding lurus dengan tingginya pengguna jejaring sosial di Indonesia salah satunya adalah twitter. Pada tahun 2013 tercatat bahwa Indonesia menempati peringkat ketiga di dunia dalam hal penggunaan jejaring media twitter (Tarigan, 2013). Twitter merupakan sistem yang membolehkan penggunanya untuk mengirim pesan yang diunggahnya kepada para followers-nya. Panjang karakter pada pesan yang diunggah dalam twitter hanya terbatas sebanyak 140 karakter (p cmag.com). Pesan yang diunggah tersebut tidak terbatas pada satu topik tertentu. Pengguna twitter dapat menyampaikan mengenai opininya mengenai suatu produk tertentu ( Ghiassi, 2013), mengenai layanan pada industri pariwisata (Sotiriadis, 2013), bahkan keadaan emosi yang mereka rasakan (Sari, 2014). Banyaknya informasi yang terkandung ini membuat banyak pihak untuk C-9-1

2 melakukan berbagai macam penelitian penggalian informasi yang salah satunya adalah melakukan penggalian informasi mengenai sentimen pengguna yakni dengan cara klasifikasi sentimen. Tantangan klasifikasi sentimen dengan menggunakan twitter sebagai sumber datanya adalah tatanan bahasa yang digunakan selain keterbatasan panjang karakter yakni sebanyak 140 karakter. Hal ini cukup menyulitkan untuk menggali sentimen seseorang dari konten tweet (da Silva, 2014) terutama dalam pengklasifikasian sentimen. Sumber data seperti berita, dokumen, situs, dan sejenisnya menggunakan bahasa dengan struktur baku berbeda dengan bahasa yang digunakan pada twitter. Bahasa yang digunakan pada twitter memiliki beberapa karakteristik yakni kata yang digunakan tidak mengikuti Kamus Besar Bahasa Indonesia (KBBI), pengulangan karakter yang tidak seharusnya, dan penulisan dengan mengubah karakter huruf menjadi karakter angka. Oleh karenanya perlu dilakukan normalisasi bahasa seperti yang dilakukan oleh Alexander Clark (Clark, 2003) dengan cara memperbaiki kata-kata yang salah ketik atau salah eja. Metode normalisasi yang dirancang oleh Alexander tersebut sayangnya berdasarkan pada teks berbahasa inggris yang berbeda dengan bahasa Indonesia. Penelitian yang dilakukan oleh Naradhipa melakukan pendekatan metode untuk normalisasi bahasa tidak baku berdasarkan bahasa Indonesia yakni dengan cara pengubahan karakter angka menjadi huruf, penghapusan karakter berulang, dan konversi bahasa tidak baku menjadi bahasa baku (Naradhipa, 2012). Klasifikasi sentimen dengan sumber data berbahasa Indonesia merupakan salah satu topik penelitian yang jumlahnya terbatas. Pada penelitian mengenai klasifikasi sentimen berbahasa Indonesia, para peneliti menggunakan berbagai pendekatan dalam praproses klasifikasi. Praproses klasifikasi merupakan tahap penting dalam klasifikasi (Ma'ady, 2014) yang terbagi menjadi dua yakni ekstraksi fitur dan seleksi fitur (Khan, 2010). Berbagai jenis metode ekstraksi fitur yang salah satunya normalisasi teks dilakukan untuk mengekstrak fitur penting dari pesan dari jejaring sosial berbahasa Indonesia. Berbagai jenis metode tersebut tersebar di berbagai penelitian yang seharusnya saling mendukung satu dengan yang lain. Wijaya melakukan ekstraksi fitur dengan cara menghapus tanda baca, melakukan tokenization, menghapus karakter yang tidak perlu atau karakter yang berulang (Wijaya, 2013). Sebelumnya Naradhipa juga melakukan hal yang serupa namun menambahkan proses pada tahap normalisasi teks yakni mengubah bahasa informal menjadi bahasa formal (Naradhipa, 2012). Pada penelitian lainnya dilakukan ekstraksi fitur mulai dari menghapus stopword, menghapus angka dan tanda baca, dan stemming, selain itu emoticon yang ada tidak dihapus (Sari, 2014). Berbagai metode yang tersebar tersebut dikombinasikan untuk mengekstrak fitur dari pesan-pesan jejaring sosial twitter berbahasa Indonesia. Hingga saat ini beberapa pengklasifikasi dasar yang umum digunakan dalam penelitian mengenai klasifikasi teks, antara lain naïve bayes classifier (NBC), support vector model (SVM), logistic regression, maksimum entropy (ME), multinominal random forest, dan K-nearest neighbor (KNN). Dari berbagai pengklasifikasi dasar tersebut SVM menghasilkan hasil yang lebih baik (Wijaya, 2013; Tan, 2008; Xia & Peng, 2009; Pang, Lee, & Vaithyanathan, 2002). Sebastiani mengutip pernyataan Joachim yang menyatakan bahwa SVM memberikan keuntungan dalam klasifikasi teks, yakni: SVM memiliki kecenderungan untuk memilimalisir kondisi overfitting, selain itu juga memiliki kemampuan untuk menangani fitur dengan dimensi yang besar (Sebastiani, 2002). Penelitian ini akan terfokus pada tahap ekstraksi fitur dan hasil ekstraksi fitur tersebut akan digunakan dalam proses klasifikasi dengan menggunakan pengklasifikasi SVM. Pada penelitian ini akan dilakukan pengujian kombinasi ekstraksi fitur yakni cleansing, tokenizing, case folding, stopping, konversi emoticon, stemming, dan konversi kata tidak baku. Dari hasil pengujian tersebut akan diketahui signifikansi kombinasi metode ekstraksi fitur tersebut dan peran setiap metode ekstraksi fitur. C-9-2

3 METODE Penelitian ini secara umum terbagi menjadi tiga yakni tahap penyiapan data, ekstraksi fitur, dan klasifikasi. Masing-masing tahap tersebut akan dijelaskan sebagai berikut. Tahap Penyiapan Data Penelitian ini menggunakan studi kasus penyedia layanan telekomunikasi di Indonesia. Hal ini dikarenakan masing-masing penyedia layanan telekomunikasi tersebut melayani dan berkomunikasi secara aktif melalui twitter. Pengumpulan pesan twitter ini menggunakan Twitter API Stream dengan menggunakan kata kunci: telkomsel, indosat, xl axiata, xl, smartfren, telkom, indosatcare, smartfrencare, xlcare, dan telkomcare. Data yang dikumpulkan adalah pesan teks yang mengandung kata kunci tersebut dan pesan yang diambil secara real time. Data yang telah terkumpul kemudian dipilah menjadi dua yakni pesan yang mengandung sentimen dan tidak mengandung sentimen yakni sentimen positif atau negatif. Pesan yang tidak mengandung sentimen tidak digunakan dalam penelitian ini, sedangkan pesan yang mengandung sentimen dipilah kembali menjadi dua kategori yakni sentimen positif dan sentimen negatif. Proses pemilahan pesan-pesan tersebut dilakukan secara manual. Hasil pengumpulan dan pemilahan data ini, terkumpul data sebanyak 1821 tweet dengan jumlah tweet positif sebanyak 1436 tweet dan tweet negatif sebanyak 385 tweet. Contoh pesan mengandung sentimen dan tidak dapat dilihat pada tabel berikut ini. Tabel 1. Contoh Pesan Twitter Mengandung Sentimen dan Tidak Mengandung Sentimen Jenis Contoh Tweet Non-sentimen Telkomsel Luncurkan Layanan 4G LTE di Medan maksudnya *363#? Iya, balasannya tetap sama kayak gitu. Sentimen Pake indosat jd makin happy krn sll ada promo-promo yg Sentimen negatif seperti inihujan XL gimana PULSA sih? :)) #LoveIndosat masa udah 2 hari sinyal 3G di rumahku masih aja berantakan????? -_- Selain pesan twitter yang akan diolah untuk diklasifikasikan, perlu dilakukan penyiapan data lainnya. Data lainnya adalah daftar stopwords yang didapatkan dari penelitian F. Tala yang berjudul A Study of Stemming Effect on Information Retrieval in Bahasa Indonesia (Tala, 2003). Daftar stopwords tersebut sedikit dimodifikasi dengan menambahkan daftar stopwords untuk menyesuaikan dengan data yang digunakan pada penelitian ini yang menggunakan bahasa tidak baku misalnya gue, cuman, kalo, ih, dan sebagainya. Selain itu juga ditambahkan stopwords yang merupakan singkatan dari kata stopword yang umum digunakan, misalnya klo, ja, dah, dan sebagainya. Selain itu, nama penyedia layanan telekomunikasi juga ditambahkan dalam daftar stopword ini. Kata-kata yang ditambahkan pada daftar stopwords tersebut merupakan kata-kata yang tidak memiliki ciri khusus terhadap suatu kategori tertentu. Selain daftar stopword, juga disipakan daftar kata dasar. Daftar kata dasar ini terbagi menjadi dua yakni daftar kata dasar baku dan daftar kata dasar tidak baku. Daftra kata dasar baku didapatkan dari KBBI, sedangkan daftar kata dasar tidak baku dibuat oleh peneliti. Daftar kata dasar ini digunakan pada proses stemming dan konversi kata tidak baku. Daftar emoticon juga disiapkan sebelum dilakukan proses ekstraksi fitur. Hal ini karena emoticon pada pesan twitter akan dikonversi menjadi kategori dari emoticon itu C-9-3

4 sendiri sehingga meminimalisir keberagaman emoticon yang memiliki maksud yang sama. Daftar emoticon dan ketegorinya dapat dilihat pada Tabel 2 berikut ini. Tabel 2. Daftar Emoticon Kategori Emotico Positif :) :-) =) :d ;) ;-) :3 =d ^^ ^_^ xd x-d Negatif :( :-( =( ;( ;-( x_x -_- =_= : :/ Tahap Ekstraksi Fitur Pada tahap ini dirancang kombinasi berbagai metode ekstraksi fitur yang didapatkan dari berbagai penelitian mengenai klasifikasi teks. Tahap ekstraksi fitur ini dapat dilihat pada Gambar 1. Gambar 1. Metode Ekstraksi Fitur Tahap pertama dari metode esktraksi fitur ini adalah noise cleansing yakni menghapus hal-hal yang umum terdapat pada pesan twitter misalnya mention, url, dan sebagainya. tahap berikutnya adalah case folding yang menghapus karakter-karakter selain huruf dan karakter lain yang digunakan pada emoticon, serta mengubah semua karakter yang tersisa menjadi huruf kecil. Tahap ketiga adalah tokenization yang memecah tweet menjadi token yakni kata per kata. Tahap berikutnya adalah menghapus karakter berulang, tahap ini dilakukan sebelum proses kebahasaan (stopping, stemming, konversi kata tidak baku) dan konversi emoticon karena penulisan kata tidak baku pada pesan tweet salah satunya adalah penulisan dengan karakter berulang misalnya senneeeng, kezzzeeel, ;(((((, - -, dan sebagainya. Pengulangan karakter yang tidak perlu ini perlu dihapus sehingga dapat diolah pada tahap-tahap setelahnya. Tahap kelima adalah stopping yakni penghapusan stopword dengan membandingkan dengan daftar stopword yang telah dibuat. Setelah stopword dihapus tahap berikutnya adalah konversi emoticon menjadi kategori emoticon-nya. Proses berikutnya adalah stemming yakni mengubah kata menjadi bentuk kata dasarnya. Stemming yang digunakan pada penelitian ini adalah stemming yang dirancang khusus untuk masukan kata tidak baku. Stemming ini dibuat dari confix- stripping stemmer (Asian, 2007) dengan modifikasi beberapa hal yakni menambahkan akhiran -in, C-9-4

5 menambah aturan rule precedence menyesuaikan tambahan imbuhan, dan menggunakan dua kamus yakni kamus kata dasar bahasa baku dan kamus kata dasar bahasa tidak baku. Tahap terakhir adalah mengubah token berbentuk kata tidak baku menjadi bentuk kata bakunya. Hal ini karena pada penulisan pesan twitter digunakan kata tidak baku yang bercampur dengan kata baku, sehingga kata-kata tidak baku tersebut perlu diubah menjadi bentuk bakunya sehingga kata yang memiliki maksud yang sama tidak memiliki bentuk yang berbeda-beda. Tahap Klasifikasi Klasifikasi dilakukan dengan menggunakan pengklasifikasi SVM dengan kernel linier. Pada penelitian ini evaluasi dilakukan menggunakan k-fold cross-validation yakni menggunakan 10 folds. Dimana semua data yang terkumpul akan dibagi ke dalam sepuluh kelompok (10 folds) atau dapat disebut sebagai 10-cross-validation (Refaeilzadeh, Tang, & Liu, 2009). Secara bergantian sembilan kelompok akan dijadikan data latih dan satu kelompok akan dijadikan data uji. Pembagian data latih dan uji dilakukan secara acak oleh pengklasifikasi. Data latih tersebut menjadi dasar untuk pembuatan model klasifikasi yang nantinya akan menjadi dasar dalam memprediksikan kelas dari data uji. Evaluasi dilakukan dengan membandingkan hasil prediksi klasifikasi data uji dengan kelas aslinya. Oleh karena evaluasi menggunakan 10-cross-validation maka dari tahap pembagian data hingga tahap perhitungan performa dilakukan sebanyak 10 kali. Hasil evaluasi performa yang dihasilkan merupakan hasil rata-rata dari masing- masing fold. HASIL DAN PEMBAHASAN Pada penelitian ini dilakukan delapan jenis uji coba. Pengujian pertama dilakukan tanpa melalui proses ekstraksi fitur. Pengujian kedua dilakukan dengan menggunakan kombinasi metode ekstraksi fitur yang telah dirancang namun dikurangi tahap penghapusan karakter berulang. Hal ini dimaksudkan sama dengan pengujian ketiga hingga keenam sesuai dengan pengurangan tahap yang dapat dilihat pada Tabel 3. Pada pengujian ketujuh dilakukan dengan menggunakan kombinasi metode ekstraksi fitur yang telah dirancang. Pengujian pertama hingga ketujuh dilakukan dengan pengklasifikasi SVM. Hasil evaluasi performa klasifikasi pada masing-masing pengujian dapat dilihat pada Tabel 3. Dari hasil uji coba pada Tabel 3 dapat diketahui bahwa tahap ekstraksi fitur yang mampu menghasilkan performa hasil klasifikasi terbaik didapatkan dari seluruh kombinasi tahap ekstraksi fitur yakni cleansing, case folding, tokenizing, penghapusan pengulangan karakter, stopping, konversi emoticon, stemming, dan konversi bahasa tidak baku. Hasil evaluasi menunjukkan hasil akurasi yang baik dan jika dinilai dari ROC-Area menghasilkan prediksi akurasi yang tinggi (>0.90).Sedangkan hasil terendah didapatkan jika klasifikasi tidak menggunakan salah satu tahap ekstraksi fitur tersebut. Hasil ini menunjukkan bahwa proses ekstraksi fitur memberikan dampak bagi hasil klasifikasi dengan menghilangkan token-token yang tidak memiliki maksud dan juga menurunkan tingkat keberagaman token. Tabel 3. Hasil Evaluasi Klasifikasi Masing-Masing Pengujian No Jenis Uji Akurasi Precission Recall F-Measures ROC- 1 Tanpa proses ekstraksi fitur 91.65% 91.50% 91.70% 91.50% Area Tanpa penghapusan karakter 93.52% 93.40% 93.50% 93.40% berulang 3 Tanpa stopping 93.03% 92.90% 93.00% 93.00% Tanpa konversi 92.09% 91.90% 92.10% 91.90% emoticon Tanpa stemming 94.12% 94.10% 94.10% 94.10% C-9-5

6 No Jenis Uji Akurasi Precission Recall F-Measures ROC- 6 Tanpa konversi kata 91.71% 91.50% 91.70% 91.40% Dengan seluruh metode ekstraksi 94.51% 94.50% 94.50% 94.50% Tahap ekstraksi fitur tanpa tahap konversi bahasa tidak baku menghasilkan perhitungan performa yakni nilai akurasi, presisi, recall, dan f-measures rendah dengan nilai ROC-Area juga terendah dari uji coba lainnya yakni sebesar yang berarti akurasi prediksi pada level menengah ( ). Sehingga dapat disimpulkan bahwa konversi bahasa tidak baku memiliki peran yang cukup signifikan dalam proses ekstraksi fitur. Hal ini memungkinkan karena satu bahasa baku memiliki berbagai bentuk bahasa tidak baku misalnya kata lambat memiliki bentuk tidak baku lemot dan lola. Konversi bentuk bahasa tidak baku tersebut menurunkan tingkat keberagaman kata yang berarti juga menurunkan tingkat keberagaman fitur yang memiliki arti yang sama. Untuk posisi ketiga terendah dihasilkan oleh proses ekstraksi fitur tanpa melibatkan tahap konversi emoticon. Proses konversi emoticon memiliki peran penting dalam proses ekstraksi fitur. Hal ini memungkinkan karena konversi emoticon yang dilakukan dapat menurunkan tingkat keberagamannya. Proses ekstraksi fitur yang tidak melibatkan proses stopping berada pada posisi empat terendah yang menghasilkan nilai akurasi, presisi, recall, dan f-measures sebesar 93.03%, 92.90%, 93.00%, dan 93.00% serta ROC Area sebesar Proses stopping memang telah dibuktikan pada penelitian mengenai klasifikasi teks bahwa tahap penghapusan stopword memiliki peran penting dalam proses ekstraksi fitur. Penghapusan stopword tersebut akan mengurangi jumlah fitur yang tidak memiliki ciri khusus terhadap suatu kategori sehingga lebih baik jika dihapus, karena jika dibiarkan stopword tersebut hanya akan membebani pengklasifikasi dan juga dapat menyebabkan salah klasifikasi. Proses ekstraksi fitur tanpa melibatkan proses stemming rupanya tidak menghasilkan hasil yang berbeda jauh dengan kombinasi seluruh proses ekstraksi fitur, nilai akurasi, presisi, recall, dan f-measures yang dihasilkan hanya sebesar 94.12%, 94.10%, 94.10%, dan 94.10% serta nilai ROC Area diatas 0.90 yakni sebesar Dari hasil tersebut dapat dinyatakan bahwa tahap stemming tidak memiliki peran yang cukup signifikan dalam proses ekstraksi fitur pada penelitian ini. Stemming tidak berjalan dengan optimal rupanya dikarenakan oleh tahap sebelumnya yakni tahap penghapusan karakter berulang. Tahap penghapusan karakter berulang akan menghapus pengulangan karakter yang sering digunakan pada penulisan bahasa tidak baku misalnya seneeeeng atau luuucccuuuu, dan lain sebagainya, tetapi rupanya tahap ini juga akan menghilangkan pengulangan karakter yang semestinya tidak dihilangkan misalnya maaf sehingga menjadi maf. Jika kata maaf ditambahkan dengan imbuhan misalnya maafin maka menjadi mafin, dan kata tersebut tidak dapat diproses dengan benar oleh stemmer karena kata maf tidak terdapat dalam kamus. Selain itu, kata yang memiliki karakter berakhiran n kemudian mendapat imbuhan nya juga menjadi korban proses ini misalnya hujannya akan berubah menjadi hujanya. Hal ini tentunya tidak dapat diproses oleh stemmer karena tidak ada imbuhan ya. Hal ini menjadi alasan mengapa tahap stemmer tidak mampu mendorong hasil klasifikasi dengan optimal.tetapi jika proses penghapusan karakter berulang tidak dilibatkan maka keseluruhan proses ekstraksi fitur tersebut hanya mencapai nilai akurasi, presisi, recall, dan f-measures sebesar 93.52%, 93.40%, 93.50%, dan 93.40% serta nilai ROC Area sebesar Tahap penghapusan karakter berulang ini juga tidak dapat dipindahkan posisinya karena jika dipindahkan setelah proses stemming, maka tetap saja proses stemming tidak dapat berjalan optimal karena kata-kata masukannya memiliki karakter yang berulang misalnya seneeengkan atau lembuuuutin dan pada akhirnya tidak dapat diproses oleh stemmer. Selain itu, penghapusan karakter berulang C-9-6

7 ini juga memiliki dampak bagi konversi emoticon karena penulisan karakter emoticon banyak yang menggunakan pengulangan karakter ini misalnya - - atau ;)))). Karakter yang diulang-ulang tersebut harus dihilangkan untuk memudahkan proses konversi emoticon. KESIMPULAN DAN SARAN 1. Kombinasi seluruh metode ekstraksi fitur yang telah dirancang menghasilkan performa klasifikasi terbaik dengan nilai akurasi, presisi, recall, dan f-measures sebesar 94.51%, 94.50%, 94.50%, dan 94.50% serta nilai ROC Area yang baik yakni sebesar (level prediksi tinggi). Sedangkan jika data tidak melalui tahap ekstraksi fitur, performa klasifikasi yang dihasilkan memiliki nilai paling rendah. 2. Tahap konversi bahasa tidak baku memiliki peran paling penting dalam ekstraksi fitur yang diikuti oleh tahap konversi emoticon, stopping, dan penghapusan karakter berulang. Stemming memiliki peran terendah dalam peningkatan performa klasifikasi. Hal tersebut dikarenakan tahap stemming tidak mampu bekerja dengan optimal. Akan tetapi dari hasil-hasil ini dapat diketahui bahwa seluruh tahapan dalam proses ekstraksi fitur tersebut saling mendukung untuk menghasilkan performa klasifikasi terbaik. Saran untuk penelitian selanjutnya adalah: 1. Alur atau urutan kombinasi metode yang kurang sempurna, yakni pada tahap penghapusan karakter berulang yang akan berdampak pada tahap-tahap selanjutnya walaupun dampak yang dihasilkan bersifat positif namun juga negative.oleh karenanya diperlukan modifikasi tertentu pada alur metode ekstraksi fitur. 2. Penelitian ini tidak mengakomodasi singkatan, sehingga perlu ditambahkan tahap untuk mengakomodasi penulisan dalam bentuk singkatan. Hal ini diperlukan karena penulisan beberapa kata berbeda tergantung penulisan singkatan oleh penulis, padahal kata-kata tersebut memiliki bentuk kata yang sama. DAFTAR PUSTAKA Asian, J. A. (2007). Stemming Indonesian : a confix-stripping approach. ACM Trnsactions on Asian Language Information Processing (TALIP), 6(4), Clark, A. &. (2003). Pre-Processing Very Noisy Text. In Proc. of Workshop on Shallow Processing of Large Corpora. da Silva, N. F. (2014). Tweet sentiment analysis with classifier ensembles. Decision Support Systems, 66, Ghiassi, M. S. (2013). Twitter brand sentiment analysis: A hybrid system using n-gram analysis and dynamic artificial neural network. Expert Systems with applications, 40(16), Khan, A. B. (2010). A Review of Machine Learning Algorithms for Text-Documents Classification. Journal of Advances in information Technology. Ma'ady, M. D. (2014). Implementation of Text Classification for Twitter Data Mapping of Telkomsel Customers in The Form of Heat Map. International Research Conference on Business, Economics, and Social Science, (pp ). Naradhipa, A. R. (2012). Sentiment classification for Indonesian message in social media. In Cloud Computing and Social Networking (ICCCSN) (pp. 1-5). IEEE. C-9-7

8 Pang, B., Lee, L., & Vaithyanathan, S. (2002). Thumbs up?: sentiment classification using machine learning techniques. In Proceedings of the ACL-02 conference on Empirical methods in natural language processing-volume 10 (pp ). Association for Computational Linguistics. pcmag.com. (n.d.). encyclopedia. Retrieved March 9, 2015, from pcmag.com: Refaeilzadeh, P., Tang, L., & Liu, H. (2009). Cross-validation. In Encyclopedia of database systems (pp ). USA: Springer. Sari, Y. A. (2014). USER EMOTION IDENTIFICATION IN TWITTER USING SPECIFIC FEATURES: HASHTAG, EMOJI, EMOTICON, AND ADJECTIVE TERM. Jurnal Ilmu Komputer dan Informasi, 7(1), Sebastiani, F. (2002). Machine Learning in Automated Text Categorization. ACM computing surveys (CSUR), 34(1), Sotiriadis, M. D. (2013). Electronic word-of-mouth and online reviews in tourism services: the use of twitter by tourists. Electronic Commerce Research, 13(1), Tala, a. Z. (2003). A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia. Netherlands: Master of Logic Project. Institute for Logic, Language and Computation, Universiteit van Amsterdam. Tan, S. &. (2008). An empirical study of sentiment analysis for chinese documents. Expert System with Applications, 34(4), Tarigan, I. A. (2013, November 21). Pengguna Twitter Indonesia Teraktif Ketiga di Dunia. Retrieved Maret 9, 2015, from Chip Online id: Wijaya, V. E. (2013). Automatic mood classification of Indonesian tweets using linguistic approach. In Information Technology and Electrical Engineering (ICITEE) (pp ). IEEE. Xia, H., & Peng, L. (2009). SVM-Based Comments Classification and Mining of Virtual Community: For Case of Sentiment Classification of Hotel Reviews. Proceedings of the International Symposium on Intelligent Information Systems and Applications (pp ). Qingdao: Academy Publisher. C-9-8

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1. 1.1 Latar Belakang Perkembangan dunia telekomunikasi meningkat secara signifikan dalam kurun waktu satu dekade terahir. Tidak hanya dari segi jumlah pengguna, jenis layanan yang ditawarkanpun

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

Bandung, Indonesia Bandung, Indonesia

Bandung, Indonesia Bandung, Indonesia ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6353 Analisis dan Implementasi Pengklasifikasian Pesan Singkat pada Penyaringan SMS Spam Menggunakan Algoritma Multinomial Naïve

Lebih terperinci

KLASIFIKASI ARTIKEL BERITA BERBAHASA INDONESIA BERBASIS NAÏVE BAYES CLASSIFIER MENGGUNAKAN CONFIX-STRIPPING STEMMER

KLASIFIKASI ARTIKEL BERITA BERBAHASA INDONESIA BERBASIS NAÏVE BAYES CLASSIFIER MENGGUNAKAN CONFIX-STRIPPING STEMMER 1 KLASIFIKASI ARTIKEL BERITA BERBAHASA INDONESIA BERBASIS NAÏVE BAYES CLASSIFIER MENGGUNAKAN CONFIX-STRIPPING STEMMER Amalia Anjani A. 1, Arif Djunaidy 2, Renny P. Kusumawardani 3 Jurusan Sistem Informasi,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA Tugas Akhir Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan 1 BAB I PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan media sosial menawarkan pengguna kesempatan untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan tidak lagi memiliki

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Liu opini merupakan pernyataan subyektif yang mencerminkan sentimen orang atau persepsi tentang entitas dan peristiwa [1]. Opini atau pendapat orang lain terhadap

Lebih terperinci

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA Prawidya Destarianto 1, Wahyu Kurnia Dewanto 2, Hermawan Arief Putranto 3 1,2,3 Jurusan, Teknologi

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Apa yang orang lain pikirkan telah menjadi sesuatu yang penting untuk menjadi pertimbangan dalam pengambilan keputusan (Pang and Lee, 2006). Sesuatu yang orang lain

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Selain sebagai media komunikasi, Twitter memberikan akses bagi pihak ketiga yang ingin mengembangkan aplikasi yang memanfaatkan layanannya melalui Twitter API. Salah

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang website adalah salah satu layanan yang bisa digunakan untuk melakukan pencarian berbagai informasi, sehingga sangat dibutuhkan untuk keperluan pengguna dalam pencarian

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini, microblogging menjadi sangat popular untuk alat komunikasi antara pengguna internet. Setiap hari jutaan pesan muncul di website penyedia microblogging diantaranya

Lebih terperinci

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA Sigit Prasetyo Karisma Utomo 1, Ema Utami 2, Andi Sunyoto 3 1,2,3 Magister Teknik Informatika STMIK AmikomYogyakarta e-mail: 1 aku@sigitt.com,

Lebih terperinci

IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR

IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas

Lebih terperinci

HERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT.

HERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT. HERU SUSANTO 2209 105 030 Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT. LATAR BELAKANG Peran media jejaring sosial pada perkembangan teknologi komunikasi dan informasi;

Lebih terperinci

DETEKSI SUBJEKTIFITAS TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE LEXICON RULE BASED

DETEKSI SUBJEKTIFITAS TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE LEXICON RULE BASED DETEKSI SUBJEKTIFITAS TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE LEXICON RULE BASED Tugas Akhir Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Achmad Ridok 1), Retnani Latifah 2) Filkom

Lebih terperinci

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah Bab 1 PENDAHULUAN 1.1 Latar Belakang Masalah Semakin hari semakin banyak inovasi, perkembangan, dan temuan-temuan yang terkait dengan bidang Teknologi Informasi dan Komputer. Hal ini menyebabkan semakin

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN. 1.1 Latar belakang BAB I PENDAHULUAN 1.1 Latar belakang Dalam beberapa tahun terakhir teknologi informasi dan telekomunikasi berkembang dengan pesat. Masyarakat mendapatkan manfaat dari tekonologi informasi dan telekomunikasi

Lebih terperinci

BAB I PENDAHULUAN.

BAB I PENDAHULUAN. BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini smartphone telah berevolusi menjadi komputer pribadi kecil dan portabel yang memungkinkan pengguna untuk melakukan penjelajahan internet, mengirim e-mail

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 12, Desember 2017, hlm. 1725-1732 http://j-ptiik.ub.ac.id Analisis Sentimen Tingkat Kepuasan Pengguna Penyedia Layanan

Lebih terperinci

1. BAB I PENDAHULUAN 1.1 Latar Belakang

1. BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini dunia telah memasuki era dimana masyarakat dapat secara bebas menyuarakan pendapat mereka di berbagai media, salah satunya melalui media sosial. Masyarakat

Lebih terperinci

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma

Lebih terperinci

ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES

ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES Analisis Sentimen pada Jasa Ojek Online... (Nugroho dkk.) ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES Didik Garbian Nugroho *, Yulison Herry Chrisnanto, Agung Wahana Jurusan

Lebih terperinci

ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE

ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE SENTIMENT ANALYSIS ON THE ENGLISH BOOK REVIEWS USING INFORMATION GAIN AND SUPPORT VECTOR MACHINE

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE Jurnal Informatika Polinema ISSN: 2407-070X IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE Faisal Rahutomo 1, Pramana Yoga Saputra 2, Miftahul Agtamas

Lebih terperinci

3.1 Desain Penelitian

3.1 Desain Penelitian 24 BAB 3 METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian merupakan tahapan yang akan dilakukan penulis dalam melakukan penelitian. Tahapan penelitian yang digunakan

Lebih terperinci

Analisis Sentimen Twitter untuk Teks Berbahasa Indonesia dengan Maximum Entropy dan Support Vector Machine

Analisis Sentimen Twitter untuk Teks Berbahasa Indonesia dengan Maximum Entropy dan Support Vector Machine IJCCS, Vol.8, No.1, January 2014, pp. 91~100 ISSN: 1978-1520 91 Analisis Sentimen Twitter untuk Teks Berbahasa Indonesia dengan Maximum Entropy dan Support Vector Machine Noviah Dwi Putranti* 1, Edi Winarko

Lebih terperinci

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Yusra 1, Dhita Olivita 2, Yelfi Vitriani 3 1,2,3 Jurusan Teknik

Lebih terperinci

IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET

IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang

Lebih terperinci

BAB I.PENDAHULUAN Latar Belakang Masalah Perumusan Masalah

BAB I.PENDAHULUAN Latar Belakang Masalah Perumusan Masalah 1 BAB I.PENDAHULUAN 1.1 Latar Belakang Masalah Sosial media seperti Twitter telah menciptakan sebuah wadah bagi orang untuk menyebarkan informasi, pemikiran atau pun perasaan tentang kehidupan mereka sehari-hari.

Lebih terperinci

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE DRAFT JURNAL ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE SENTIMENT ANALYSIS FOR TWITTER ABOUT ONLINE INDONESIAN TRANSPORTATION WITH

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kemajuan dibidang teknologi informasi dan telekomunikasi berdampak pada munculnya berbagai media sosial, seperti Twitter. Twitter didirikan oleh Jack Dorsey, Biz Stone,

Lebih terperinci

Implementasi Stemmer Tala pada Aplikasi Berbasis Web

Implementasi Stemmer Tala pada Aplikasi Berbasis Web Mardi Siswo Utomo Program Studi Teknik Informatika, Universitas Stikubank email : mardiutomo@gmail.com Abstrak Stemming adalah proses untuk mencari kata dasar pada suatu kata. Pada analisa temu kembali

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,

Lebih terperinci

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan BAB I PENDAHULUAN Sebagai negara berkembang, perekonomian Indonesia didorong untuk tumbuh dengan pesat. Salah satu indikator pertumbuhan perekonomian yang baik adalah tingginya daya beli masyarakat. Tingginya

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Penelitian terdahulu sangat penting bagi penulis untuk mengetahui referensi dan hubungan antara penelitian terdahulu dengan penelitian yang dilakukan saat ini, sehingga hal duplikasi

Lebih terperinci

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES F.4 ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES Raflialdy Raksanagara*, Yulison Herry Chrisnanto, Asep Id Hadiana Jurusan Informatika, Fakultas Matematika dan Ilmu Pengetahuan

Lebih terperinci

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama

Lebih terperinci

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

LAPORAN TUGAS AKHIR. Disusun oleh: Franky LAPORAN TUGAS AKHIR Analisis Sentimen Menggunakan Metode Naive Bayes, Maximum Entropy, dan Support Vector Machine pada Dokumen Berbahasa Inggris dan Dokumen Berbahasa Indonesia Hasil Penerjemahan Otomatis

Lebih terperinci

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES 1 BAB I PENDAHULUAN Dalam bab ini akan dibahas latar belakang dilaksanakannya penelitian, identifikasi masalah, batasan masalah, tujuan penelitian, manfaat penelitian, dan sistematika penulisan. Latar

Lebih terperinci

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir

Lebih terperinci

Agus Soepriadi, 2 Meta Permata. Jurusan Teknik Informatika, STMIK Bandung, Bandung, Indonesia

Agus Soepriadi, 2 Meta Permata. Jurusan Teknik Informatika, STMIK Bandung, Bandung, Indonesia Jurnal Teknologi Informasi dan Komunikasi Vol. 4 No, Juni 05 SENTIMENT ANALYSIS UNTUK MENILAI KEPUASAN MASYARAKAT TERHADAP KINERJA PEMERINTAH DAERAH MENGGUNAKAN NAIVE BAYES CLASSIFIER (STUDI KASUS: WALIKOTA

Lebih terperinci

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM Laporan Tugas Akhir Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan media online mendorong munculnya informasi tekstual yang tidak terbatas, sehingga muncul kebutuhan penyajian tanpa mengurangi nilai dari informasi tersebut.

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Situs jejaring sosial merupakan gaya hidup sosial baru yang muncul seiring berkembangnya internet. Gaya hidup baru tersebut memiliki ruang lingkup yang lebih luas

Lebih terperinci

TEXT MINING DALAM ANALISIS SENTIMEN ASURANSI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER

TEXT MINING DALAM ANALISIS SENTIMEN ASURANSI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER F.7 TEXT MINING DALAM ANALISIS SENTIMEN ASURANSI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER Luthfia Oktasari *, Yulison Herry Chrisnanto, Rezki Yuniarti Program Studi Informatika, Fakultas Matematika dan

Lebih terperinci

Klasifikasi Akun Prostitusi Berdasarkan Skoring Tweet

Klasifikasi Akun Prostitusi Berdasarkan Skoring Tweet Klasifikasi Akun Prostitusi Berdasarkan Skoring Tweet Yufis Azhar Program Studi Teknik Informatika Fakultas Teknik, Universitas Muhammadiyah Malang Email : yufis.az@gmail.com ABSTRAK Keberadaan media sosial

Lebih terperinci

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang 1 BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang Intelligent agent, sebagai bagian dari kecerdasan buatan yang dapat diterapkan pada sistem dalam menyelesaikan sebuah permasalahan. Agen yang diterapkan

Lebih terperinci

SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER

SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER Anindya Apriliyanti P. Departemen Statistika FMIPA Universitas Padjadjaran a.apriliyanti.p@gmail.com

Lebih terperinci

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM : PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI Oleh : SEPTIAN BAGUS WAHYONO NPM : 0734010126 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS

Lebih terperinci

Metode K-Means untuk Optimasi Klasifikasi Tema Tugas Akhir Mahasiswa Menggunakan Support Vector Machine (SVM)

Metode K-Means untuk Optimasi Klasifikasi Tema Tugas Akhir Mahasiswa Menggunakan Support Vector Machine (SVM) Scientific Journal of Informatics Vol. 3, No. 1, Mei 20xx p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Metode K-Means untuk Optimasi Klasifikasi Tema Tugas Akhir Mahasiswa

Lebih terperinci

ANALISIS SENTIMEN HATESPEECH PADA TWITTER DENGAN METODE NAÏVE BAYES CLASSIFIER DAN SUPPORT VECTOR MACHINE

ANALISIS SENTIMEN HATESPEECH PADA TWITTER DENGAN METODE NAÏVE BAYES CLASSIFIER DAN SUPPORT VECTOR MACHINE Jurnal Dinamika Informatika Volume 5, Nomor 2, September 2016 ISSN 1978-1660 ANALISIS SENTIMEN HATESPEECH PADA TWITTER DENGAN METODE Ghulam Asrofi Buntoro Program Studi Informatika Fakultas Teknik Universitas

Lebih terperinci

JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG

JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG KLASIFIKASI ENTERTAINER BERDASARKAN TWEET MENGGUNAKAN METODE SCORING BERBASIS LEXICON BASED TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Opini adalah pendapat pribadi yang tidak obyektif dan tidak melalui proses verifikasi (Quirk et al., 1985). Opini orang lain tentang suatu hal menjadi penting dalam

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Situs belanja online sering disebut juga dengan situs e-commerce yaitu suatu proses membeli dan menjual produk-produk secara elektronik oleh konsumen dan dari perusahaan

Lebih terperinci

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

OPTIMALISASI SUPPORT VEKTOR MACHINE (SVM) UNTUK KLASIFIKASI TEMA TUGAS AKHIR BERBASIS K-MEANS

OPTIMALISASI SUPPORT VEKTOR MACHINE (SVM) UNTUK KLASIFIKASI TEMA TUGAS AKHIR BERBASIS K-MEANS TELEMATIKA, Vol. 13, No. 02, JULI, 2016, Pp. 59 68 ISSN 1829-667X OPTIMALISASI SUPPORT VEKTOR MACHINE (SVM) UNTUK KLASIFIKASI TEMA TUGAS AKHIR BERBASIS K-MEANS Oman Somantri (1), Slamet Wiyono (2), Dairoh

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini media sosial seperti Twitter telah berkembang pesat. Data global menyebut pada akhir Desember 2014 Twitter memiliki 284 juta pengguna aktif. Dick Costolo

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

ANALISA SENTIMEN MENGGUNAKAN NAÏVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP KENAIKAN HARGA JUAL ROKOK PADA MEDIA SOSIAL TWITTER

ANALISA SENTIMEN MENGGUNAKAN NAÏVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP KENAIKAN HARGA JUAL ROKOK PADA MEDIA SOSIAL TWITTER ANALISA SENTIMEN MENGGUNAKAN NAÏVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP KENAIKAN HARGA JUAL ROKOK PADA MEDIA SOSIAL TWITTER PUBLIKASI ILMIAH Disusun sebagai salah satu syarat menyelesaikan

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN Bab ini akan menjelaskan latar belakang dari penelitian yang memberikan gambaran awal mengenai analisis sentimen dan perannya dalam perkembangan teknologi informasi. Tujuan dan ruang

Lebih terperinci

PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS

PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS Halimatus Sa dyah, Nurissaidah Ulinnuha Jurusan Teknik Informatika, Fakultas Teknologi

Lebih terperinci

Text Pre-Processing. M. Ali Fauzi

Text Pre-Processing. M. Ali Fauzi Text Pre-Processing M. Ali Fauzi Latar Belakang Latar Belakang Dokumen-dokumen yang ada kebanyakan tidak memiliki struktur yang pasti sehingga informasi di dalamnya tidak bisa diekstrak secara langsung.

Lebih terperinci

Abstrak. Kata Kunci : Aplikasi Chat, Text Mining, Spam filtering. vii

Abstrak. Kata Kunci : Aplikasi Chat, Text Mining, Spam filtering. vii Abstrak Internet telah menjadi sesuatu hal yang penting dalam perkembangan sarana komunikasi. Salah satu fasilitas komunikasi yang terdapat pada internet adalah internet relay chat atau yang sering dikenal

Lebih terperinci

Analisis Sentimen Tentang Opini Film Pada Dokumen Twitter Berbahasa Indonesia Menggunakan Naive Bayes Dengan Perbaikan Kata Tidak Baku

Analisis Sentimen Tentang Opini Film Pada Dokumen Twitter Berbahasa Indonesia Menggunakan Naive Bayes Dengan Perbaikan Kata Tidak Baku Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 12, Desember 2017, hlm. 1733-1741 http://j-ptiik.ub.ac.id Analisis Sentimen Tentang Opini Film Pada Dokumen Twitter

Lebih terperinci

Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine

Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine Anita Novantirani 1, Mira Kania Sabariah S.T., M.T 2, Veronikha Effendy,

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER

SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER Agung Pramono 1, Rini Indriati 2, Arie Nugroho 3, 1,2,3 Sistem Informasi, Fakultas Teknik, Universitas Nusantara PGRI Kediri E-mail: 1 pramonoagung0741@gmail.com,

Lebih terperinci

ABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA

ABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA ABSTRAK Twitter merupakan sebuah aplikasi social networking yang memungkinkan usernya untuk dapat mengirimkan pesan pada waktu yang bersamaan. Data yang diambil melalui Twitter dapat dijadikan sebagai

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait Penelitian terkait dengan topik analisis sentimen cukup banyak, berikut beberapa penelitian yang tekait dengan analisa sentimen yang menggunakan seleksi

Lebih terperinci

Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen

Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen Adi Radili 1, Suwanto Sanjaya 2 1,2 Teknik Informatika UIN Sultan Syarif Kasim Riau Jl. H.R. Soebrantas no. 155 KM. 18

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan

Lebih terperinci

1. Introduction. tertentu memegang peran penting dalam. Abstract

1. Introduction. tertentu memegang peran penting dalam. Abstract Perbandingan Metode Latent Semantic Analysis, Syntactically Enhanced Latent Semantic Analysis, dan Generalized Latent Semantic Analysis dalam Klasifikasi Dokumen Berbahasa Inggris Gilbert Wonowidjojo Bina

Lebih terperinci

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. BAB I PENDAHULUAN 1. 1.1. Latar Belakang Perkembangan infrastruktur dan penggunaan teknologi informasi memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah perolehan

Lebih terperinci

BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA

BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA 3. Analisis Masalah Analisis masalah adalah suatu gambaran masalah yang diangkat dalam penulisan skripsi tentang Analisis sentimen pengguna twitter pada

Lebih terperinci

Prosiding SENTIA 2015 Politeknik Negeri Malang Volume 7 ISSN:

Prosiding SENTIA 2015 Politeknik Negeri Malang Volume 7 ISSN: KLASIFIKASI TUGAS AKHIR UNTUK MENENTUKAN DOSEN PEMBIMBING MENGGUNAKAN NAÏVE BAYES CLASSIFIER (NBC) Putri Elfa Mas`udia 1 Politeknik Negeri Malang E-mail : putri.elfa@polinema.ac.id Abstrak Pemilihan dosen

Lebih terperinci

FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP)

FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP) FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP) Ratna Pertiwi¹, Deni Saepudin², Intan Nurma Yulita³ ¹Teknik Informatika,, Universitas Telkom Abstrak Berkembangnya

Lebih terperinci

SENTIMEN ANALYSIS TERHADAP NILAI KEPERCAYAAN SEBUAH ONLINE SHOP DI INSTAGRAM

SENTIMEN ANALYSIS TERHADAP NILAI KEPERCAYAAN SEBUAH ONLINE SHOP DI INSTAGRAM SENTIMEN ANALYSIS TERHADAP NILAI KEPERCAYAAN SEBUAH ONLINE SHOP DI INSTAGRAM Universitas Widyatama Jalan Cikutra No. 204A Bandung yan.puspitarani@widyatama.ac.id Abstrak Instagram menjadi tempat yang menarik

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Sumber opini teks saat ini tersedia berlimpah di internet akan tetapi belum sepenuhnya dimanfaatkan karena masih kurangnya tool yang ada, sedangkan perkembangan

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

BAB I PENDAHULUAN I - 1

BAB I PENDAHULUAN I - 1 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dunia pendidikan merupakan dunia yang memerlukan perhatian khusus karena pendidikan merupakan faktor yang sangat mempengaruhi kualitas para calon penerus bangsa

Lebih terperinci

Analisis Sentimen Menggunakan Support Vector Machine dan Maximum Entropy. Sentiment Analysis Using Support Vector Machine and Maximum Entropy Method

Analisis Sentimen Menggunakan Support Vector Machine dan Maximum Entropy. Sentiment Analysis Using Support Vector Machine and Maximum Entropy Method ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.2 Agustus 2017 Page 2389 Abstrak Analisis Sentimen Menggunakan Support Vector Machine dan Maximum Entropy Sentiment Analysis Using Support Vector

Lebih terperinci

2. Tahapan Penelitian pemahaman merupakan awal proses penelitian

2. Tahapan Penelitian pemahaman merupakan awal proses penelitian Metodologi Penelitian Rudi Susanto rudist87@gmail.com 086547296211 2. Tahapan Penelitian pemahaman merupakan awal proses penelitian Course Outline 1. Pengantar Penelitian 2. Tahapan Penelitian 3. Masalah

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi dewasa ini sudah mempengaruhi kebutuhan manusia modern, hal ini ditandai dengan penggunaan teknologi disetiap aspek kehidupan manusia yang berguna

Lebih terperinci

JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER

JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER Oleh: AGUNG PRAMONO PUTRO 12.1.03.03.0276 Dibimbing oleh : 1. NURSALIM, S.Pd,. MH 2. ARIE NUGROHO, S.Kom.,

Lebih terperinci