Analisis Kinerja Kombinasi Metode Berbasis Lexicon dan Metode Berbasis Learning pada Analisis Sentimen Twitter

Ukuran: px
Mulai penontonan dengan halaman:

Download "Analisis Kinerja Kombinasi Metode Berbasis Lexicon dan Metode Berbasis Learning pada Analisis Sentimen Twitter"

Transkripsi

1 Analisis Kinerja Kombinasi Metode Berbasis Lexicon dan Metode Berbasis Learning pada Analisis Sentimen Twitter Imam Syafei dan Hendri Murfi Departemen Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Indonesia, Depok, 16425, Indonesia Abstrak Analisis sentimen merupakan kegiatan untuk mencari pendapat atau sentimen seorang penulis tentang suatu entitas atau objek tertentu yang dapat berupa pendapat positif atau pendapat negatif. Analisis sentimen pada data yang sangat besar tidak dapat dilakukan secara manual sehingga membutuhkan bantuan metode non-manual. Terdapat dua metode non-manual dasar, yaitu metode berbasis lexicon dan metode berbasis learning. Pada penelitian ini, akan dibahas kombinasi metode berbasis lexicon dan metode berbasis learning. Metode kombinasi ini akan digunakan untuk melakukan analisis sentimen dengan data teks yang berasal dari media sosial Twitter atau biasa disebut tweets. Data yang dikumpulkan berupa tweets yang membicarakan seputar tokoh kandidat calon presiden Republik Indonesia periode Performance Analysis on Combination Lexicon Based Method and Learning Based Method in Twitter Sentiment Analysis Abstract Sentiment Analysis is an activity to find author s opinion or sentiment about an entity or object, which can be positive or negative opinion. Sentiment Analysis in big size of data can t be done manually so that it needs hand from non-manual method. There are two basic non-manual methods, that is lexicon-based method and learningbased method. In this research, will be explained combination lexicon-based method and learning-based method. This method of combination will be used to do sentiment analysis on text data, which from social media Twitter or so called tweets. The collection of data is tweets that contain chatting about the presidential candidate of Republic of Indonesia period Keywords: learning-based method; lexicon-based method; method of combination; presidential candidate; sentiment analysis; Twitter. 1. Pendahuluan 1.1 Latar Belakang Dengan seiring perkembangan dunia internet yang begitu cepat, berbagai hal yang terkait dengan dunia internet ikut merasakan dampak perkembangan ini juga dan salah satu diantaranya adalah media sosial online. Media sosial online adalah web generasi terkini yang memungkinkan pengguna atau pemilik akun untuk saling berkomunikasi satu sama lain dengan pemilik akun yang lain secara online. Bukti pesatnya perkembangan media sosial

2 terlihat dari besarnya antusiasme masyarakat untuk membuat akun media sosial dan ikut berpartisipasi di dalam perbincangan yang bersifat global. Bukan hanya pertumbuhan pengguna media sosial yang meningkat dengan cepat akibat perkembangan dunia internet, tetapi juga maraknya kemunculan media sosial yang baru dan menawarkan cara berkomunikasi yang berbeda-beda antara satu dengan lainnya. Beberapa media sosial yang terkenal adalah Facebook, Twitter, Instagram, Path, dan lainnya. Media sosial tersebut memiliki hingga jutaan pemilik akun yang tersebar hampir diseluruh pelosok dunia, terutama Twitter yang perkembangannya sangat cepat di Indonesia. Twitter sendiri merupakan media sosial dan layanan microblogging yang memungkinkan pengguna untuk mengirim dan membaca pesan berbasis teks hingga 140 karakter, yang dikenal sebagai tweets. Jumlah akun pengguna Twitter di Indonesia menduduki posisi kelima sebagai negara dengan jumlah akun terbanyak dengan jumlah akun mencapai hampir 30 juta terhitung Juli dan pastinya telah tumbuh lebih banyak lagi di tahun ini. Bukan hanya memiliki jumlah akun yang banyak, tetapi Indonesia ikut menyumbang Ibu Kota Jakarta sebagai kota penghasil tweets terbanyak di dunia dan Bandung sebagai kota kelima penghasil tweets terbanyak di dunia. Keduanya menyumbang setidaknya 2.5% dan 1.2% dari keseluruhan tweets publik 2. Para pengguna Twitter dapat membicarakan apapun yang ada di pikiran mereka sehingga banyak sekali variasi topik pembicaraan yang ada di Twitter. Topik-topik tersebut dapat berupa tanggapan terhadap suatu produk, musik, film, organisasi, tokoh, pandangan politik, dan lainnya. Sehingga banyak sekali informasi yang menggelembung di Twitter dan merupakan ladang emas informasi yang sangat berharga jika dapat diolah dengan baik. Salah satu cara mendapatkan informasi yang ada di dalam Twitter adalah dengan melakukan analisis sentimen entitas atau objek tertentu pada tweets. Analisis sentimen didefinisikan sebagai kegiatan mencari pendapat penulis tentang suatu entitas tertentu (Feldman, 2013), dimana dalam kasus Twitter ini bertujuan untuk mendapatkan opini publik tentang suatu entitas atau objek tertentu, seperti opini publik terhadap produk yang dikeluarkan suatu perusahaan tertentu atau opini publik tentang seorang tokoh masyarakat. Pada dasarnya, analisis sentimen digunakan untuk mengklasifikasikan data tekstual, seperti tweets, menjadi dua kelas yang berkaitan dengan subjektivitas, yaitu positif dan negatif. Dimana dalam kasus produk perusahaan, perusahaan terkait dapat mengetahui tanggapan atau umpan balik dari para pengguna produk mereka, apakah itu positif atau negatif. Namun dalam penerapannya, analisis sentimen pada tweets tidaklah mudah karena data yang tersimpan dalam server 1 (Diakses pada tanggal 7/10/2013 pukul 9.56 WIB) 2 ibid

3 Twitter sangatlah besar dan tidak akan mungkin dapat dilakukan secara manual, baik dalam akuisisi data ataupun analisisnya. Sehingga dibutuhkan suatu metode non-manual untuk melakukan akuisisi data dan analisis sentimen pada tweets. Metode analisis sentimen yang dikenal saat ini dapat dibagi dua, yaitu metode berbasis lexicon dan metode berbasis learning. Metode berbasis lexicon umumnya menggunakan kamus yang berisi kata-kata opini untuk menentukan suatu sentimen atau polaritas (positif atau negatif) dari suatu data teks, sedangkan metode berbasis learning adalah metode yang melatih sentiment classifier dengan menggunakan metode - metode machine learning untuk menentukan sentimen positif atau negatif dari suatu data teks. Namun dalam penerapannya, kedua metode ini memiliki beberapa kelemahan sehingga diperkenalkanlah kombinasi metode berbasis lexicon dan learning untuk mengatasi kelemahan-kelemahan tersebut. 1.2 Perumusan Masalah dan Ruang Lingkup Apakah metode kombinasi dapat meningkatkan kinerja metode berbasis lexicon dalam analisis sentimen Twitter? Ruang lingkup permasalahan yang dibahas dalam penelitian ini adalah analisis sentimen untuk kandidat calon Presiden Republik Indonesia periode Data yang digunakan berupa data teks yang isinya membicarakan tentang kandidat-kandidat tersebut. Data teks diambil dari media sosial Twitter. 1.3 Tujuan Penelitian Menganalisa kinerja kombinasi metode berbasis lexicon dan metode berbasis learning dalam analisis sentimen kandidat calon Presiden Republik Indonesia periode pada data Twitter. 2. Tinjauan Teoritis 2.1 Analisis Sentimen Sentimen dapat didefinisikan sebagai perasaan positif atau negatif individu dan analisis sentimen dapat didefinisikan sebagai kegiatan mencari pendapat penulis tentang suatu entitas tertentu (Feldman, 2013). Sehingga analisis sentimen bertujuan untuk mengklasifikasikan

4 data tekstual menjadi dua kelas yang berkaitan dengan subjektivitas, yaitu positif dan negatif. Namun, dalam penerapannya dapat pula dikelompokan ke dalam suatu kelas yang lain, yaitu netral. Data teks yang mengandung opini positif dikatakan memiliki polaritas positif dan dimasukan ke dalam kelas positif, begitu pula untuk kelas negatif dan netral. Dalam perkembangannya, analisis sentimen dapat dilakukan dalam beberapa level data teks, yaitu : Analisis Sentimen Level Dokumen Ini merupakan bentuk paling sederhana dari sentimen analisis. Level ini dikatakan sederhana karena diasumsikan bahwa di dalam sebuah dokumen hanya terdapat sebuah pendapat penulis mengenai objek utama yang diekspresikan dalam dokumen tersebut. Analisis Sentimen Level Kalimat Dalam level ini tidak ada asumsi bahwa hanya terdapat satu pendapat. Karena dalam sebuah dokumen bisa saja terdapat beberapa pendapat di dalamnya bahkan tentang entitas/objek yang sama. Oleh karena itu, diasumsikan bahwa setiap kalimat dalam dokumen tersebut memiliki sebuah pendapat. Sehingga akan didapatkan beberapa opini berbeda mengenai suatu entitas dalam sebuah dokumen. Analisis Sentimen Level Aspek Level ini sangat berbeda dengan dua level sebelumnya dimana analisis sentimen dilakukan terhadap keseluruhan dokumen atau setiap kalimat. Dalam level ini, analisis sentimen tidak langsung melihat pendapat penulis tentang suatu entitas tertentu melainkan melihat atribut atau aspek yang dimiliki entitas tersebut. Contohnya Handphone android memiliki banyak aplikasi bagus dan dapat diunduh secara gratis, tetapi baterainya tidak tahan lama dan harus sering diisi ulang. Entitas yang menjadi perhatian adalah Handphone android dan dalam tulisan di atas terdapat beberapa aspek terkait, yaitu aplikasi dan baterai. Dimana aplikasi memiliki polaritas positif dan baterai memiliki polaritas negatif. 2.2 Metode Berbasis Lexicon Metode berbasis lexicon bergantung pada kata opini atau kata sentimen, yang mana kata-kata tersebut mengekspresikan sentimen positif atau negatif. Metode ini adalah metode untuk menentukan sentimen atau polaritas opini melalui beberapa fungsi kata opini dalam dokumen atau kalimat (Hu dan Liu 2004, Kim dan Hovy 2004; Ding et al. 2008; Taboada, et al. 2010). Pendekatan menggunakan kata opini untuk menentukan sentimen disebut pendekatan

5 berbasis kamus (lexicon-based aproach) (Ding et al., 2008; Taboada et al., 2010). Kata-kata yang menunjukan keinginan/kesenangan, seperti luar biasa dan bagus, menunjukan sentimen yang positif atau biasa disebut polaritas positif, sedangkan kata-kata yang menunjukkan hal yang tidak diinginkan atau tidak disenangi, seperti buruk dan jahat, memiliki sentimen negatif atau polaritas negatif. Biasanya kata bernilai sentimen ditemukan pada kata sifat dan keterangan, tetapi ada juga kata kerja dan kata benda yang mengandung nilai sentimen. Sehingga metode ini menggunakan kamus yang berisi kata-kata opini untuk menentukan suatu sentimen positif atau negatif dari suatu data teks. Kamus ini biasa disebut kamus opini (opinion lexicon). Dalam penelitian ini kamus opini yang digunakan untuk memberikan nilai sentimen kepada data teks adalah SentiWordNet Metode Berbasis Learning Metode berbasis learning merupakan salah satu metode untuk melakukan analisis sentimen terhadap data teks yang dapat berupa dokumen atau kalimat. Metode ini melatih pengklasifikasi sentimen (sentiment classifier) dengan menggunakan metode - metode machine learning untuk menentukan sentimen positif atau negatif dari suatu data teks. Pengklasifikasi sentimen merupakan model yang akan digunakan sebagai aturan keputusan suatu data teks bernilai positif atau negatif, atau dengan kata lain pengklasifikasi sentimen berfungsi untuk mengklasifikasi suatu data teks berdasarkan nilai sentimennya. Melatih pengklasifikasi sentimen adalah langkah awal dari metode berbasis learning. Setelah langkah ini selesai, diharapkan pengklasifikasi sentimen akan mampu mengklasifikasikan dengan benar data yang diberikan. Pengklasifikasi sentimen dilatih menggunakan fitur-fitur unigram atau bigram (Pang et al. 2002). Fitur-fitur ini adalah hasil ekstraksi dari data pelatihan yang diberikan. Secara umum, terdapat dua jenis machine learning, yaitu unsupervised learning dan supervised learning. Perbedaan kedua jenis ini terletak pada kebutuhan label pada proses pelatihan. Unsupervised learning tidak membutuhkan label pada proses pelatihan dan biasa digunakan untuk mencari variabel tersembunyi, sebaliknya supervised learning membutuhkan label pada proses pelatihan karena biasanya bertujuan untuk melakukan klasifikasi, regresi, atau clustering. Seperti dibahas diawal bahwa akan dilakukan pengklasifikasian data teks berdasarkan nilai sentimennya, maka jenis supervised learning yang akan digunakan dalam penelitian ini. Gambar 1 menunjukan rangkuman proses supervised learning secara umum.

6 (1) Data Teks Pelatihan Vektor Fitur-fitur (3) (4) Machine Learning Label (2) Data Teks Vektor (6) Fitur-fitur (7) (5) Model (8) (9) Label Prediksi Gambar 1. Proses Supervised Learning secara Umum dengan penjelasan sebagai berikut : (1) Pada tahap ini, teks data yang menjadi bahan pelatihan, sebut saja data pelatihan, siap untuk dilatih ke dalam metode machine learning, (2) Data pelatihan kemudian diberi label secara manual, (3) Selanjutnya, data pelatihan direpresentasikan ke dalam bentuk vektor dari fitur-fitur hasil ekstraksi dari data pelatihan itu sendiri, (4) Kemudian, metode machine learning tertentu dilatih dengan menggunakan vektorvektor data pelatihan bersama dengan label yang sudah diberikan, (5) Didapatlah model hasil pelatihan machine learning yang akan digunakan menjadi predictive model, (6) Selanjutnya tahap prediksi label, dimana data baru yang belum dikenal model disiapkan untuk selanjutnya dilakukan prediksi label terhadap data baru tersebut, (7) Kembali data direpresentasikan dalam bentuk vektor dari fitur-fitur, (8) Kemudian, label dari vektor data baru tersebut diprediksi dengan menggunakan predictive model yang sudah didapatkan sebelumnya, (9) Dan akhirnya didapatlah label untuk data baru tersebut yang merupakan label hasil prediksi model.

7 Sejauh ini terdapat beberapa machine learning yang digunakan untuk melakukan analisis sentimen pada data teks, diantaranya Naïve Bayes Classification, Maximum Entropy Classification, dan Support Vector Machine. Ketiganya merupakan supervised learning sehingga membutuhkan pelabelan secara manual. Pada tahun 1999, Nigam et al. menunjukan bahwa Maximum Entropy Classification terkadang, tetapi tidak selalu, melebihi hasil yang diharapkan dari metode Naïve Bayes Classification dalam pengklasifikasian data teks standar. Sedangkan, Support Vector Machine (SVM) telah ditunjukkan memiliki efektifitas yang tinggi dalam pengkategorian teks traditional dan secara umum melebihi hasil yang diharapkan dari metode Naïve Bayes Classification (Joachims, 1998). Terlebih lagi, SVM menggunakan dasar margin-besar untuk melakukan pengklasifikasian, sedangkan Naïve Bayes dan Maximum Entropy menggunakan probabilitas untuk melakukan pengklasifikasian. Sehingga dalam penelitian ini akan digunakan Support Vector Machine sebagai metode berbasis learning untuk analisis sentimen pada data Twitter. Pada subbab akan dibahas mengenai ide dasar Support Vector Machine Support Vector Machine Support Vector Machine (SVM) adalah algoritma komputer yang belajar melalui sample untuk memberikan label pada objek-objek (Noble, 2006). Tujuan SVM adalah untuk menghasilkan sebuah model (berdasarkan data pelatihan) yang dapat memeprediksi label dari data pengujian yang diberikan. Model yang digunakan merupakan model linier yang selanjutnya akan digunakan sebagai hyperplane. Hyperplane merupakan ide dasar dari SVM, dimana akan dicari hyperplane yang dapat memisahkan data berdimensi-n secara sempurna ke dalam dua kelas. Namun, kenyataannya tidak semua data dapat dipisahkan secara linier sehingga SVM menggunakan suatu fungsi yang berfungsi mentransformasi data ke ruang dimensi yang lebih tinggi dimana data tersebut dapat dipisahkan secara linier. Terdapat empat konsep yang perlu diketahui dalam algoritma SVM, konsep ini akan membantu untuk memahami pengklasifikasian menggunakan SVM. Berikut empat konsep tersebut: Hyperplane atau Decision Boundary Hyperplane atau decision boundary digunakan untuk mengklasifikasikan data. Jika data yang digunakan memiliki dua variabel bebas, maka data memiliki bentuk dua dimensi dan bentuk hyperplane berupa garis lurus seperti gambar 2.

8 !!!!! Gambar 2. Hyperplane yang Memisahkan Dua Himpunan Jika terdapat tiga variabel bebas, maka hyperplane akan memiliki bentuk bidang. Semakin banyak variabel bebas atau semakin besar dimensi data maka semakin besar pula dimensi hyperplane. Hyperplane dengan Margin Maksimum Hyperplane yang digunakan untuk mengklasifikasikan data tidaklah unik. Misalkan pada contoh kasus dua dimensi seperti gambar 3.!!!!!!!!!! Gambar 3. Hyperplane-hyperplane yang Memisahkan Himpunan Terdapat beberapa alternatif yang dapat digunakan sebagai hyperplane contoh di atas. Hal ini tentu saja menyulitkan pemilihan hyperplane, sehingga dibutuhkan cara untuk memilih hyperplane yang terbaik dan unik. Pertama, definisikan margin hyperplane adalah jarak dari hyperplane ke sembarang titik data yang terdekat. Hyperplane yang akan digunakan SVM sebagai decision boundary adalah hyperplane yang mengelompokan data dengan margin yang maksimal. Pemilihan ini diharapkan akan

9 memaksimalkan kerja SVM karena dengan semakin besarnya margin maka akan semakin kuat pula pemisahan kelas-kelas tersebut. Margin Lunak (soft margin) Dalam penerapannya pada data riil, tentu saja semua yang sudah dibahas tidak bisa diterapkan begitu saja karena terdapat asumsi dimana hyperplane dapat memisahkan semua data secara sempurna. Sedangkan hal ini hampir mustahil terjadi pada data riil, dimana bisa saja terdapat error, sehingga diperlukan sedikit kelunakan pada asumsi di atas. Kelunakan ini memberikan ruang kepada SVM untuk membiarkan beberapa data error berada pada sisi hyperplane yang salah tanpa mempengaruhi hasil akhir seperti gambar 4.!!!!! Gambar 4. Hyperplane dengan Margin Lunak Namun, SVM harus memiliki batasan seberapa banyak dan seberapa jauh data boleh menyimpang. Hal ini dapat dilakukan dengan menambahkan variabel soft margin atau slack pada SVM untuk mengukur trade-off antara pelanggaran hyperplane dan ukuran margin. Fungsi Kernel Terkadang tidak semua data dapat dipisahkan secara linier (non-linearly separable). Hal ini dapat menjadi masalah karena SVM menggunakan model linier sebagai hyperplane. Solusi untuk masalah ini adalah transformasi data. Transformasi data dapat menambahkan dimensi kepada data dengan cara memproyeksikan data pada ruang dimensi yang lebih tinggi. Sehinggga diharapkan akan ditemukan hyperplane dengan dimensi yang lebih besar yang dapat memisahkan data secara linier (linearly separable). Peran fungsi kernel pada transformasi ini adalah mampu mendefinisikan

10 hasil kali dalam dari transformasi ini tanpa perlu mengetahui bentuk fungsi transformasi tersebut. 2.4 Kombinasi Metode Berbasis Lexicon dan Metode Berbasis Learning Pada subbab sebelumnya telah dibahas bahwa terdapat dua metode dasar untuk melakukan analisis sentimen, yaitu metode berbasis lexicon dan metode berbasis learning. Metode berbasis lexicon merupakan metode yang menggunakan kata opini untuk memberikan nilai sentimen suatu data teks. Metode ini efisien dan bisa digunakan untuk menganalisa teks pada level dokumen, kalimat, atau entitas (Zhang, et al., 2011). Sehingga sangat aplikatif dalam analisis sentimen. Meskipun demikian, pada penelitian ini, analisis sentimen diterapkan pada data Twitter atau lebih dikenal dengan nama tweets. Data Twitter tidak seperti data teks pada umumnya karena Twitter telah mengembangkan karakteristiknya sendiri. Beberapa karakteristik data Twitter dapat mengganggu pendekatan berbasis kamus, seperti kata yang disingkat, bahasa percakapan, emoticon, dan sebagainya. Kemungkinan ekspresi tersebut memiliki nilai sentimen, tetapi ekspresi tersebut tidak ada di dalam kamus opini. Meskipun ekspresi ini dapat ditambahkan secara manual ke dalam kamus opini, ekspresi seperti ini terus berkembang dan muncul ekspresi-ekspresi yang baru seiring dengan berkembangnya trend di internet. Sehingga penambahannya secara manual sangatlah sulit. Selain menggunakan metode berbasis lexicon, metode berbasis learning juga dapat diterapkan untuk melakukan analisis sentimen pada data Twitter. Machine learning yang digunakan adalah Support Vector Machine. SVM dilatih dengan menggunakan tweets yang menjadi data pelatihan untuk dapat menentukan nilai sentimen. Namun, hal ini juga tidak mudah dilakukan karena pada proses pelatihan SVM juga membutuhkan label disamping data pelatihan dan data Twitter bukan merupakan data dengan jumlah sedikit sehingga pelabelan secara manual akan memakan waktu dan tenaga. Terlebih lagi, SVM yang sudah dilatih pada suatu domain tertentu memiliki performa yang baik pada domain tersebut, tetapi performanya buruk jika digunakan pada domain yang berbeda (Aue dan Gamon, 2005). Ketidakmampuan metode berbasis lexicon dalam mengidentifikasi ekspresi, seperti kata singkatan, bahasa percakapan, emoticon, dan sebagainya, serta keharusan memberikan label secara manual pada metode berbasis learning menjadi dasar dibentuknya kombinasi dari kedua metode tersebut. Kombinasi kedua metode dilakukan secara sekuensial, pertama gunakan metode berbasis lexicon untuk menentukan nilai sentimen. Selanjutnya, data hasil

11 metode berbasis lexicon digunakan sebagai data pelatihan untuk Support Vector Machine. Sehingga dari proses tersebut tidak membutuhkan pelabelan manual. Dengan kata lain, metode kombinasi ini menjadikan metode berbasis lexicon sebagai batu loncatan dan mentransfer pembelajaran kepada SVM. Metode kombinasi ini juga mampu beradaptasi terhadap gaya baru dalam percakapan. Untuk lebih jelasnya, gambar 5 akan menunjukan flowchart algoritma lengkap kombinasi metode berbasis lexicon dan metode berbasis learning. Mulai (1) Data Twitter (Tweets) Menghapus kata opini dari Data Pelatihan (5) (6) Melatih SVM menggunakan Data Pelatihan (2) Metode Lexicon menentukan nilai sentimen Tweets (4) Data Pelatihan (7) Model Prediksi untuk Klasifikasi (3) Data Pengujian Selesai Gambar 5. Skema Algoritma Kombinasi dengan penjelasan sebagai berikut : (1) Data Twitter (tweets) sudah siap untuk diproses, (2) Metode berbasis lexicon mengidentifikasi keberadaan kata opini pada setiap tweets dan memberikan nilai sentimen positif atau negatif sesuai dengan kata opini yang ada dalam tweets tersebut,

12 (3) Data pengujian merupakan tweets yang diidentifikasi tidak memiliki kata opini di dalamnya dan biasa digunakan untuk menganalisa kinerjamodel yang dihasilkan, (4) Data pelatihan merupakan tweets yang diidentifikasi memiliki kata opini di dalamnya, (5) Sebelum data pelatihan diberikan kepada SVM, terlebih dahulu kata opini, yang teridentifikasi oleh metode berbasis lexicon, dihapus dari tweets. Penghapusan ini menyebabkan SVM dapat belajar kata singkatan, bahasa percakapan, emoticon, dan lain-lain dari domain yang spesifik (Zhang, et al., 2011), (6) Selanjutnya, SVM dilatih menggunakan data pelatihan yang sudah melewati proses (5) bersama dengan labelnya, (7) Hasil proses (6) didapat model prediksi yang akan digunakan untuk melakukan klasifikasi tweets ke dalam kelas positif untuk tweets dengan nilai sentimen positif atau kelas negatif untuk tweets dengan nilai sentimen negatif. 3. Metode Penelitian 3.1 Studi Literatur Mempelajari kombinasi metode berbasis lexicon dan metode berbasis learning untuk menyelesaikan permasalahan analisis sentimen. 3.2 Akuisis dan Persiapan Data Twitter Mengumpulkan data Twitter berupa tweets yang berhubungan dengan kandidat calon Presiden Republik Indonesia periode Pengambilan tweets dilakukan secara otomatis dengan bantuan software online yang bernama DiscoverText dimana software ini mampu untuk menyaring tweets yang ada di Twitter berdasarkan sebuah atau beberapa kata kunci yang diberikan. Kata kunci yang digunakan adalah nama 10 orang kandidat calon Presiden Republik Indonesia Selanjutnya, dilakukan pembersihan dan persiapan data secara non-manual untuk menjadi input metode yang digunakan. 3.3 Penyusunan Algoritma Pada tahap ini dilakukan perangakaian algoritma kombinasi metode berbasis lexicon dan metode berbasis learning dalam analisis sentimen kandidat calon Presiden Republik Indonesia periode

13 3.4 Implementasi Program Program yang digunakan untuk menyelesaikan permasalahan analisis sentimen kandidat calon Presiden Republik Indonesia periode dengan menggunakan kombinasi metode berbasis lexicon dan metode berbasis learning adalah Python Simulasi dan Evaluasi Hasil Pada tahap ini dilakukan simulasi program dan mengevaluasi hasil dari kinerja metode yang digunakan. 4. Hasil Penelitian Pada bab ini akan dijabarkan mengenai hasil metode berbasis lexicon (SentiWordNet) untuk klasifikasi tweets ke kelas positif atau kelas negatif dan hasil metode berbasis learning (SVM) untuk meningkatkan kinerja metode berbasis lexicon dalam pengklasifikasian. Kinerja dari metode yang digunakan akan diukur berdasarkan ukuran keberhasilan. Tabel 1 akan mempermudah pengertian tentang ukuran keberhasilan. Tabel 1. Tabel Kontingensi Prediksi Benar Positif (BP) Salah Negatif (SN) Observasi Salah Positif (SP) Benar Negatif (BN) dengan penjelasan sebagai berikut : Benar Positif (BP) : banyak tweets yang dilabel dengan benar sebagai kelas positif, Salah Positif (SP) : banyak tweets yang salah dilabel sebagai kelas positif, Salah Negatif (SN) : banyak tweets yang salah dilabel sebagai kelas negatif, Benar Negatif (BN) : banyak tweets yang dilabel dengan benar sebagai kelas negatif. Ukuran keberhasilan yang akan digunakan adalah akurasi, presisi, dan recall (Powers, 2007), dimana ketiganya memiliki definisi sebagai berikut : Akurasi adalah proporsi hasil pelabelan yang benar terhadap jumlah tweets.

14 !" +!"!"#$%&' =!"#$%h!"##!$ Presisi adalah kemampuan untuk tidak melabel positif tweets yang negatif.!"#$%$% =!"!" +!" Recall adalah kemampuan mencari semua tweets positif.!"#$%% =!"!" +!" dimana ketiganya memiliki nilai maksimum 1 dan nilai minimum 0. Selanjutnya, akan ditunjukkan hasil simulasi program. Pertama, tabel 2 menunjukan hasil kinerja metode berbasis lexicon (SentiWordNet) mengidentifikasi seluruh data tweets (data pelatihan dan data pengujian). Tabel 2. Hasil Simulasi SentiWordNet Jumlah Tweets 1888 Akurasi 31,6% Presisi 59,2% Recall 60,5% Berdasarkan hasil akurasi, SentiWordNet berhasil mengidentifikasi nilai sentimen atau melabel tweets dengan benar sebanyak 596 dari 1888 tweets, dimana 984 dari 1888 tweets berhasil dilabel (dilabel dengan benar dan salah) dan sisanya sebanyak 904 tidak berhasil diberi label. Selanjutnya berdasarkan hasil presisi, dari keseluruhan tweets yang dilabel positif, sebanyak 59,2% diantaranya benar berasal dari kelas positif. Terakhir berdasarkan hasil recall, dari keseluruhan tweets yang berasal dari kelas positif, sebanyak 60,5% diantaranya berhasil dilabel dengan benar sebagai kelas positif. Kedua, tabel 3 menunjukan hasil kinerja SVM melabel data pengujian yang merupakan tweets yang tidak berhasil dilabel oleh SentiWordNet. Tabel 3. Hasil Simulasi SVM Jumlah Tweets 904 Akurasi 59,3% Presisi 60,6% Recall 93,1%

15 Berdasarkan hasil akurasi, dari 904 tweets yang diidentifikasi tidak memiliki kata opini oleh SentiWordNet, SVM mampu mengklasifikasikan 536 tweets dengan benar. Sehingga SVM mampu meningkatkan sebanyak 536 pengklasifikasiaan secara benar dari total 1888 tweets. Jadi, SVM mampu miningkatkan akurasi SentiWordNet sebesar atau sekitar 28%. Selanjutnya berdasarkan hasil presisi, dari keseluruhan tweets yang dilabel positif, sebanyak 60,6% diantaranya benar berasal dari kelas positif. Terakhir berdasarkan hasil recall, dari keseluruhan tweets yang berasal dari kelas positif, sebanyak 93,1% diantaranya berhasil dilabel dengan benar sebagai kelas positif. Untuk kebutuhan analisis kinerja, dijalankan pula analisis sentimen Twitter dengan hanya menggunakan metode berbasis learning, yaitu Support Vector Machine. Hal ini dilakukan untuk melihat seberapa baik kinerja SVM tanpa menggunakan bantuan SentiWordNet. Data input yang digunakan merupakan data pelatihan dan untuk melihat hasil kinerja SVM digunakan metode Cross-Validation. Setelah dilakukan eksekusi program didapat rata-rata akurasi SVM, yaitu 90%. Namun, perlu dicatat bahwa penggunaan metode berbasis learning sendiri membutuhkan pelabelan manual yang sangat menguras tenaga dan waktu. 5. Pembahasan Pada bab ini, akan dilakukan implementasi kombinasi metode berbasis lexicon dan metode berbasis learning untuk melakukan analisis sentimen kandidat calon Presiden Republik Indonesia periode Implementasi menggunakan bahasa pemrograman Python dan package Microsoft Translator, Scikit-Learn 0.14, dan Pattern Deskripsi dan Persiapan Data Data teks yang akan digunakan adalah data dari media sosial Twitter atau yang lebih dikenal dengan nama tweets. Akuisisi tweets dilakukan dengan bantuan software online, yaitu DiscoverText, dimana akuisisi data dilakukan secara otomatis. Periode Pengambilan data dilakukan sejak Agustus 2013 s.d. Februari 2014 dan telah terkumpul sebanyak tweets. Data yang dikumpulkan berupa tweets yang membicarakan seputar tokoh kandidat calon

16 presiden Republik Indonesia periode Berikut nama-nama kandidat calon yang menjadi perhatian dalam penelitian ini: 1. Aburizal Bakrie 6. Mahfud M.D. 2. Dahlan Iskan 7. Megawati Soekarno Putri 3. Hatta Rajasa 8. Prabowo Subianto 4. Jusuf Kalla 9. Surya Paloh 5. Joko Widodo 10. Wiranto Berikut adalah beberapa contoh tweets yang diakuisisi menggunakan DiscoverText: Tabel 4. Contoh Hasil Akuisisi Tweets Kalau memang baik tak salah rakyat pilih Risma: Kalau dipercaya jadi presiden, Jokowi bisa - Yahoo! News Indonesia Jika jd capres Jokowi hrs dicarikan tandingnya yg sepadan. Jgn capres yg 4L. Basiiii n pasti pecundang. SBY mantan TNI, dan Calon Presiden Prabowo subianto adalah Mantan KOPASSUS.. Krn anggoto TNI disiplin.. Maka dari itu, smw presiden TEGAS!!! You Are The Next Presiden : Prabowo Subianto, Pemimpin yang Murah senyum, Lemah Lembut, dan Berani Tegas Dalam Aturan Dan Keputusan. Prabowo dgn 6 Program Aksinya cukup bagus sbg Presiden. Jokowi jangan diganggu sbg Gubernur DKI. DKi semrawut Indonesia hanyut! Presiden Jokowi wakilnya Abraham Samad tiada pasangan lebih mintilihir / dahsyat Sebelum data dapat digunakan perlu dilakukan beberapa tahap persiapan data. Pertama, dilakukan penyaringan data meliputi penghapusan tweets yang sama dan penghapusan link dari isi tweets. Setelah itu, dilakukan pembangunan stopwords. Stopwords adalah kata atau fitur yang tidak relevan dengan isi tweets. Kata atau fitur yang tidak relevan tersebut diantaranya, ID pengguna Twitter dan nama kandidat calon Presiden. Tahap terakhir adalah penerjemahan tweets ke dalam bahasa Inggris. Penerjemahan dilakukan karena kamus opini yang digunakan pada metode berbasis lexicon, yaitu SentiWordNet, hanya mengenal katakata yang berasal dari bahasa Inggris. Penerjemahan dilakukan secara non-manual dengan bantuan Python dan package Microsoft Translator. Berikut adalah beberapa contoh hasil penerjemahan tweets ke dalam bahasa Inggris dengan menggunakan bantuan Microsoft Translator.

17 Tabel 5. Contoh Hasil Terjemahan Tweets ke Bahasa Inggris Tweets sebelum diterjemahkan Kalau memang baik tak salah rakyat pilih Risma: Kalau dipercaya jadi presiden, Jokowi bisa - Yahoo! News Indonesia Jika jd capres Jokowi hrs dicarikan tandingnya yg sepadan. Jgn capres yg 4L. Basiiii n pasti pecundang. SBY mantan TNI, dan Calon Presiden Prabowo subianto adalah Mantan KOPASSUS.. Krn anggoto TNI disiplin.. Maka dari itu, smw presiden TEGAS!!! You Are The Next Presiden : Prabowo Subianto, Pemimpin yang Murah senyum, Lemah Lembut, dan Berani Tegas Dalam Aturan Dan Keputusan. Prabowo dgn 6 Program Aksinya cukup bagus sbg Presiden. Jokowi jangan diganggu sbg Gubernur DKI. DKi semrawut Indonesia hanyut! Presiden Jokowi wakilnya Abraham Samad tiada pasangan lebih mintilihir / dahsyat Tweets setelah diterjemahkan If it's not one of the people either choose Tri Risma: if believed could be President, Jokowi- Yahoo! News Indonesia If jd Jokowi capres hrs suitable regular partner is worth it. Capres Jgn yg 4 l. Basiiii n sure losers. YUDHOYONO'S former TNI, and presidential candidate Prabowo subianto is a former KOPASSUS. Krn anggoto TNI discipline.. Thus, the President EMPHATICALLY smw!!! You Are The Next President: Prabowo Subianto, the leader of the smile, gentle, Bold and Resolute in the rules and decisions. The Prabowo with 6 Program Action is pretty good as President. Jokowi do not disturb as Governor. JAWA semrawut Indonesia drifting! President Jokowi his Deputy Abraham Samad no more terrible mintilihir/pair Setelah melewati serangkaian persiapan data, didapat data bersih yang siap untuk dijadikan data input pada simulasi program sebanyak 1888 tweets. 5.2 Simulasi Program Setelah melalui persiapan data, maka data telah siap untuk diolah ke dalam kombinasi metode berbasis lexicon dan metode berbasis learning. Tahapan simulasi meliputi : 1. Identifikasi tweets dengan menggunakan SentiWordNet, 2. Pemberian label dan penghapusan kata opini pada tweets, dan 3. Pelatihan Support Vector Machine (SVM). Pertama, tweets akan diidentifikasi dengan menggunakan SentiWordNet untuk mendapatkan nilai sentimen dari tweets tersebut. Berikut adalah beberapa contoh hasil identifikasi dengan menggunakan SentiWordNet.

18 Tabel 6. Contoh Hasil Identifikasi Nilai Sentimen Tweets yang diidentifikasi If it's not one of the people either choose Tri Risma: if believed could be President, Jokowi-Yahoo! News Indonesia If jd Jokowi capres hrs suitable regular partner is worth it. Capres Jgn yg 4 l. Basiiii n sure losers. YUDHOYONO'S former TNI, and presidential candidate Prabowo subianto is a former KOPASSUS. Krn anggoto TNI discipline.. Thus, the President EMPHATICALLY smw!!! You Are The Next President: Prabowo Subianto, the leader of the smile, gentle, Bold and Resolute in the rules and decisions. The Prabowo with 6 Program Action is pretty good as President. Jokowi do not disturb as Governor. JAWA semrawut Indonesia drifting! President Jokowi his Deputy Abraham Samad no more terrible mintilihir/pair Nilai sentimen Berdasarkan hasil identifikasi di atas, terlihat bahwa terdapat tweets dengan nilai sentimen positif, negatif, dan nol. Nilai sentimen didapat dari kata opini yang ada pada tweets tersebut, kata opini yang negatif akan memberikan nilai sentimen yang negatif begitu pula dengan kata opini positif akan memeberikan nilai sentimen positif pada tweets. Sedangkan sentimen yang bernilai nol menunjukkan bahwa tidak terdapat kata opini positif ataupun negatif pada tweets tersebut sehingga tweets tersebut dianggap netral. Nilai sentimen hasil identifikasi SentiWordNet berupa bilangan real dengan interval -1 sampai 1. Jika tweets memiliki nilai sentimen yang semakin mendekati nilai 1, maka tweets tersebut memiliki sentimen yang semakin positif. Sebaliknya, jika tweets memiliki nilai sentimen yang semakin mendekati nilai -1, maka tweets tersebut memiliki sentimen yang semakin negatif. Setelah proses identifikasi tweets oleh SentiWordNet, data akan dibagi menjadi dua buah kelompok data, yaitu data pelatihan dan data pengujian. Data pelatihan adalah tweets-tweets yang diidentifikasi oleh SentiWordNet memiliki kata opini di dalamnya, sedangkan data pengujian adalah tweets-tweets yang diidentifikasi oleh SentiWordNet tidak memiliki kata opini di dalamnya. Berdasarkan hasil simulasi didapat data pelatihan dengan jumlah data sebanyak 984 tweets dan data pengujian dengan jumlah data sebanyak 904 tweets. Selanjutnya, data pelatihan yang sudah dibentuk akan diberi label terlebih dahulu sebelum digunakan untuk proses pelatihan oleh SVM. Pemberian label dilakukan secara non-manual,

19 dimana tweets dengan nilai sentimen positif diberi label 1 dan tweets dengan nilai sentimen negatif diberi label -1. Setelah pemberian label, maka data pelatihan akan masuk tahap selanjutnya, yaitu penghapusan kata opini dari tweets. Kata opini yang dihapus adalah kata opini yang teridentifikasi oleh SentiWordNet. Tujuan penghapusan ini agar SVM dapat mempelajari kata singkatan, bahasa percakapan, emoticon, dan lain-lain dari domain yang spesifik (Zhang, et al., 2011). Tabel 7 menunjukan contoh hasil pelabelan dan penghapusan kata opini dari tweets. Tabel 7. Contoh Hasil Pelabelan Data Pelatihan dan Penghapusan Kata Opini Tweets yang diidentifikasi (sebelum kata opini dihapus) If jd Jokowi capres hrs suitable regular partner is worth it. Capres Jgn yg 4 l. Basiiii n sure losers. You Are The Next President: Prabowo Subianto, the leader of the smile, gentle, Bold and Resolute in the rules and decisions. The Prabowo with 6 Program Action is pretty good as President. Jokowi do not disturb as Governor. JAWA semrawut Indonesia drifting! President Jokowi his Deputy Abraham Samad no more terrible mintilihir/pair Tweets (setelah kata opini dihapus) If jd Jokowi capres hrs partner is it. Capres Jgn yg 4 l. Basiiii n losers. You Are The President: Prabowo Subianto, the leader of the,, and Resolute in the rules and decisions. The Prabowo with 6 Program is as President. Jokowi do not disturb as Governor. JAWA semrawut Indonesia drifting! President Jokowi his Deputy Abraham Samad no mintilihir/pair Kata opini ['suitable', 'regular', 'worth', 'sure'] ['next', 'smile', 'gentle', 'bold'] ['action', 'pretty', 'good'] ['more', 'terrible'] Nilai sentimen Label Data pelatihan yang sudah tidak memiliki kata opini beserta labelnya akan digunakan untuk proses pelatihan oleh SVM. SVM akan dilatih menggunakan data pelatihan agar dapat mengklasifikasikan data dengan benar. Proses pelatihan bertujuan untuk mencari parameter model yang akan digunakan untuk mengklasifikasikan data secara benar. Strategi yang biasa digunakan untuk mencari parameter adalah grid-search dengan menggunakan metode Cross- Validation (Lin, et al., 2010). 6. Kesimpulan

20 Berdasarkan hasil simulasi program analisis sentimen Twitter dengan menggunakan kombinasi metode berbasis lexicon dan metode berbasis learning pada studi kasus calon presiden Republik Indonesia periode , maka dapat ditarik beberapa kesimpulan, yaitu : 1. Akurasi metode berbasis lexicon masih belum cukup baik. Hal ini terjadi sebagian besar karena dua kemungkinan. Pertama, ketidakmampuan alat penerjemah (Microsoft Translator) untuk menerjemahkan kata singkatan dan bahasa percakapan. Kedua, ketidakmampuan metode lexicon untuk mendeteksi kata (bukan kata sifat) yang kemungkinan memiliki nilai sentimen. Begitu pula dengan presisi dan recall yang nilainya tidak begitu baik. 2. SVM mampu meningkatkan akurasi metode berbasis lexicon dengan peningkatan akurasi sebesar 28%. Hal ini didukung dalam paper Zhang, et al. di tahun 2011, dimana disebutkan bahwa SVM meningkatkan metode berbasis lexicon sebesar 5%. 3. Kinerja SVM dalam memprediksi data-data yang tidak dapat dilabel (data pelatihan) oleh metode berbasis lexicon belum optimal. Hal ini terjadi karena berbagai kemungkinan. Pertama, kesalahan metode lexicon dalam memberi label pada data pelatihan sehingga menyebabkan transfer pembelajaran yang salah pula. Kedua, perbedaan kuantitas antara data yang memiliki label positif dan data dengan label negatif. Selain akurasi, hal serupa juga terjadi pada presisi, dimana nilainya tidak begitu berbeda dengan metode berbasis lexicon. Namun, lain halnya dengan recall dimana nilai recall jauh lebih tinggi dibandingkan metode berbasis lexicon. 7. Saran Sebagai pengembangan pemahaman atas kombinasi metode berbasis lexicon dan metode berbasis learning dan aplikasinya pada data Twitter, penulis menyarankan agar beberapa hal berikut dapat dibahas lebih mendalam, yaitu : 1. Penggunaan metode yang dapat mengubah kata yang disingkat menjadi kata yang sebenarnya agar dapat mengurangi kesalahan dalam penerjemahan ke bahasa Inggris. 2. Pemanfaatan metode active learning yang dapat memilih data pelatihan sehingga dapat memaksimalkan kinerja classifier pada metode berbasis learning.

21 8. Daftar Referensi [1] Bazaraa, M. S., Sherali, H. D., dan Shetty, C. M. (1993). Nonlinear Programming Theory and Algorithms (2nd ed.). USA: John Wiley & Sons. [2] Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Singapore: Springer. [3] Chang, C. C. dan Lin, C. J. (2011). LIBSVM : A Library For Support Vector Machines. ACM Transactions on Intelligent Systems and Technology, 27(2), [4] Chen, P. H., Fan, R. E., dan Lin, C. J. (2006). A Study on SMO-type Decomposition Methods for Support Vector Machines. IEEE Transactions On Neural Networks, 17(4), [5] Feldman, R. (2013). Techniques and Applications for Sentiment Analysis. Communication of the ACM, 56(4), [6] Hsu, C. W., Chang, C. C., and Lin, C. J. (2010). A Practical Guide to Support Vector Classification. Diakses pada 1 Mei 2014 dari [7] Noble, William S. (2006). What is A Support Vector Machine? Nature biotechnology. ISSN , 24(12), [8] Pang, B., Vaithyanathan, S., dan Lee, L. (2002). Thumbs up? Sentiment Classification using Machine Learning Techniques. Proceedings of EMNLP, [9] Pedregosa, F., et al. (2011). Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, 12, [10] Powers, D. M. W. (2007). Evaluation: From Precision, Recall and F-Factor to ROC, Informedness, Markedness & Correlation. Journal of Machine Learning Technologies, 2(1), [11] Robertson, S. (2008). Understanding Inverse Document Frequency: On Theoretical Arguments for IDF. Journal of Documentation, 60(5), [12] Zhang, L., et al. (2011). Combining Lexicon-based and Learning-based Methods for Twitter Sentiment Analysis. Technical Report, HP Laboratories.

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan 1 BAB I PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan media sosial menawarkan pengguna kesempatan untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan tidak lagi memiliki

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini, microblogging menjadi sangat popular untuk alat komunikasi antara pengguna internet. Setiap hari jutaan pesan muncul di website penyedia microblogging diantaranya

Lebih terperinci

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

LAPORAN TUGAS AKHIR. Disusun oleh: Franky LAPORAN TUGAS AKHIR Analisis Sentimen Menggunakan Metode Naive Bayes, Maximum Entropy, dan Support Vector Machine pada Dokumen Berbahasa Inggris dan Dokumen Berbahasa Indonesia Hasil Penerjemahan Otomatis

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN Bab ini akan menjelaskan latar belakang dari penelitian yang memberikan gambaran awal mengenai analisis sentimen dan perannya dalam perkembangan teknologi informasi. Tujuan dan ruang

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

STUDI KOMPARASI METODE MULTICLASS SUPPORT VECTOR MACHINE UNTUK MASALAH ANALISIS SENTIMEN PADA TWITTER

STUDI KOMPARASI METODE MULTICLASS SUPPORT VECTOR MACHINE UNTUK MASALAH ANALISIS SENTIMEN PADA TWITTER STUDI KOMPARASI METODE MULTICLASS SUPPORT VECTOR MACHINE UNTUK MASALAH ANALISIS SENTIMEN PADA TWITTER Mohammad Luthfi Pratama 1. Hendri Murfi 2 Departemen Matematika, FMIPA UI, Kampus UI Depok, 16424,

Lebih terperinci

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA Prawidya Destarianto 1, Wahyu Kurnia Dewanto 2, Hermawan Arief Putranto 3 1,2,3 Jurusan, Teknologi

Lebih terperinci

1. BAB I PENDAHULUAN 1.1 Latar Belakang

1. BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini dunia telah memasuki era dimana masyarakat dapat secara bebas menyuarakan pendapat mereka di berbagai media, salah satunya melalui media sosial. Masyarakat

Lebih terperinci

SVM untuk Regresi. Machine Learning

SVM untuk Regresi. Machine Learning MMA10991 Topik Khusus - Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Liu opini merupakan pernyataan subyektif yang mencerminkan sentimen orang atau persepsi tentang entitas dan peristiwa [1]. Opini atau pendapat orang lain terhadap

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1. 1.1 Latar Belakang Perkembangan dunia telekomunikasi meningkat secara signifikan dalam kurun waktu satu dekade terahir. Tidak hanya dari segi jumlah pengguna, jenis layanan yang ditawarkanpun

Lebih terperinci

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma.

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma. BAB II DASAR TEORI Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma. 2.1. Microsoft Visual Studio Microsoft Visual Studio adalah sebuah software yang

Lebih terperinci

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah 1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Opini adalah pendapat pribadi yang tidak obyektif dan tidak melalui proses verifikasi (Quirk et al., 1985). Opini orang lain tentang suatu hal menjadi penting dalam

Lebih terperinci

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES 1 BAB I PENDAHULUAN Dalam bab ini akan dibahas latar belakang dilaksanakannya penelitian, identifikasi masalah, batasan masalah, tujuan penelitian, manfaat penelitian, dan sistematika penulisan. Latar

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN. 1.1 Latar belakang BAB I PENDAHULUAN 1.1 Latar belakang Dalam beberapa tahun terakhir teknologi informasi dan telekomunikasi berkembang dengan pesat. Masyarakat mendapatkan manfaat dari tekonologi informasi dan telekomunikasi

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Apa yang orang lain pikirkan telah menjadi sesuatu yang penting untuk menjadi pertimbangan dalam pengambilan keputusan (Pang and Lee, 2006). Sesuatu yang orang lain

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pemilihan Gubernur serentak untuk memilih para pemimpin rakyat akan dilaksanakan pada tahun 2017. Ini merupakan pemilihan kepala daerah serentak ke dua yang akan diselengarakan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE Jurnal Informatika Polinema ISSN: 2407-070X IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE Faisal Rahutomo 1, Pramana Yoga Saputra 2, Miftahul Agtamas

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang website adalah salah satu layanan yang bisa digunakan untuk melakukan pencarian berbagai informasi, sehingga sangat dibutuhkan untuk keperluan pengguna dalam pencarian

Lebih terperinci

Support Vector Machine

Support Vector Machine MMA10991 Topik Khusus Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kehadiran teknologi web yang interaktif telah merubah cara orang mengekspresikan pandangan dan opininya. Saat ini pengguna dapat menulis ulasan suatu produk pada situs

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait Penelitian terkait dengan topik analisis sentimen cukup banyak, berikut beberapa penelitian yang tekait dengan analisa sentimen yang menggunakan seleksi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang pesat mempermudah akses terhadap informasi tekstual yang sangat besar jumlahnya, baik yang terdapat pada Internet maupun pada koleksi dokumen

Lebih terperinci

Model Linear untuk Klasifikasi

Model Linear untuk Klasifikasi MMA10991 Topik Khusus - Machine Learning Model Linear untuk Klasifikasi Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439,

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan media online mendorong munculnya informasi tekstual yang tidak terbatas, sehingga muncul kebutuhan penyajian tanpa mengurangi nilai dari informasi tersebut.

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Indonesia. Klasifikasi topik menggunakan..., Dyta Anggraeni

BAB 1 PENDAHULUAN. Universitas Indonesia. Klasifikasi topik menggunakan..., Dyta Anggraeni BAB 1 PENDAHULUAN Pada bab ini dijelaskan latar belakang dari penelitian yang memberikan gambaran awal mengenai klasifikasi topik dan perannya dalam perkembangan teknologi informasi. Tujuan dan ruang lingkup

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Seiring berkembangnya teknologi informasi saat ini maka berkembang pula perangkat perangkat yang mendukung guna akses informasi yang semakin dibutuhkan dalam waktu

Lebih terperinci

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan BAB I PENDAHULUAN 1.1 Latar Belakang Social media merupakan salah satu tren yang berkembang di masyarakat sebagai tempat untuk berinteraksi. Selain untuk berinteraksi dengan lingkungan sosialnya pengguna

Lebih terperinci

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE DRAFT JURNAL ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE SENTIMENT ANALYSIS FOR TWITTER ABOUT ONLINE INDONESIAN TRANSPORTATION WITH

Lebih terperinci

SVM untuk Regresi Ordinal

SVM untuk Regresi Ordinal MMA10991 Topik Khusus - Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

HASIL DAN PEMBAHASAN

HASIL DAN PEMBAHASAN 10 HASIL DAN PEMBAHASAN Pengumpulan Dokumen Tahapan awal yang dilakukan dalam penelitian adalah mengolah dokumen XML yang akan menjadi korpus. Terdapat 21578 dokumen berita yang terdiri atas 135 topik.

Lebih terperinci

1. Pendahuluan 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar Belakang 1. Pendahuluan 1.1 Latar Belakang Teknologi semakin berkembang seiring dengan berjalannya waktu. Disadari atau tidak, sebagian besar kehidupan ini dibantu oleh teknologi dan banyak sekali manfaat yang

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1. 1.1 Latar Belakang Kemunculan jejaring sosial Facebook di tahun 2004 telah berhasil menarik minat jutaan orang diberbagai belahan dunia untuk bergabung menggunakan layanannya. Hal

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Situs belanja online sering disebut juga dengan situs e-commerce yaitu suatu proses membeli dan menjual produk-produk secara elektronik oleh konsumen dan dari perusahaan

Lebih terperinci

IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR

IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas

Lebih terperinci

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. BAB I PENDAHULUAN 1. 1.1. Latar Belakang Perkembangan infrastruktur dan penggunaan teknologi informasi memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah perolehan

Lebih terperinci

BAB III ANALISIS DAN PENYELESAIAN MASALAH

BAB III ANALISIS DAN PENYELESAIAN MASALAH BAB III ANALISIS DAN PENYELESAIAN MASALAH 3.1 Deskripsi Sistem Gambar III-1 Deskripsi Umum Sistem Pada gambar III-1 dapat dilihat deskripsi sistem sederhana yang mendeteksi intrusi pada jaringan menggunakan

Lebih terperinci

Metode Kernel. Machine Learning

Metode Kernel. Machine Learning MMA10991 Topik Khusus Machine Learning Metode Kernel Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439,

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Information age atau computer age adalah suatu era dimana kebutuhan seseorang akan informasi menjadi suatu hal yang sangat penting. Pada saat era informasi ini seseorang

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini media sosial seperti Twitter telah berkembang pesat. Data global menyebut pada akhir Desember 2014 Twitter memiliki 284 juta pengguna aktif. Dick Costolo

Lebih terperinci

BAB I PENDAHULUAN.

BAB I PENDAHULUAN. BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini smartphone telah berevolusi menjadi komputer pribadi kecil dan portabel yang memungkinkan pengguna untuk melakukan penjelajahan internet, mengirim e-mail

Lebih terperinci

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali BAB I PENDAHULUAN 1.1. Latar Belakang Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali objek 3 dimensi. Sistem penglihatan manusia dapat membedakan berbagai macam objek 3 dimensi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi dewasa ini sudah mempengaruhi kebutuhan manusia modern, hal ini ditandai dengan penggunaan teknologi disetiap aspek kehidupan manusia yang berguna

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( )

ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( ) ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. (0927050) Jurusan Sistem Komputer, Fakultas Teknik, Jalan Prof. Drg. Suria Sumantri

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah BAB I PENDAHULUAN Pada bagian ini akan dijelaskan tentang pendahuluan dalam penyusunan Laporan Penelitian. Pendahuluan meliputi latar belakang masalah, rumusan masalah, tujuan penelitian, batasan masalah,

Lebih terperinci

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

SVM untuk Ranking. Model Linear

SVM untuk Ranking. Model Linear MMA10991 Topik Khusus - Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan BAB I PENDAHULUAN Sebagai negara berkembang, perekonomian Indonesia didorong untuk tumbuh dengan pesat. Salah satu indikator pertumbuhan perekonomian yang baik adalah tingginya daya beli masyarakat. Tingginya

Lebih terperinci

SISTEM ANALISIS SENTIMEN POSITIF DAN NEGATIF MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES PADA KASUS TOKOH PUBLIK CAPRES INDONESIA 2014

SISTEM ANALISIS SENTIMEN POSITIF DAN NEGATIF MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES PADA KASUS TOKOH PUBLIK CAPRES INDONESIA 2014 SISTEM ANALISIS SENTIMEN POSITIF DAN NEGATIF MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES PADA KASUS TOKOH PUBLIK CAPRES INDONESIA 2014 Oleh Yosafat Gerald Montalili NIM : 612006047 Skripsi Untuk melengkapi

Lebih terperinci

Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine

Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine Anita Novantirani 1, Mira Kania Sabariah S.T., M.T 2, Veronikha Effendy,

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Gaya Belajar Penelitian tentang gaya belajar telah banyak dilakukan untuk dapat mengenali jenis gaya belajar dari mahasiswa. Banyak learning styles model yang telah dikembangkan

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Dalam mencapai tujuan pembangunan ekonomi diperlukan peran serta lembaga keuangan untuk membiayai pembangunan tersebut. Lembaga keuangan memegang peranan penting dalam

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED

ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED ISSN : 2355-9365 e-proceeding of Engineering : Vol.3, No.2 Agustus 2016 Page 3654 ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED ASPECT LEVEL SENTIMENT CLASSIFICATION

Lebih terperinci

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK Lukman Syafie / JUPITER Volume XV No.2 (2016) 109 KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK Lukman Syafie Staf Pengajar Teknik Informatika, Fakultas Ilmu Komputer

Lebih terperinci

SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER

SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER Anindya Apriliyanti P. Departemen Statistika FMIPA Universitas Padjadjaran a.apriliyanti.p@gmail.com

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) SKRIPSI Disusun Oleh : MEKAR SEKAR SARI NIM. 24010210120008 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

ABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA

ABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA ABSTRAK Twitter merupakan sebuah aplikasi social networking yang memungkinkan usernya untuk dapat mengirimkan pesan pada waktu yang bersamaan. Data yang diambil melalui Twitter dapat dijadikan sebagai

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Selain sebagai media komunikasi, Twitter memberikan akses bagi pihak ketiga yang ingin mengembangkan aplikasi yang memanfaatkan layanannya melalui Twitter API. Salah

Lebih terperinci

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Informasi telah menjadi kebutuhan utama dalam kehidupan manusia. Informasi bisa dikatakan sebagai pengetahuan yang didapatkan dari pembelajaran, pengalaman, atau instruksi.

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak

BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak BAB I PENDAHULUAN 1.1 Latar Belakang Berkembangnya teknologi informasi yang begitu pesat ini, banyak memberikan dampak positif maupun negatif khususnya di Indonesia. Dampak positifnya seperti, masyarakat

Lebih terperinci

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam.

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam. BAB I PENDAHULUAN 1.1 Latar Belakang Setiap warga muslim di dunia membutuhkan informasi makanan halal, agar mereka terhindar dari yang namanya perbuatan dosa. Karena di dalam agama islam, sebagai umat

Lebih terperinci

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter, BAB I PENDAHULUAN 1.1. Latar Belakang Popularitas media jejaring sosial terus mengalami peningkatan dalam beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter, Facebook,

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Sumber opini teks saat ini tersedia berlimpah di internet akan tetapi belum sepenuhnya dimanfaatkan karena masih kurangnya tool yang ada, sedangkan perkembangan

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Twitter bagian dari Social Networking website yang memperbolehkan pengguna untuk mengirim dan membaca 140 karakter, atau sering disebut tweets[1]. Berdasarkan survey

Lebih terperinci

Analisis Akurasi Support Vector Machine...

Analisis Akurasi Support Vector Machine... ANALISIS AKURASI SUPPORT VECTOR MACHINE DENGAN FUNGSI KERNEL GAUSSIAN RBF UNTUK PRAKIRAAN BEBAN LISTRIK HARIAN SEKTOR INDUSTRI Luqman Assaffat 1 * 1 Jurusan Teknik Elektro, Fakultas Teknik, Universitas

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Situs jejaring sosial merupakan gaya hidup sosial baru yang muncul seiring berkembangnya internet. Gaya hidup baru tersebut memiliki ruang lingkup yang lebih luas

Lebih terperinci

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang,

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang, BAB I PENDAHULUAN Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, metodologi, dan sistematika penulisan. 1.1 Latar Belakang

Lebih terperinci

Analisis Sentimen Menggunakan Support Vector Machine dan Maximum Entropy. Sentiment Analysis Using Support Vector Machine and Maximum Entropy Method

Analisis Sentimen Menggunakan Support Vector Machine dan Maximum Entropy. Sentiment Analysis Using Support Vector Machine and Maximum Entropy Method ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.2 Agustus 2017 Page 2389 Abstrak Analisis Sentimen Menggunakan Support Vector Machine dan Maximum Entropy Sentiment Analysis Using Support Vector

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Perkembangan informasi global menuntut penyediaan informasi tersebut dapat dinikmati / dirasakan secara cepat dan tepat. Informasi yang diinginkan dapat diakomodasi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan merupakan salah satu aspek penting di dalam kehidupan. Oleh karena itu, pendidikan mendapat perhatian besar dalam kehidupan masyarakat dan negara. Pendidikan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Penelitian terdahulu sangat penting bagi penulis untuk mengetahui referensi dan hubungan antara penelitian terdahulu dengan penelitian yang dilakukan saat ini, sehingga hal duplikasi

Lebih terperinci

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 12, Desember 2017, hlm. 1725-1732 http://j-ptiik.ub.ac.id Analisis Sentimen Tingkat Kepuasan Pengguna Penyedia Layanan

Lebih terperinci

BAB I.PENDAHULUAN Latar Belakang Masalah Perumusan Masalah

BAB I.PENDAHULUAN Latar Belakang Masalah Perumusan Masalah 1 BAB I.PENDAHULUAN 1.1 Latar Belakang Masalah Sosial media seperti Twitter telah menciptakan sebuah wadah bagi orang untuk menyebarkan informasi, pemikiran atau pun perasaan tentang kehidupan mereka sehari-hari.

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

ANALISIS SENTIMEN DATA PRESIDEN JOKOWI DENGAN PREPROCESSING NORMALISASI DAN STEMMING MENGGUNAKAN METODE NAIVE BAYES DAN SVM. Oleh:

ANALISIS SENTIMEN DATA PRESIDEN JOKOWI DENGAN PREPROCESSING NORMALISASI DAN STEMMING MENGGUNAKAN METODE NAIVE BAYES DAN SVM. Oleh: Jurnal Dinamika Informatika Volume 5, Nomor 1, November 2015 ANALISIS SENTIMEN DATA PRESIDEN JOKOWI DENGAN PREPROCESSING NORMALISASI DAN STEMMING MENGGUNAKAN METODE NAIVE BAYES DAN SVM Oleh: Nurirwan Saputra

Lebih terperinci

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

ISSN SUPPORT VECTOR MACHINE PADA INFORMATION RETRIEVAL. Oleh....(I Ketut Purnamawan)

ISSN SUPPORT VECTOR MACHINE PADA INFORMATION RETRIEVAL. Oleh....(I Ketut Purnamawan) ISSN 0216-3241 173 SUPPORT VECTOR MACHINE PADA INFORMATION RETRIEVAL Oleh I Ketut Purnamawan Jurusan Manajemen Informatika Fakultas Teknik dan Kejuruan Universitas Pendidikan Ganesha tutpurna@yahoo.com

Lebih terperinci

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

1 BAB I PENDAHULUAN. 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan infrastruktur teknologi informasi dan penggunaannya berdampak luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah dalam memperoleh

Lebih terperinci

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang 1 BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang Intelligent agent, sebagai bagian dari kecerdasan buatan yang dapat diterapkan pada sistem dalam menyelesaikan sebuah permasalahan. Agen yang diterapkan

Lebih terperinci

3.1 Desain Penelitian

3.1 Desain Penelitian 24 BAB 3 METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian merupakan tahapan yang akan dilakukan penulis dalam melakukan penelitian. Tahapan penelitian yang digunakan

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

BAB 1 PENDAHULUAN. Universitas Sumatera Utara 1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Kata kunci (keyword) merupakan kata-kata singkat yang dapat menggambarkan isi suatu artikel ataupun dokumen (Figueroa,et al. 2014). Kata kunci memberikan kemudahan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi

Lebih terperinci

BAB 3. METODOLOGI PENELITIAN

BAB 3. METODOLOGI PENELITIAN BAB 3. METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian Pada penelitian ini menggunakan alat penelitian berupa perangkat keras dan perangkat lunak, yaitu : 1. Perangkat keras a. Processor Intel Core

Lebih terperinci

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)

Lebih terperinci