ANALISIS SENTIMEN DENGAN KLASIFIKASI NAÏVE BAYES PADA PESAN TWITTER MENGGUNAKAN DATA SEIMBANG EGA ADITYAWAN

Ukuran: px
Mulai penontonan dengan halaman:

Download "ANALISIS SENTIMEN DENGAN KLASIFIKASI NAÏVE BAYES PADA PESAN TWITTER MENGGUNAKAN DATA SEIMBANG EGA ADITYAWAN"

Transkripsi

1 ANALISIS SENTIMEN DENGAN KLASIFIKASI NAÏVE BAYES PADA PESAN TWITTER MENGGUNAKAN DATA SEIMBANG EGA ADITYAWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014

2

3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Analisis Sentimen dengan Klasifikasi Naïve Bayes pada Pesan Twitter Menggunakan Data Seimbang adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Agustus 2014 Ega Adityawan NIM G

4 ABSTRAK EGA ADITYAWAN. Analisis Sentimen dengan Klasifikasi Naïve Bayes pada Pesan Twitter Menggunakan Data Seimbang. Dibimbing oleh AHMAD RIDHA. Penelitian ini bertujuan untuk mengklasifikasi data tweet menjadi 3 sentimen yaitu positif, negatif, dan netral menggunakan data seimbang. Data yang digunakan terdiri atas 8 entitas berbeda dengan masing-masing entitas setiap sentimennya terdiri atas data. Pengklasifikasian data tweet menggunakan metode naïve Bayes dengan Multinomial dan Bernoulli. Sebelum klasifikasi, dilakukan beberapa tahap praproses seperti normalisasi dan pembuangan stopwords. Pengujian dilakukan pada 60 data setiap entitas per sentimennya untuk mendapatkan model terbaik menggunakan 3-fold cross validation. Setelah itu, data yang tersisa pada setiap entitas per sentimennya dianggap menjadi data baru. Data baru tersebut akan dilakukan klasifikasi dengan menggunakan data latih dari model terbaik pada 3-fold cross validation. klasifikasi pada data baru menunjukkan, metode naïve Bayes memberikan nilai akurasi sebesar 71.09% untuk Multinomial dan 66.42% untuk Bernoulli. Adapun nilai akurasi tiap sentimennya untuk model Multinomial dan Bernoulli masing-masing yaitu 58.62% dan 64.53% untuk sentimen positif, 77.42% dan 65.53% untuk sentimen negatif, 64.40% dan 84.18% untuk sentimen netral. Katakunci: Analisis Sentimen, Data Seimbang, Klasifikasi, Naïve Bayes, Twitter ABSTRACT EGA ADITYAWAN. Sentiment Analysis with Naïve Bayes Classification on Twitter Data Using Balanced Data. Supervised by AHMAD RIDHA. The purpose of this research is to classify tweet data into 3 sentiments, i.e., positive, negative, and neutral using balanced data. The data consists of 8 different entities where each entity consists of tweets for each sentiment. Data classification uses naïve Bayes with Multinomial and Bernoulli method. Before classification, preprocessing includes normalization and stopword removal. Evaluation is conducted on 60 data of each entity per sentiment to get the best model using 3-fold cross validation. After that, the remaining data from previous evaluation is considered to be new data. The new data will be classified using the training data of the best models in the 3-fold cross validation. Classification results on new data shows, that naïve Bayes method gives an accuracy rate of 71.09% and 66.42% for the Multinomial and Bernoulli. The accuracy rate of each sentiment for Multinomial and Bernoulli models respectively are 58.62% and 64.53% and for the positive sentiment, 77.42% and 65.53% for the negative sentiment, 64.40% and 84.18% for the neutral sentiment. Keywords: Balanced Data, Classification, Naïve Bayes, Sentiment Analyst, Twitter.

5 ANALISIS SENTIMEN DENGAN KLASIFIKASI NAÏVE BAYES PADA PESAN TWITTER MENGGUNAKAN DATA SEIMBANG EGA ADITYAWAN Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014

6 Penguji : 1 Aziz Kustiyo, SSi MKom 2 Dr Imas S Sitanggang, SSi MKom

7 Judul Skripsi : Analisis Sentimen dengan Klasifikasi Naïve Bayes pada Pesan Twitter Menggunakan Data Seimbang Nama : Ega Adityawan NIM : G Disetujui oleh Ahmad Ridha, SKom MS Pembimbing Diketahui oleh Dr Ir Agus Buono, MSi MKom Ketua Departemen Tanggal Lulus:

8 PRAKATA Segala puji bagi Allah subhanahu wata ala atas segala rahmat serta karunia- Nya yang telah diberikan sehingga penulis mampu menyelesaikan karya ilmiah ini dengan baik. Shalawat dan salam semoga senantiasa tercurah kepada Nabi Muhammad shallallahu alaihi wasallam serta kepada keluarganya, sahabatnya, serta para pengikutnya yang selalu berpegang kepada Al-Quran dan As-Sunnah. Terima kasih penulis ucapkan kepada Bapak Ahmad Ridha, SKom MS selaku pembimbing yang telah memberikan banyak ide, saran, bantuan, serta dukungan sampai selesainya karya ilmiah ini, serta yang telah berkenan menjadi penguji Bapak Aziz Kustiyo, SSi MKom dan Ibu Dr Imas S Sitanggang, SSi MKom yang telah banyak memberikan saran. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, adik, serta seluruh keluarga, atas doa dan kasih sayangnya. Terima kasih juga disampaikan kepada Ahmad Thoriq Abdul Aziz atas bantuan diberikannya semua sumberdaya pada penelitian sebelumnya serta rekan-rekan seperjuangan di Ilmu Komputer IPB angkatan 47 atas segala kebersamaan, bantuan, dukungan, serta kenangan bagi penulis selama menjalani masa studi. Semoga karya ilmiah ini bermanfaat. Bogor, Agustus 2014 Ega Adityawan

9 DAFTAR ISI DAFTAR TABEL x DAFTAR LAMPIRAN x PENDAHULUAN 1 Latar Belakang 1 Tujuan Penelitian 1 Manfaat Penelitian 2 Ruang Lingkup Penelitian 2 METODE 2 Pengumpulan Data 3 Penentuan Sentimen Secara Manual 3 Normalisasi Teks 3 Evaluasi Normalisasi Teks 3 Pembuangan Stopword 4 K-fold Cross Validation 4 Klasifikasi Menggunakan Naïve Bayes 4 Evaluasi Klasifikasi 6 Lingkungan Implementasi 6 HASIL DAN PEMBAHASAN 6 Pengumpulan Data 6 Penentuan Sentimen Secara Manual 6 Normalisasi Teks 7 Evaluasi Normalisasi Teks 7 Pembuangan Stopword 7 K-fold Cross Validation 8 Klasifikasi Menggunakan Naïve Bayes 9 KESIMPULAN DAN SARAN 11 Kesimpulan 11 Saran 12 DAFTAR PUSTAKA 12 RIWAYAT HIDUP 22

10 DAFTAR TABEL 1 3-Fold Cross Validation untuk entitas XL Fold Cross Validation 9 3 Confusion matrix untuk hasil klasifikasi menggunakan naïve Bayes model Multinomial 11 4 Confusion matrix untuk hasil klasifikasi menggunakan naïve Bayes model Bernoulli 11 DAFTAR LAMPIRAN 1 Contoh keyword pada pengumpulan data 13 2 Contoh tabel kamus kata dalam normalisasi teks 13 3 Daftar kata buang pada stoplist (Ridha et al. 2002) 14 4 Daftar kata tambahan normalisasi teks 15 5 Confusion matrix 3-fold cross validation terbaik 16 6 Contoh tabel kata dan frekuensi pada tiap sentimen 20 7 Contoh tabel kata dan peluang pada tiap sentimen 21

11

12 2

13 1 PENDAHULUAN Latar Belakang Jejaring sosial adalah struktur sosial yang terdiri atas elemen-elemen individual atau organisasi. Jejaring sosial menunjukkan cara mereka berhubungan karena kesamaan sosial, mulai dari mereka yang dikenal sehari-hari sampai dengan keluarga (Barnes 1969). Terjadinya perubahan era teknologi membuat banyak dikenalnya sosial media yang merupakan sebuah media untuk bersosialisasi satu sama lain. Sosialisasi secara online yang memungkinkan manusia untuk saling berinteraksi tanpa dibatasi ruang dan waktu (Saumi 2012). Twitter merupakan salah satu social networking yang tersedia dan cukup populer. Twitter berada di urutan 8 untuk situs umum yang sering dikunjungi (Alexa 2013). Menurut data yang dirilis Twitter, pada tahun 2012 Indonesia menjadi negara dengan pengguna Twitter terbesar kelima di dunia (Tempo 2012). Lalu Jakarta juga didaulat sebagai penyumbang 2.4% tweet yang lalu lalang selama bulan Juni 2012 berdasarkan 1058 miliar tweet publik yang diambil datanya (Semiocast 2012). Data ini menjadi dasar untuk dilakukannya penelitian pada Twitter. Aziz (2013) telah melakukan analisis sentimen dengan proses klasifikasi pada entitas yang sedang dibicarakan pada Twitter. klasifikasinya pun menunjukkan akurasi 96%, namun akurasi setiap sentimennya sangat tidak berimbang. Sentimen netral memiliki akurasi yang jauh lebih besar yaitu 97% dibandingkan sentimen positif dan negatif yang masing-masing hanya 30% dan 0%. Hal ini disebabkan oleh jumlah data sentimen netral yang lebih banyak dibanding sentimen lainnya. Jumlah data sentimen netral terdiri atas data sedangkan sentimen positif dan negatif masing-masing terdiri atas 657 data dan 143 data. Pada penelitian ini dilakukan pengambilan data ulang dengan data yang lebih seimbang pada setiap sentimennya. Sebelum proses klasifikasi, dilakukan tahap praproses yaitu normalisasi teks untuk mengubah kata yang tidak baku menjadi kata baku dan pembuangan stopwords untuk membuang kata yang kemunculannya tinggi tetapi tidak memiliki arti. Proses pengujiannya pun menggunakan 3-fold cross validation agar didapat model terbaik pada data tersebut. Perumusan Masalah Rumusan masalah dalam penelitian ini adalah adanya permasalahan imbalanced data yang belum diperhatikan pada penelitian sebelumnya yang dilakukan oleh Aziz (2013). Tujuan Penelitian Penelitian ini bertujuan mengklasifikasikan data tweet dengan jenis data seimbang pada sentimen yang telah ditentukan menggunakan metode naïve Bayes dengan model Multinomial dan Bernoulli.

14 2 Manfaat Penelitian Penelitian ini diharapkan dapat membantu entitas yang ingin mengetahui perbincangan tentang entitas tersebut di Twitter. Selain itu, penelitian ini diharapkan dapat memberikan informasi mengenai perbincangan tersebut apakah mengandung sentimen positif, negatif, atau netral. Ruang Lingkup Penelitian Ruang lingkup penelitian ini menggunakan data statis dari Twitter yang telah dikumpulkan dan berbahasa Indonesia. Data tweet diklasifikasikan menggunakan teknik naïve Bayes dengan 3 kelas sentimen, yaitu positif, negatif, dan netral. Penelitian ini tidak menangani keberadaan entitas yang ambigu. METODE Metode yang digunakan dalam penelitian ini terdiri atas 8 tahap, seperti pada Gambar 1. Tahap pertama adalah pengumpulan data. Data yang digunakan berasal dari jejaring sosial Twitter. Setelah data didapatkan, langkah selanjutnya ialah melakukan penentuan sentimen secara manual terhadap data tersebut. Kemudian, data dianalisis untuk mendapatkan sentimennya. Namun, sebelum dilakukan analisis sentimen, data harus masuk ke dalam tahap praproses terlebih dahulu, yaitu normalisasi dan pembuangan stopwords. Normalisasi teks bertujuan mengubah tweet yang awalnya sulit dimengerti menjadi tweet yang mudah dimengerti. Untuk mengetahui tingkat efektivitas proses normalisasi teks ini, dilakukan evaluasi terhadap hasil normalisasi. Tahap praproses selanjutnya adalah pembuangan stopwords, pada proses ini kata-kata yang kemunculannya tinggi dan dianggap tidak memiliki makna akan dihilangkan. Setelah itu dilakukan k-fold cross validation dengan tujuan mendapatkan model data latih terbaik. Pada bagian klasifikasi sentimen digunakan klasifikasi naïve Bayes model Multinomial dan Bernoulli. Tahap terakhir adalah evaluasi hasil klasifikasi. 1. Pengumpulan Data 6. K-fold Cross Validation 2. Penentuan Sentimen Secara Manual 5. Pembuangan Stopword 3. Normalisasi Teks 4. Evaluasi Normalisasi Teks 7. Klasifikasi Menggunakan Naïve Bayes 8. Evaluasi Klasifikasi Gambar 1 Metode penelitian

15 3 Pengumpulan Data Tahap pertama adalah pengumpulan data. Data berupa kumpulan tweet yang belum terklasifikasi namun sudah diekstraksi berdasarkan keyword yang ditentukan. Penentuan keyword (contoh pada Lampiran 1), ditentukan sesuai entitas yang ingin di ambil datanya. Data diperoleh selama periode 1 Februari 2014 sampai dengan 20 April Pengambilan data ini memanfaatkan Twitter API dan dilakukan secara real time menggunakan aplikasi yang telah dibuat oleh Hawksey (2013). Untuk menghindari adanya tweet spam digunakan juga batas minimal follower suatu akun yaitu 200. Tiap tweet dilengkapi dengan atribut seperti identitas, sentimen, topik, isi pesan, keyword, nama pengguna Twitter, nama entitas, tanggal, dan identitas editor. Penentuan Sentimen Secara Manual Penentuan sentimen secara manual adalah pengelompokan data pada sentimen yang telah ditentukan sebelumnya secara manual agar dapat digunakan untuk kebutuhan klasifikasi. Data tweet dikelompokkan menurut pendapat dari peneliti sehingga pengelompokannya bersifat subjektif. Normalisasi Teks Tweet hasil pengumpulan data selanjutnya dinormalisasi. Hal ini bertujuan mempermudah proses analisis sentimen terhadap entitas-entitas tadi mengingat banyaknya kata yang tidak baku didalam tweet seperti singkatan, tanggal, jumlah mata uang, dan akronim. Kata yang tidak baku memiliki kecenderungan yang lebih tinggi dalam hal ambiguitas interpretasinya atau pelafalannya dibanding kata yang sudah baku. Misalnya, kata kamu bisa ditulis dengan kata lo, km,kmu, anda, dan masih banyak lagi. Jika tidak dilakukan normalisasi, kata-kata tersebut akan berdiri sendiri. Padahal, seharusnya kata-kata tersebut terkelompokkan ke dalam konteks yang sama, yaitu saya. Kasus semacam ini dapat diselesaikan dengan normalisasi teks dengan cara mengganti kata yang tidak baku dengan kata yang sesuai konteksnya (Sproat et al. 2001). Proses normalisasi teks dilakukan menggunakan penggantian pada kata yang tidak baku menjadi kata baku dengan sistem yang telah dibuat oleh Aziz (2013). Sebelum dilakukan penggantian dengan kata baku, harus dibuat terlebih dahulu sebuah kamus yang berisi kata yang tidak baku berikut kata bakunya (contoh pada Lampiran 2). Evaluasi Normalisasi Teks Tweet hasil normalisasi teks dievaluasi secara manual. Evaluasi ini bertujuan menghitung tingkat akurasi dari hasil normalisasi. Proses evaluasi dilakukan terhadap 1000 tweet yang diambil secara acak mengingat banyaknya jumlah tweet yang ada.

16 4 Pembuangan Stopword Tahap ini dilakukan dengan menghilangkan kata yang termasuk dalam daftar kata buang pada data tweet setelah selesai dilakukan proses normalisasi teks. Kata buang adalah kata yang tingkat kemunculannya tinggi namun tidak memiliki arti untuk proses klasifkasi. Daftar kata buang didapat dari penelitian Ridha et al. (2004). Daftar kata buang dapat dilihat pada Lampiran 3. K-fold Cross Validation Pada proses selanjutnya dilakukan proses k-fold cross validation yaitu dengan membagi dataset sebanyak k subset data yang jumlahnya sama besar dan melakukan uji coba dengan satu subset data menjadi data uji dan subset data lainnya menjadi data latih (Meira dan Zaki 2014). Proses fold dilakukan hingga setiap subset data tepat satu kali menjadi data uji. Pada penelitian ini, data dibagi menjadi 3 subset data dengan jumlah data masing-masing 60 data setiap entitas per sentimennya. Pengujian pada proses ini menggunakan metode naïve Bayes dengan model Multinomial dan Bernoulli. Nantinya pasangan subset terbaik dari hasil proses ini akan digunakan sebagai data latih untuk proses klasifikasi pada data yang tersisa pada setiap entitas per sentimennya. Klasifikasi Menggunakan Naïve Bayes Proses klasifikasi dilakukan terhadap data tweet hasil praproses untuk mengklasifikasikan entitas berdasarkan respon terhadap entitas tersebut atau analisis sentimen. Sentimen pada penelitian ini terdiri atas 3 kelas, yaitu positif, negatif, dan netral. Tweet yang termasuk di dalam sentimen positif Masyarakat Ingin Presiden Tegas Seperti Prabowo. Sentimen netral Pagi pak prabowo. Sentimen negatif contohnya: Hubungan Baik Indonesia-AS Terancam Memburuk Jika Prabowo Jadi Presiden. Klasifikasi ini menggunakan sistem yang telah dibuat oleh Aziz (2013). Sebelum dilakukan klasifikasi, data dibagi 2 menjadi data latih dan data uji. Data latih digunakan untuk memberi pengetahuan kepada sistem tentang ciri-ciri suatu sentimen. Untuk mengambil ciri-ciri suatu sentimen, dilakukan proses ekstraksi fitur yang di dalamnya terdapat pembobotan kata berdasarkan kemunculan kata. Data uji diperoleh dari data yang tersisa pada proses sebelumnya. Fungsi klasifikasi yang digunakan adalah fungsi klasifikasi dengan basis peluang yaitu naïve Bayes dengan model Multinomial dan model Bernoulli. Penggunaan klasifikasi naïve Bayes dikarenakan prosesnya yang sederhana dan mudah diaplikasikan pada berbagai keadaan serta tidak akan mengalami kegagalan secara keseluruhan pada hasilnya (Manning et al. 2008). Pada model Multinomial, setiap data uji dihitung frekuensi kata t pada tiap data latih sentimen c (T ct ) dan jumlah kata unik pada data uji (N). Kemudian dari data latih, jumlah kata ( t vt ct ) dan jumlah vocabulary (B) dihitung. vocabulary (B) merupakan jumlah kata pada keseluruhan data latih. Setelah frekuensi kata, jumlah kata, dan jumlah vocabulary

17 didapatkan, akan dihitung nilai peluang untuk kata t masuk pada sentimen c (P(t c)). Perhitungan peluang ini dapat bernilai nol apabila frekuensi kata pada data uji di sentimen c (T ct ) bernilai nol. Untuk mengatasi masalah ini, dimasukkan koreksi seperti Laplace smoothing di semua probabilitas perkiraan sehingga peluang tidak bernilai nol (Manning et al. 2008). Perhitungan peluang model Multinomial dapat dilihat pada persamaan berikut: 5 P t c = Tct+1 ( Tct')+B t' V (1) Setelah didapatkan nilai peluang tiap kata, selanjutnya adalah mengalikan nilai peluang tiap kata dengan memberikan pangkat (n) sesuai nilai frekuensi kemunculan kata tersebut pada data uji. nya dikalikan kembali dengan nilai peluang tiap sentimen (P(c)) (Manning et al. 2008). Nilai peluang tiap sentimen (P(c)) dihitung dengan cara membagi jumlah data latih tiap sentimen dengan jumlah data latih keseluruhan sentimen. Perhitungan akhir peluang kalimat pada sebuah sentimen dapat dilihat pada Persamaan 2. Laplace smoothing digunakan agar tidak ada kata uji yang berpeluang nol. yang diambil adalah hasil perkalian yang terbesar pada setiap sentimennya. P c d = N P t c n *P c (2) i=1 Sementara itu, pada model Bernoulli, setiap data uji dihitung nilai peluang tiap kata terhadap masing-masing sentimen. Perbedaannya dengan model yang pertama yaitu perhitungan peluang menggunakan jumlah data yang mengandung kata t (Tct), bukan frekuensi kemunculan kata t (Manning et al. 2008). Selain itu, jika model Multinomial menggunakan jumlah kata dan jumlah vocabulary, model Bernoulli menggunakan jumlah data latih tiap sentimen (Tc) dan jumlah sentimen ( c). Peluang tiap kata dihitung menggunakan persamaan: P t c = Tct+1 Tc+ c (3) Setelah peluang tiap kata didapatkan, nilai dari hasil perkalian invers untuk tiap peluang kata pada data latih selain kata pada data uji dihitung. Misalnya ada sekumpulan kata pada data latih D dan sekumpulan kata pada data uji T. Selanjutnya dicari kata-kata pada data latih D yang independen dengan kata-kata pada data uji T. Dari kata-kata tersebut, diambil nilai peluang kata (dalam hal ini diberi simbol P(t c)) dan jumlah kata (M) (Manning et al. 2008). Nilai peluang kalimat terhadap suatu sentimen dihitung dengan persamaan: N M P c d = P t c *P c * (1-P(t ' c)) i=1 i=1 (4)

18 6 Evaluasi Klasifikasi Tahap terakhir adalah evaluasi untuk mengetahui tingkat akurasi dari hasil klasifikasi data pada data uji. Perhitungan tingkat akurasi dilakukan dengan membandingkan antara hasil klasifikasi menggunakan metode naïve Bayes dan klasifikasi secara manual. Evaluasi ini menggunakan sistem yang telah dibuat oleh Aziz (2013). Lingkungan Implementasi Lingkungan implementasi yang digunakan sebagai berikut: Perangkat lunak: Microsoft Windows 7 Professional 64bit, Notepad , PHP, dan XAMPP beserta MySQL Perangkat keras: prosesor Intel Core i5-2350m 2.30GHz, memori 8 GB, dan hardisk 500 GB HASIL DAN PEMBAHASAN Pengumpulan Data Pada tahap pengumpulan data diperoleh 1997 data tweet yang terdiri dari 8 entitas dengan 8 atribut setiap datanya dan menggunakan 41 keyword yang berbeda untuk pencarian. Setiap entitas per sentimennya terdiri atas sekitar data. Dari atribut yang didapat hanya beberapa atribut saja yang digunakan, yaitu id sebagai pengenal tweet, isi tweet sebagai input system, dan keyword sebagai penciri dari entitas. Data dikumpulkan dengan melakukan penyaringan pada isi tweet-nya menggunakan keyword tertentu. Sebagai contoh untuk melakukan penyaringan data pada entitas 'Prabowo', peneliti menggunakan keyword 'Prabowo'. Nantinya tweet yang mengandung kata 'Prabowo' akan tersaring secara otomatis dan masuk kedalam database. Penentuan Sentimen Secara Manual Tahap penentuan sentimen secara manual dilakukan untuk menentukan sentimen pada setiap tweet yang tersaring dikarenakan data tweet belum terklasifikasi secara otomatis. Tidak semua tweet yang didapat secara real time diberikan sentimen, ada beberapa tweet yang cenderung ambigu sehingga dapat mempengaruhi akurasi dari proses klasifikasi. Contoh tweet yang Sebenernya Aku setuju pd prabowo namun tdk setuju pada sikapnya. Tweet ambigu tidak dimasukkan karena tidak termasuk pada ruang lingkup penelitian ini.

19 7 Normalisasi Teks Banyak tweet yang mengandung kata tidak baku. Kata yang tidak baku dapat berupa pengulangan karakter sehingga sulit dikenali maupun singkatansingkatan kata, knapa sinyal hp ku sdh 3 hr ini tidak ada?. Kasus pengulangan karakter perlu dilakukan penghilangan karakter yang berulang. Penghilangan karakter hanya dilakukan pada perulangan karakter teks, bukan karakter angka, karena jika dilakukan pada angka justru membuat tweet semakin sulit dipahami atau memiliki arti yang berbeda. Contohnya pada kasus perulangan angka nomor telepon 0011 yang angka 1 dan 0 pada nomer telepon tersebut tidak akan dilakukan penghilangan. Pada kasus singkatan-singkatan kata yang tidak baku, dibuat sebuah kamus yang berisi kata yang tidak baku beserta kata bakunya. Proses normalisasi melalui 2 tahap, pertama adalah menghilangkan semua tanda baca seperti titik, tanda koma, dan tanda tanya. Setelah itu dilakukan proses penggantian kata tidak baku yang ada di tweet dengan kata baku berdasarkan kamus yang sebelumnya sudah di siapkan. Kata yang dianggap tidak baku akan digantikan oleh kata yang baku secara otomatis oleh sistem. Kamus yang digunakan diambil dari penelitian Aziz (2013) dengan melakukan penambahan beberapa kata (Lihat Lampiran 4) disebabkan oleh karena adanya perbedaan entitas yang digunakan pada penelitian ini. Dalam normalisasi teks juga terdapat beberapa kasus kata yang tidak tertangani karena kata yang tidak baku memiliki makna lebih dari satu, contohnya: bet, bkn, bwt, gws, dah, dan masih banyak lagi. Kata bet bisa berarti banget, namun bisa juga berarti nama panggilan seseorang. Evaluasi Normalisasi Teks Untuk mengetahui hasil normalisasi teks, dilakukan evaluasi secara manual. Sebanyak 1000 tweet diambil sebagai sampel secara acak dan dilakukan proses evaluasi dengan membandingkan tweet sebelumnya. Evaluasi dianggap berhasil jika tweet hasil normalisasi lebih mudah dimengerti secara subjektif. Setiap tweet yang berhasil akan diberikan keterangan 1 dan 0 untuk yang lainnya. Dari total 1000 tweet ada 826 yang memiliki nilai 1 dengan tingkat akurasi 82.6 %. Pembuangan Stopword Tahap praproses selanjutnya yaitu pembuangan stopword. Pada tahap ini suatu data tweet akan dikenali setiap kata yang terkandungnya, bila ada suatu kata yang termasuk dalam daftar kata buang maka kata tersebut akan dihilangkan. Contoh pada tweet "Kenapa XL ini sangat Tweet tersebut dikenali bahwa kata kenapa, sangat, dan ini termasuk dalam daftar kata buang sehingga akan dihilangkan. Setelah dihilangkan data tweet tersebut akan menjadi XL

20 8 K-fold Cross Validation Setelah itu dilakukan pengujian k-fold croos validation untuk 60 data setiap entitas per sentimennya. Setiap kelompok data akan tepat satu kali menjadi data uji dan kelompok lainnya menjadi data latih. Data dibagi menjadi 3 subset data dan diberi label A, B, dan C dengan jumlah masing-masing sebanyak 60 data yang terdiri dari 20 data sentimen positif, 20 data sentimen negatif, dan 20 data sentimen netral. Ada 3 tahap pada proses ini, pertama subset data A dan B akan menjadi data latih sedangkan subset data C akan menjadi data uji. Kedua data kelompok B dan C menjadi data latih sedangkan data kelompok A menjadi data uji. Terakhir data kelompok A dan C menjadi data latih sedangkan data kelompok B menjadi data uji. Ketiga tahap proses tersebut dilakukan terpisah masing-masing untuk setiap entitas per sentimennya agar didapat model terbaik untuk setiap entitas per sentimennya. Setelah semua selesai, didapatkan pasangan subset data yang terbaik dari proses ini. Contoh proses ini sebagai berikut, pada entitas XL dikelompokkan data A, B, dan C. Setelah itu, dilakukan pengujian pada data tersebut. klasifikasi untuk kedua modelnya pada setiap kelompok data untuk entitas XL dapat dilihat pada Tabel 1. Multinomial Bernoulli Perlakuan Akurasi Perlakuan Akurasi Latih (A dan B) Uji (C) Latih (C dan B) Uji (A) Latih (A dan C) Uji (B) Tabel 1 3-Fold Cross Validation untuk entitas XL 43.33% Latih (A dan B) Uji (C) 43.33% Latih (C dan B) Uji (A) 50% Latih (A dan C) Uji (B) 55% 46.67% 60% Model Multinomial pasangan kelompok data A dan C memiliki nilai akurasi lebih besar dibandingkan pasangan kelompok data lainnya sebagai data latih. Begitu juga untuk model Bernoulli, pasangan kelompok data A dan C juga memiliki nilai akurasi yang lebih besar dibandingkan pasangan kelompok data lainnya sehingga kelompok A dan C akan dijadikan sebagai data latih untuk entitas XL pada proses klasifikasi model Multinomial dan Bernoulli untuk data baru. Tidak tertutup kemungkinan bahwa suatu entitas memiliki kelompok data latih yang berbeda untuk digunakan pada kedua modelnya. Untuk hasil K-Fold seluruh entitas beserta nilai akurasi terbaiknya dan pasangan kelompok datanya adalah seperti pada Tabel 2 dan confusion matrix pasangan terbaiknya dapat dilihat pada Lampiran 5.

21 Tabel 2 3-Fold Cross Validation 9 Multinomial Bernoulli Entitas Nilai Kelompok Nilai Kelompok Akurasi Akurasi XL 55% A dan C 60% A dan C TSEL 65% B dan C 80% A dan C Indosat 70% A dan B 68.33% A dan C ARB 75% B dan C 68.33% A dan C HR 85 % A dan C % A dan C Jokowi 65% B dan C 61.67% B dan C Prabowo 85% A dan C 81.67% A dan C Wiranto 85% A dan C 65% B dan C Seperti ditunjukan oleh Tabel 2 dan Lampiran 5, data tweet yang diduga bernilai positif banyak yang hasil klasifikasinya menjadi negatif begitu juga sebaliknya. Hal ini disebabkan oleh belum diperhatikannya penggantian frase pada kata sehingga saat kata tersebut terkena proses stoplist teks akan berubah maknanya pada kata yang sebaliknya. Contohnya pada Pak Wiranto orang yang tidak layak menjadi presiden. Setelah mengalami pemotongan stopword tweet Pak Wiranto orang layak menjadi presiden sehingga tweet yang diduga sentimen negatif, hasil klasifikasinya sentimen positif. Klasifikasi Menggunakan Naïve Bayes Data latih berjumlah 960 yang terdiri atas 320 sentimen positif, 320 sentimen negatif, dan 320 sentimen netral. Data uji berjumlah 557 yang terdiri dari 203 sentimen positif, 177 sentimen negatif, dan 177 sentimen netral. Data uji maupun data latih telah diwakili oleh setiap entitas per sentimennya yang digunakan pada penelitian ini. Data tweet yang tersisa dari proses k-fold cross validation terdiri atas sekitar data dianggap sebagai data baru dan akan menjalani proses klasifikasi sebagai data uji. Proses klasifikasi mengunakan naïve Bayes model Multinomial dan model Bernouli, dengan data latih untuk setiap entitasnya didapatkan dari proses k-fold croos validation yang telah dilakukan. Model pertama yaitu model Multinomial. Model Multinomial menghitung nilai peluang setiap data uji terhadap tiap sentimen dengan mengambil nilai peluang terbesar. Misalnya, sebuah data memliki peluang terhadap sentimen positif sebesar 0.7, sentimen negatif sebesar 0.2, dan sentimen netral sebesar 0.5. Hal ini menunjukkan bahwa data masuk ke dalam sentimen positif. Data uji dalam penelitian ini berupa kalimat sehingga harus dipotong menjadi kata dan dihitung jumlah kata yang unik atau tidak sama (N). Dari tiap kata tersebut, dihitung nilai frekuensi kemunculannya pada keseluruhan data latih di tiap sentimen (Tct) dan frekuensi kemunculannya pada kalimat (n). Untuk mempermudah proses perhitungan frekuensi kemunculan kata pada keseluruhan data latih, dilakukan proses training terhadap data latih. Training ini berupa pembuatan suatu tabel yang berisi kata beserta frekuensi kemunculannya di dalam data latih (contoh pada Lampiran 6). Selanjutnya, jumlah kata pada data latih masing-masing sentimen

22 10 dihitung (Tct'). Total kata pada data latih sentimen positif sebanyak 7065, sentimen negatif sebanyak 3625, dan sentimen netral sebanyak Pada keseluruhan data latih, dihitung juga jumlah kata yang unik atau vocabulary (B) yang dalam penelitian ini berjumlah Setelah nilai Tct, Tct', dan B didapatkan, maka nilai peluang suatu kata terhadap suatu sentimen (P(t c)) dapat dihitung menggunakan Persamaan 1. Setelah nilai peluang tiap kata didapatkan, selanjutnya dicari jumlah data latih keseluruhan suatu sentimen dan jumlah data latih masing-masing sentimen. Nilai peluang kalimat (d) terhadap suatu sentimen (c) dihitung menggunakan Persamaan 2. Penempatan suatu data ke dalam suatu sentimen dilakukan berdasarkan nilai peluang P(c d). Nilai P(c d) terbesar menunjukkan bahwa peluang data untuk masuk ke dalam sentimen tersebut paling besar atau paling memungkinkan. Rata-rata waktu eksekusi yang dibutuhkan dalam proses klasifikasi menggunakan naïve Bayes model Multinomial adalah sebesar 4.30 detik per tweet. Model kedua yaitu model Bernoulli. Model Bernoulli memiliki konsep dasar yang sama dengan model Multinomial. Perbedaannya terletak pada proses perhitungan peluang pada model ini menggunakan jumlah dokumen yang mengandung suatu kata. Langkah pertama, setiap data uji dipotong menjadi katakata. Tiap kata dihitung banyaknya dokumen yang mengandung kata tersebut untuk setiap sentimen (Tct). Kemudian, total dokumen data latih tiap sentimen (Tc) dan jumlah sentimen ( c) dihitung juga. Selanjutnya, nilai peluang tiap kata dihitung dengan Persamaan 3. Untuk mempermudah perhitungan nilai peluang tiap kata, dilakukan proses training seperti pada model Multinomial. Perbedaannya dengan model Multinomial, pada training kali ini dilakukan pembuatan tabel yang berisi kata, nilai peluang, dan sentimen (contoh pada Lampiran 7). Perhitungan nilai peluang kata didapatkan dari tabel jika ada atau menggunakan Persamaan 3 jika tidak dengan nilai Tct = 0. Setelah nilai peluang tiap kata didapatkan, dihitung nilai dari hasil perkalian invers untuk tiap peluang kata pada data latih selain kata pada data uji. Misalnya, ada sekumpulan kata pada data latih D dan sekumpulan kata pada data uji T. Selanjutnya dicari kata-kata pada data latih D yang independen dengan kata-kata pada data uji T. Dari kata-kata tersebut diambil nilai peluang kata (dalam hal ini diberi simbol P(t c)) dan jumlah kata (M). Nilai peluang kalimat terhadap suatu sentimen dihitung menggunakan Persamaan 4. Rata-rata waktu eksekusi yang dibutuhkan dalam proses klasifikasi menggunakan naïve Bayes model Bernoulli adalah sebesar 3.03 detik per tweet. Evaluasi Klasifikasi Tahap terakhir adalah evaluasi hasil dari klasifikasi menggunakan naïve Bayes. Evaluasi bertujuan mengetahui tingkat akurasi klasifikasi. Data tidak terklasifikasi secara benar jika hasil sentimennya berbeda dari sentimen yang seharusnya. Total hasil klasifikasi yang salah dari model Multinomial sebanyak 187 dari 557 sehingga tingkat akurasi sebesar 66.42%. evaluasi model ini dapat dilihat pada Tabel 3 dengan akurasi sentimen negatif sebesar 77.4%, sentimen positif sebesar 58.62%, dan sentimen netral sebesar 64.40%. Sementara itu, untuk model Bernoulli total hasil klasifikasi yang salah sebanyak 161 dari 557

23 sehingga tingkat akurasi sebesar 71.09%. evaluasi model ini dapat dilihat pada Tabel 4 dengan tingkat akurasi sentimen positif sebesar 64.53%, sentimen negatif sebesar 65.53%, dan sentimen netral sebesar 84.18%. Tabel 3 Confusion matrix untuk hasil klasifikasi menggunakan naïve Bayes model Multinomial Positif Negatif Netral Tabel 4 Confusion matrix untuk hasil klasifikasi menggunakan naïve Bayes model Bernoulli Positif Negatif Netral Kebanyakan data yang diduga pada sentimen positif dan negatif justru menghasilkan sentimen netral pada hasil klasifikasinya. Contohnya pada pilih mantan menteri ekonomi pak hatta rajasa presiden. Tweet ini termasuk dalam sentimen positif tetapi hasil klasifikasinya sentimen netral. Kesalahan tersebut dikarenakan kata menteri banyak terdapat pada sentimen netral seperti pada contoh Pak prabowo bertemu menteri pertanian pagi Hari ini Pak Jokowi mendatangi menteri pekerjaan umum. Hal ini terjadi karena suatu kata pada entitas bisa berbeda makna dientitas lainnya. KESIMPULAN DAN SARAN Kesimpulan Simpulan dari penelitian ini adalah sistem pengklasifikasian data tweet menggunakan naïve Bayes pada data seimbang belum menunjukan akurasi yang cukup baik yaitu 66.42% untuk model Multinomial dan 71.09% untuk model Bernoulli. Namun jika dilihat dari akurasi setiap sentimennya sudah cukup baik.

24 12 Selisih akurasi setiap sentimennya tidak terlalu besar dan juga tidak ada satu sentimen yang lebih dominan secara mutlak dibanding sentimen lainnya. Saran Saran untuk penelitian selanjutnya adalah menggunakan metode klasifikasi lainnya dan memperhatikan proses pemecahan frase kata pada data tweet. DAFTAR PUSTAKA [Alexa] Top 500 sites on the web [internet]. [diunduh 2014 januari 1]. Tersedia dari: Aziz ATA Sistem pengklasifikasian entitas pada pesan Twitter menggunakan ekspresi regular dan Naïve Bayes [skripsi]. Bogor (ID): Institut Pertanian Bogor. Barnes JA Graph theory and social networks: a technical comment on connectedness and connectivity. Sociology. 3(2): Hawksey M Twitter Archiving Google Spreadsheet TAGS v5 [internet]. [diunduh 2014 Januari 21]. Tersedia dari: Manning CD, Raghavan P, Schütze H An Introduction to Information Retrieval. Cambridge (UK): Cambridge University Press. Meira JR, Zaki MJ Data Mining and Analysis Fundamental Concepts and Algorithms. Cambridge (UK): Cambridge University Press. Ridha A, Adisantoso J, Bukhari F Pengindeksan otomatis dengan istilah tunggal untuk dokumen berbahasa Indonesia. Prosiding Seminar Nasional Ilmu Komputer dan Teknologi Informasi V, SNIKTI 2014; [Waktu dan tempat pertemuan tidak diketahui]. hlm Saumi RR Apa itu sosial media [internet]. [diunduh 2014 April 24]. Tersedia dari: [Semiocast] Top 20 Cities By Number Of Tweets [Internet]. [diunduh 2013 Des 20]. Tersedia dari: lion_accounts_140m_in_the_us. Sproat S, Black AW, Chen S, Kumar S, Ostendorf M, Richards C Normalization of non-standard words. Computer Speech and Language. 15: doi: /csla [Tempo] Indonesia Pengguna Twitter Terbesar Kelima Dunia [internet]. [diunduh 2013 Des 1]. Tersedia dari:

25 13 Lampiran 1 Contoh keyword pada pengumpulan data No Keyword Entitas 1 xlcare xl 2 xl123 xl 3 indosat indosat 4 indosatcare indosat 5 telkomsel tsel 6 telkomselflash tsel 7 tselbb tsel 8 prabowo prabowo 9 jokowi jokowi 10 wiranto wiranto 11 hatta rajasa hatta rajasa 12 arb arb 13 aburizal bakrie arb 14 hr hatta rajasa Lampiran 2 Contoh tabel kamus kata dalam normalisasi teks No Kata tidak baku Kata baku 1 bgmn bagaimana 2 gakjadi tidak jadi 3 kesane kesannya 4 makin2 makin makin 5 njupuk mengambil 6 nelepon menelpon 7 mangis manggis 8 ngeliatin memperlihatkan 9 sdg sedang 10 buanget banget 11 mantabh mantap 12 dkt dekat 13 mperpanjang memperpanjang 14 maning lagi 15 kemenkes Kementerian Kesehatan 16 ngebo tidur 17 smua semua 18 mrah2-marah marah 19 day hari 20 katany katanya

26 14 Lampiran 3 Daftar kata buang pada stoplist (Ridha et al. 2002) ada biasanya kalau menunjukkan sedang seusai adalah bila kalian menurut sedangkan sewaktu adanya bilamana kami mereka sedikit si adapun buat kamu merupakan segera siapa aduh bukan karena meski sehabis siapakah agar dalam kata meskipun sehingga siapapun ah dan katanya misalnya sehubungan suatu akan dapat kau mungkin sejak sudah aku dari ke namun sejumlah supaya alih-alih daripada kebanyakan nanti sekarang tak anda dekat kecuali nyaris sekeliling tanpa andai demi kemanakah oleh seketika tapi antar demikian kemudian pada sekitar tatkala antara dengan kenapa padahal sekonyong-konyong telah apa depan kenapakah para selagi tengah apakah di kepada pasti selain tentang apalagi dia ketika pelbagai selalu tentu asalkan dikatakan ketimbang per selama tentunya atas dilakukan kini peri selanjutnya tergolong atau dkk kita perihal selesai terhadap ataupun dll lagi pinggir seluruh terjadi bagai dsb lain pula seluruhnya terkadang bagaikan engkau lain-lain pun semakin terlalu bagaimana hal lainnya saat semenjak terlebih bagaimanakah hamper lalu saja sementara termasuk bagaimanapun hanya lebih sambil semua ternyata bagi harus lepas sampai semuanya tersebut bahkan hingga lewat samping seorang tertentu bahwa ia maka sang sepanjang tetap balik ialah makin sangat seperti tetapi banyak ini manakala sangatlah sepertinya tiap barangkali itu masih saya seputar tiba-tiba bawah iya masing-masing seakan seraya tidak beberapa jadi masing-masingnya seakan-akan sering ujar begini jangan maupun seantero seringkali ujarnya begitu jarang melainkan sebab serta umumnya belakang jauh melakukan sebabnya sesuai untuk belum jika melalui sebagai sesuatu walau berapa jikalau memang sebagaimana sesudah walaupun berbagai juga mengatakan sebagainya sesudahnya ya bersama jumlah mengenai sebelum sesungguhnya yaitu beserta justru menjadi sebelumnya setelah yakni betapa kadang menjelang sebuah seterusnya yang biar kadang-kadang menuju secara setiap

27 15 Lampiran 4 Daftar kata tambahan normalisasi teks No Kata tidak baku Kata baku 1 ARB Aburizal Bakrie 2 Aburiezal Aburizal Bakrie 3 HR Hatta Rajasa 4 Hatta Hatta Rajasa 5 Korup Korupsi 6 Berpikir Berfikir 7 UUD Undang-undang 8 Praturan Peraturan 9 Syart Syarat 10 Aturn Aturan 11 RI-1 Presiden 12 Ekonom Ekonomi 13 Pemimpn Pemimpin 14 Kenerja Kinerja 15 Daerh Daerah 16 rakyt Rakyat 17 Mekanism Mekanisme 18 Rpt Rapat 19 Brtemu Bertemu 20 Sanbutan Sambutan 21 Kampoeng Kampung 22 Prospk Prospek 23 Ungulan Unggulan 24 Mentri Menteri 25 N Dan 26 Sopir Supir 27 Calek Caleg 28 Rlawan Relawan 29 Nyoblos Coblos 30 Plih Pilih 31 Greget Cocok 32 Jeblok Turun 33 Kesemsem Senang 34 Amandemn Amandemen 35 berkwalitas berkualitas 36 Nyalonin Calon 37 Bertgs Bertugas 38 Andln Andalan

28 16 Lampiran 5 Confusion matrix 3-fold cross validation terbaik Entitas XL Model Multinomial Positif Negatif Netral Model Bernoulli Positif Negatif Netral Entitas TSEL Model Multinomial Positif Negatif Netral Model Bernoulli Positif Negatif Netral

29 17 Lanjutan Entitas Indosat Model Multinomial Positif Negatif Netral Model Bernoulli Positif Negatif Netral Entitas ARB Model Multinomial Positif Negatif Netral Model Bernoulli Positif Negatif Netral

30 18 Lanjutan Entitas HR Model Multinomial Positif Negatif Netral Model Bernoulli Positif Negatif Netral Entitas Jokowi Model Multinomial Positif Negatif Netral Model Bernoulli Positif Negatif Netral

31 19 Lanjutan Entitas Prabowo Model Multinomial Positif Negatif Netral Model Bernoulli Positif Negatif Netral Entitas Wiranto Model Multinomial Positif Negatif Netral Model Bernoulli Positif Negatif Netral

32 20 Lampiran 6 Contoh tabel kata dan frekuensi pada tiap sentimen No Kata Frekuensi Sentimen 1 edge 1 positif 1 negatif 2 netral 2 survei 1 positif 1 negatif 1 netral 3 masalah 10 positif 8 negatif 12 netral 4 sinyal 17 positif 16 negatif 24 netral 5 jam 6 positif 4 negatif 6 netral 6 jalan 33 positif 26 negatif 35 netral 7 politik 8 positif 3 negatif 8 netral 8 hadiah 2 positif 1 negatif 2 netral 9 menang 5 positif 2 negatif 6 netral 10 kudeta 1 positif 1 negatif 1 netral

33 21 Lampiran 7 Contoh tabel kata dan peluang pada tiap sentimen No Kata Nilai Peluang Sentimen 1 edge positif negatif netral 2 survei positif negatif netral 3 masalah positif negatif netral 4 sinyal positif negatif netral 5 jam positif negatif netral 6 jalan positif negatif netral 7 politik positif negatif netral 8 hadiah positif negatif netral 9 menang positif negatif netral 10 kudeta positif negatif netral

34 22 RIWAYAT HIDUP Penulis dilahirkan di Trenggalek, Jawa Timur pada tanggal 30 Juni 1992 dan merupakan anak pertama dari pasangan Agus Suharyanto dan Narwati. Pada tahun 2010, penulis menamatkan pendidikan di SMAI Nurul Fikri Boarding School, Banten. Penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) pada tahun yang sama melalui jalur Undangan Seleksi Masuk IPB dan diterima sebagai mahasiswa di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Selama aktif menjadi mahasiswa, penulis pernah menjadi asisten praktikum Algoritma dan Pemrograman (2012). Penulis juga melaksanakan kegiatan Praktik Kerja Lapangan di PT. Pertamina EP pada tahun Selain itu, penulis juga aktif mengikuti berbagai pelatihan diluar kampus yang diantaranya Oracle database 11g SQL Fundamental 2013, Oracle database 11g Administrator , dan Building Datawarehouse Penulis juga telah tersertifikasi untuk bidang database pada Oracle database 11g ascociate tahun 2014 dan Junior database programmer SKKNI.

Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes

Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes Jurnal... Vol. XX, No. X, Bulan 20XX, XX-XX 1 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes Abraham Koroh 1, Kartina Diah

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

1. BAB I PENDAHULUAN 1.1 Latar Belakang

1. BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini dunia telah memasuki era dimana masyarakat dapat secara bebas menyuarakan pendapat mereka di berbagai media, salah satunya melalui media sosial. Masyarakat

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1. 1.1 Latar Belakang Perkembangan dunia telekomunikasi meningkat secara signifikan dalam kurun waktu satu dekade terahir. Tidak hanya dari segi jumlah pengguna, jenis layanan yang ditawarkanpun

Lebih terperinci

3.1 Desain Penelitian

3.1 Desain Penelitian 24 BAB 3 METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian merupakan tahapan yang akan dilakukan penulis dalam melakukan penelitian. Tahapan penelitian yang digunakan

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB 3. METODOLOGI PENELITIAN

BAB 3. METODOLOGI PENELITIAN BAB 3. METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian Pada penelitian ini menggunakan alat penelitian berupa perangkat keras dan perangkat lunak, yaitu : 1. Perangkat keras a. Processor Intel Core

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Liu opini merupakan pernyataan subyektif yang mencerminkan sentimen orang atau persepsi tentang entitas dan peristiwa [1]. Opini atau pendapat orang lain terhadap

Lebih terperinci

ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( )

ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( ) ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. (0927050) Jurusan Sistem Komputer, Fakultas Teknik, Jalan Prof. Drg. Suria Sumantri

Lebih terperinci

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah BAB I PENDAHULUAN Pada bagian ini akan dijelaskan tentang pendahuluan dalam penyusunan Laporan Penelitian. Pendahuluan meliputi latar belakang masalah, rumusan masalah, tujuan penelitian, batasan masalah,

Lebih terperinci

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter, BAB I PENDAHULUAN 1.1. Latar Belakang Popularitas media jejaring sosial terus mengalami peningkatan dalam beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter, Facebook,

Lebih terperinci

BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA

BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA 3. Analisis Masalah Analisis masalah adalah suatu gambaran masalah yang diangkat dalam penulisan skripsi tentang Analisis sentimen pengguna twitter pada

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi dewasa ini sudah mempengaruhi kebutuhan manusia modern, hal ini ditandai dengan penggunaan teknologi disetiap aspek kehidupan manusia yang berguna

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pemilihan Gubernur serentak untuk memilih para pemimpin rakyat akan dilaksanakan pada tahun 2017. Ini merupakan pemilihan kepala daerah serentak ke dua yang akan diselengarakan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini, microblogging menjadi sangat popular untuk alat komunikasi antara pengguna internet. Setiap hari jutaan pesan muncul di website penyedia microblogging diantaranya

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 1.1. Rancangan Penelitian Rancangan penelitian adalah rencana dan struktur penyelidikan yang disusun sedemikian rupa sehingga penelitian akan memperoleh jawaban untuk pertanyaan-pertanyaan

Lebih terperinci

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan BAB I PENDAHULUAN 1.1 Latar Belakang Social media merupakan salah satu tren yang berkembang di masyarakat sebagai tempat untuk berinteraksi. Selain untuk berinteraksi dengan lingkungan sosialnya pengguna

Lebih terperinci

HASIL DAN PEMBAHASAN. Praproses

HASIL DAN PEMBAHASAN. Praproses 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk

Lebih terperinci

SISTEM PENGKLASIFIKASIAN ENTITAS PADA PESAN TWITTER MENGGUNAKAN EKSPRESI REGULAR DAN NAÏVE BAYES AHMAD THORIQ ABDUL AZIZ

SISTEM PENGKLASIFIKASIAN ENTITAS PADA PESAN TWITTER MENGGUNAKAN EKSPRESI REGULAR DAN NAÏVE BAYES AHMAD THORIQ ABDUL AZIZ SISTEM PENGKLASIFIKASIAN ENTITAS PADA PESAN TWITTER MENGGUNAKAN EKSPRESI REGULAR DAN NAÏVE BAYES AHMAD THORIQ ABDUL AZIZ DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM 4.1 Implementasi Sistem Tahap implementasi sistem merupakan tahap pembangunan perangkat lunak, tahap lanjut dari tahap perancangan sistem. Tahap yang dilakukan untuk

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Situs jejaring sosial merupakan gaya hidup sosial baru yang muncul seiring berkembangnya internet. Gaya hidup baru tersebut memiliki ruang lingkup yang lebih luas

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Penelitian terdahulu sangat penting bagi penulis untuk mengetahui referensi dan hubungan antara penelitian terdahulu dengan penelitian yang dilakukan saat ini, sehingga hal duplikasi

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Apa yang orang lain pikirkan telah menjadi sesuatu yang penting untuk menjadi pertimbangan dalam pengambilan keputusan (Pang and Lee, 2006). Sesuatu yang orang lain

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Seiring berkembangnya teknologi informasi saat ini maka berkembang pula perangkat perangkat yang mendukung guna akses informasi yang semakin dibutuhkan dalam waktu

Lebih terperinci

HERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT.

HERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT. HERU SUSANTO 2209 105 030 Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT. LATAR BELAKANG Peran media jejaring sosial pada perkembangan teknologi komunikasi dan informasi;

Lebih terperinci

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING

Lebih terperinci

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB RIYAN ADI LESMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENGEMBANGAN WORDNET BAHASA

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini akan membahas tentang penelitian berita yang menggunakan Text Mining, metode TF-IDF, dan. Yang mana penelitian ini akan mengulas secara lengkap tentang

Lebih terperinci

LAMPIRAN. kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk

LAMPIRAN. kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk LAMPIRAN kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk Lampiran 1 Contoh tabel perhitungan uji Cohcran Pekerja Perlakuan Mesin A Mesin B Mesin C Jumlah nilai baris (R i ) 1 0 0 1 1 2 0 1 0 1 3 1 1 0 2 4 1 1 1 3 5 1

Lebih terperinci

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB IV IMPLEMENTASI DAN PENGUJIAN 90 BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Sistem Tahap ini merupakan tahap dari implementasi program serta implementasi dari setiap proses tahap penelitian. 4.1.2 Persiapan Arsitektur Pada

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Situs belanja online sering disebut juga dengan situs e-commerce yaitu suatu proses membeli dan menjual produk-produk secara elektronik oleh konsumen dan dari perusahaan

Lebih terperinci

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB I PENDAHULUAN. informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentimen

BAB I PENDAHULUAN. informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentimen BAB I PENDAHULUAN I.1. Latar Belakang Analisis sentimen terhadap layanan merupakan proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang terkandung

Lebih terperinci

BAB I PENDAHULUAN.

BAB I PENDAHULUAN. BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini smartphone telah berevolusi menjadi komputer pribadi kecil dan portabel yang memungkinkan pengguna untuk melakukan penjelajahan internet, mengirim e-mail

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Sumber opini teks saat ini tersedia berlimpah di internet akan tetapi belum sepenuhnya dimanfaatkan karena masih kurangnya tool yang ada, sedangkan perkembangan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang,

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang, BAB I PENDAHULUAN Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, metodologi, dan sistematika penulisan. 1.1 Latar Belakang

Lebih terperinci

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA Sigit Prasetyo Karisma Utomo 1, Ema Utami 2, Andi Sunyoto 3 1,2,3 Magister Teknik Informatika STMIK AmikomYogyakarta e-mail: 1 aku@sigitt.com,

Lebih terperinci

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai

Lebih terperinci

BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak

BAB I PENDAHULUAN. menggunakan teknologi yang disebut dengan internet. Hal ini, secara tidak BAB I PENDAHULUAN 1.1 Latar Belakang Berkembangnya teknologi informasi yang begitu pesat ini, banyak memberikan dampak positif maupun negatif khususnya di Indonesia. Dampak positifnya seperti, masyarakat

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

dok023.txt, dok110.txt, dok161.txt, dok196.txt, dok248.txt, dok259.txt

dok023.txt, dok110.txt, dok161.txt, dok196.txt, dok248.txt, dok259.txt LAMPIRAN 13 Lampiran 1 Daftar kueri uji dan dokumen yang relevan Kueri Uji cabai merah buah tropika padi budidaya anggrek Dokumen Relevan dok053.txt, dok059.txt, dok061.txt, dok100.txt, dok124.txt, dok153.txt,

Lebih terperinci

SPAM FILTER MENGGUNAKAN MODEL KLASIFIKASI MULTIVARIATE BERNOULLI DAN MULTINOMIAL NAIVE BAYES DENIS FADILLAH

SPAM FILTER MENGGUNAKAN MODEL KLASIFIKASI MULTIVARIATE BERNOULLI DAN MULTINOMIAL NAIVE BAYES DENIS FADILLAH SPAM FILTER MENGGUNAKAN MODEL KLASIFIKASI MULTIVARIATE BERNOULLI DAN MULTINOMIAL NAIVE BAYES DENIS FADILLAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian BAB III METODOLOGI PENELITIAN 3.1.1 Alat Alat yang digunakan dalam penelitian ini adalah: a. Hardware a. Prosesor : Intel Core i5-3230m CPU @ 2.60GHz b. Memori : 4.00 GB c.

Lebih terperinci

KINERJA PROTOKOL ROUTING DALAM KOMUNIKASI REAL-TIME PADA JARINGAN BERKABEL DAMAS WIDYATMOKO

KINERJA PROTOKOL ROUTING DALAM KOMUNIKASI REAL-TIME PADA JARINGAN BERKABEL DAMAS WIDYATMOKO KINERJA PROTOKOL ROUTING DALAM KOMUNIKASI REAL-TIME PADA JARINGAN BERKABEL DAMAS WIDYATMOKO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 KINERJA

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

Bab III METODOLOGI PENELITIAN. Pada penelitian ini menggunakan ala penelitian berupa perangkat keras

Bab III METODOLOGI PENELITIAN. Pada penelitian ini menggunakan ala penelitian berupa perangkat keras Bab III METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian Pada penelitian ini menggunakan ala penelitian berupa perangkat keras dan perangkat lunak, yaitu: a. Perangkat keras 1. Processor Intel Core

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang 3 BAB I PENDAHULUAN 1.1. Latar Belakang Semakin banyaknya pengunaan teknologi informasi pada pemerintahan, dapat mempermudah masyarakat dalam pelayanan masyarakat itu sendiri. Seperti misalnya ketika sesorang

Lebih terperinci

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam.

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam. BAB I PENDAHULUAN 1.1 Latar Belakang Setiap warga muslim di dunia membutuhkan informasi makanan halal, agar mereka terhindar dari yang namanya perbuatan dosa. Karena di dalam agama islam, sebagai umat

Lebih terperinci

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES 1 BAB I PENDAHULUAN Dalam bab ini akan dibahas latar belakang dilaksanakannya penelitian, identifikasi masalah, batasan masalah, tujuan penelitian, manfaat penelitian, dan sistematika penulisan. Latar

Lebih terperinci

SISTEM ANALISIS SENTIMEN POSITIF DAN NEGATIF MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES PADA KASUS TOKOH PUBLIK CAPRES INDONESIA 2014

SISTEM ANALISIS SENTIMEN POSITIF DAN NEGATIF MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES PADA KASUS TOKOH PUBLIK CAPRES INDONESIA 2014 SISTEM ANALISIS SENTIMEN POSITIF DAN NEGATIF MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES PADA KASUS TOKOH PUBLIK CAPRES INDONESIA 2014 Oleh Yosafat Gerald Montalili NIM : 612006047 Skripsi Untuk melengkapi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan media online mendorong munculnya informasi tekstual yang tidak terbatas, sehingga muncul kebutuhan penyajian tanpa mengurangi nilai dari informasi tersebut.

Lebih terperinci

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

PERANCANGAN SISTEM INFORMASI PARIWISATA, KERAJINAN TANGAN, DAN MAKANAN KHAS DI KABUPATEN TRENGGALEK BERBASIS WEB SKRIPSI

PERANCANGAN SISTEM INFORMASI PARIWISATA, KERAJINAN TANGAN, DAN MAKANAN KHAS DI KABUPATEN TRENGGALEK BERBASIS WEB SKRIPSI PERANCANGAN SISTEM INFORMASI PARIWISATA, KERAJINAN TANGAN, DAN MAKANAN KHAS DI KABUPATEN TRENGGALEK BERBASIS WEB SKRIPSI Diajukan dan Disusun Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Jenjang

Lebih terperinci

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK SKRIPSI Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu Program Studi Informatika

Lebih terperinci

PERINGKASAN TEKS BAHASA INDONESIA DENGAN PEMILIHAN FITUR C4.5 DAN KLASIFIKASI NAIVE BAYES SEPTIANDI WIBOWO

PERINGKASAN TEKS BAHASA INDONESIA DENGAN PEMILIHAN FITUR C4.5 DAN KLASIFIKASI NAIVE BAYES SEPTIANDI WIBOWO PERINGKASAN TEKS BAHASA INDONESIA DENGAN PEMILIHAN FITUR C4.5 DAN KLASIFIKASI NAIVE BAYES SEPTIANDI WIBOWO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi Penelitian adalah sekumpulan peraturan, kegiatan, dan prosedur yang digunakan oleh pelaku suatu disiplin ilmu. Metodologi juga merupakan analisis teoritis mengenai

Lebih terperinci

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER

SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER Anindya Apriliyanti P. Departemen Statistika FMIPA Universitas Padjadjaran a.apriliyanti.p@gmail.com

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan media dan teknologi informasi, terutama pada perkembangan internet dan media sosial, menjadikan fungsi internet dari suatu media informasi biasa, bertambah

Lebih terperinci

BAB I PENDAHULUAN. diwilayah jawa timur. Dengan jumlah penduduk pada tahun 2010 sebanyak

BAB I PENDAHULUAN. diwilayah jawa timur. Dengan jumlah penduduk pada tahun 2010 sebanyak BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Malang merupakan kota metropolitan ke dua dari kota surabaya yang ada diwilayah jawa timur. Dengan jumlah penduduk pada tahun 2010 sebanyak 820.243 jiwa, dengan

Lebih terperinci

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang 1 BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang Intelligent agent, sebagai bagian dari kecerdasan buatan yang dapat diterapkan pada sistem dalam menyelesaikan sebuah permasalahan. Agen yang diterapkan

Lebih terperinci

PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM ABSTRAK

PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM  ABSTRAK J~ICON, Vol. 3 No. 2, Oktober 2015, pp. 106 ~ 112 106 PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM E-MAIL Tince Etlin Tallo 1, Bertha S. Djahi 2, Yulianto T. Polly 3 1,2,3 Jurusan Ilmu

Lebih terperinci

PENGELOLAAN SURAT MASUK DAN SURAT KELUAR DI BADAN KEPEGAWAIAN DAERAH KABUPATEN PONOROGO DENGAN PHP DAN MySQL

PENGELOLAAN SURAT MASUK DAN SURAT KELUAR DI BADAN KEPEGAWAIAN DAERAH KABUPATEN PONOROGO DENGAN PHP DAN MySQL PENGELOLAAN SURAT MASUK DAN SURAT KELUAR DI BADAN KEPEGAWAIAN DAERAH KABUPATEN PONOROGO DENGAN PHP DAN MySQL SKRIPSI Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Jenjang Strata Satu

Lebih terperinci

PENERAPAN DAN PERBANDINGAN CARA PENGUKURAN RESPON PADA ANALISIS KONJOIN

PENERAPAN DAN PERBANDINGAN CARA PENGUKURAN RESPON PADA ANALISIS KONJOIN PENERAPAN DAN PERBANDINGAN CARA PENGUKURAN RESPON PADA ANALISIS KONJOIN (Studi Kasus: Preferensi Mahasiswa Statistika IPB Angkatan 44, 45, dan 46 terhadap Minat Bidang Kerja) DONNY ARIEF SETIAWAN SITEPU

Lebih terperinci

EKSTRAKSI LOKASI DAN PRODUK DARI DATA TRANSAKSI ONLINE PADA TWITTER

EKSTRAKSI LOKASI DAN PRODUK DARI DATA TRANSAKSI ONLINE PADA TWITTER EKSTRAKSI LOKASI DAN PRODUK DARI DATA TRANSAKSI ONLINE PADA TWITTER TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang LINDA NUR WULANSARI

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Opini adalah pendapat pribadi yang tidak obyektif dan tidak melalui proses verifikasi (Quirk et al., 1985). Opini orang lain tentang suatu hal menjadi penting dalam

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang. Mikroblog adalah salah satu bentuk blog yang memungkinkan

BAB I PENDAHULUAN. 1.1 Latar Belakang. Mikroblog adalah salah satu bentuk blog yang memungkinkan 1.1 Latar Belakang BAB I PENDAHULUAN Mikroblog adalah salah satu bentuk blog yang memungkinkan penggunanya untuk berbagi konten digital. 1 Perbedaan mikroblog dengan blog biasa terletak pada ukuran posting.

Lebih terperinci

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES F.4 ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES Raflialdy Raksanagara*, Yulison Herry Chrisnanto, Asep Id Hadiana Jurusan Informatika, Fakultas Matematika dan Ilmu Pengetahuan

Lebih terperinci

SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER

SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER Agung Pramono 1, Rini Indriati 2, Arie Nugroho 3, 1,2,3 Sistem Informasi, Fakultas Teknik, Universitas Nusantara PGRI Kediri E-mail: 1 pramonoagung0741@gmail.com,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka

Lebih terperinci

Jurnal Politeknik Caltex Riau

Jurnal Politeknik Caltex Riau 1 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id IMPLEMENTASI TEXT MINING DALAM KLASIFIKASI JUDUL BUKU PERPUSTAKAAN MENGGUNAKAN METODE NAIVE BAYES Siti Amelia Apriyanti 1), Kartina Diah Kesuma Wardhani

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

DETEKSI SUBJEKTIFITAS TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE LEXICON RULE BASED

DETEKSI SUBJEKTIFITAS TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE LEXICON RULE BASED DETEKSI SUBJEKTIFITAS TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE LEXICON RULE BASED Tugas Akhir Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Informasi telah menjadi kebutuhan utama dalam kehidupan manusia. Informasi bisa dikatakan sebagai pengetahuan yang didapatkan dari pembelajaran, pengalaman, atau instruksi.

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UMS MENGGUNAKAN METODE NAIVE BAYES

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UMS MENGGUNAKAN METODE NAIVE BAYES IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UMS MENGGUNAKAN METODE NAIVE BAYES SKRIPSI Disusun sebagai salah satu syarat menyelesaikan Jenjang Strata

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kehadiran teknologi web yang interaktif telah merubah cara orang mengekspresikan pandangan dan opininya. Saat ini pengguna dapat menulis ulasan suatu produk pada situs

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat

Lebih terperinci