BAB I PENDAHULUAN. Perkembangan teknologi informasi yang semakin meningkat memberi
|
|
- Sudirman Wibowo
- 7 tahun lalu
- Tontonan:
Transkripsi
1 1 BAB I PENDAHULUAN 1.1. Latar Belakang Perkembangan teknologi informasi yang semakin meningkat memberi dampak pada pertukaran informasi dan komunikasi yang semakin mudah. Hal ini ditandai dengan dengan munculnya media sosial seperti Twitter, Facebook, Yahoo, Google, Youtube, Instagram, Path. Pertumbuhan media sosial ini juga mendorng adanya informasi tekstual yang besar sehingga muncul kebutuhan penyajian data yang memudahkan pengguna mendapatkan informasi yang akurat. Media sosial twitter merupakan salah satu media komunikasi populer saat ini. Hal ini terlihat dari peningkatan pengguna twitter yang tercatat di seluruh dunia. Berdasarkan data yang dirilis infografis (tahun ) Twitter memiliki 302 juta pengguna aktif yang 80 persennya berasal dari perangkat mobile. Dari angka itu, 37 persen pengguna Twitter berusia tahun, sedangkan 25 persen lainnya berada di rentan usia tahun. Dengan jumlah pengguna aktif sebanyak itu, Twitter menerima kicauan sebanyak 500 juta setiap harinya. Sebanyak 68 persen berupa kicauan balasan, 26 persen berupa kicauan, dan 6 persen adalah kicauan ulang.
2 2 Pengguna twitter yang semakin meningkat ini terlihat dari jutaan tweets yang di posting setiap harinya dengan berbagai topik yang berbeda. Data tweets ini dapat berupa persepsi publik baik ekonomi, perilaku sosial, fenomena alam, perdagangan yang terjadi diseluruh dunia. Data yang besar tersebut bisa dijadikan sebagai objek penelitan, seperti yang telah dilakukan oleh [Cahyanti, O.D., Saksono, P.H., Suryayusra, Negara, E.S., (2015)], dalam penelitiannya twitter sebagai objek penelitan, dengan menggunakan teknik- teknik khusus untuk menjadikan data yang berupa teks dari twitter menjadi informasi. Informasi yang telah didapatkan tersebut juga merefleksikan bagaimana perilaku masyaratak terhadap suatu peristiwa yang sedang terjadi pada kehidupan nyata yang dituangkan pada sosial media. Hasil penelitian yang dilakukan oleh [Cahyanti, O.D., Saksono, P.H., Suryayusra, Negara, E.S., (2015)] mengenai peristiwa jatuhnya pesawat AirAsia QZ8501 yang terjadi tanggal 28 Desember 2014 di Selat Karimata memperlihatkan dari negara mana saja yang ikut mengamati peristiwa jatuhnya pesawat tersebut berdasarkan bahasa yang digunakan pada saat mengunggah tweets, mengidentifikasi tipe pengguna twitter, rentang usia pengguna serta jenis kelamin. Berdasarkan penelitian yang telah ada sebelumnya, penelitan ini mencoba melakukan analisis sentimen data dengan mengklasifikasi data twitter berbahasa Indonesia pada suatu produk. Data tersebut akan diproses dengan text mining untuk menghindari data yang kurang sempurna kemudian mengklasifikasi data tweet ke dalam tiga klasifikasi yaitu klasifikasi positif, negatif, netral. Klasifikasi ini menggunakan algoritma Naïve Bayes Classifier.
3 3 Dari uraian uraian yang telah dijelaskan dapat diambil suatu masalah untuk dijadikan bahan penelitian yang berjudul Analisa Sentimen Pada Data Twitter Dengan Menggunakan Text Mining Terhadap Suatu Produk Perumusan Masalah Berdasarkan latar belakang yang telah diuraikan maka permasalahan yang akan dibahas adalah Bagaimana Menganalisis dan mengklasifikasi Sentimen Pada Data Twitter Menggunakan Text Mining terhadap Suatu Produk.? 1.3. Batasan Masalah Untuk lebih memudahkan dalam melakukan analisis data dan menghindari pembahasan yang terlalu jauh maka akan dibatasi permasalahan sebagai berikut: 1. Naïve Bayes Classifier merupakan algoritma yang digunakan untuk pengklasifikasian data Twitter suatu produk berbahasa Indonesia. 2. Penelitian ini menggunakan data teks berbahasa Indonesia yang bersumber dari media sosial yaitu Twitter Tujuan dan Manfaat Penelitian Tujuan Penelitian Adapun tujuan penelitian ini adalah : 1. Mengklasifikasikan data Twitter dengan menggunakan Algoritma Naïve Bayes Classifier. 2. Mendapatkan Kategori Analisis Sentimen positif, negatiif dan netral dari text berbahasa Indonesia yang ada pada data twitter suatu produk.
4 Manfaat Penelitian Adapun manfaat penelitian ini adalah: 1. Memperoleh informasi terkait dengan suatu produk dan menentukan apakah produk tersebut dinilai positif, negatif atau netral di twitter. 2. Memperoleh klasifikasi sentimen pada twitter secara otomatis Metodologi Penelitian Waktu dan Tempat Penelitian Pada Penelitian ini penulis membutuhkan waktu 6 bulan untuk melakukan analisis data, perancangan, pengkodean, pengujian hingga pendokumentasian. Objek pada penelitian ini adalah media social yaitu Twitter Metode Penelitian Metode penelitian yang di gunakan dalam penelitian ini ialah metode Deskriptif. Metode deskriptif adalah suatu metode yang digunakan untuk menggambarkan atau menganalisis suatu hasil penelitian tetapi tidak digunakan untuk membuat kesimpulan yang lebih luas. [Sugiyono, (2005: 21)]. Dalam penelitian ini penulis menggunakan metode penelitian deskriptif untuk mendeskripsikan fenomena yang terjadi di seluruh dunia melalui media sosial twitter. Dengan menganalisa data tweet yang di up-date oleh pengguna twitter seputar informasi terhangat yang terjadi di seluruh dunia Metode Pengumpulan Data Metode pengumpulan data yang digunakan oleh penulis adalah kajian kepustakaan, dimana sumber data utama dalam penelitian ini berasal dari jurnal-
5 5 jurnal ilmiah, artikel ilmiah, internet, dan laporan-laporan yang berkaitan dengan pemanfaatan data tweet pada media sosial twitter Metode Analisis Pada metode analisis terdapat langkah-langkah dasar yang akan dilakukan adalah: 1. Identify, yaitu melakukan proses identifikasi masalah. 2. Understand, yaitu memahami kerja dari sistem yang ada. 3. Analysis, yaitu melakukan analisa terhadap sistem. 4. Report, yaitu membuat laporan dari hasil analisis [Mulyanto, (2009:129)] Sistematika Penulisan Sistematika dalam penulisan ini menguraikan struktur bab dalam penelitian dan gambaran umum sebagai berikut : BAB I PENDAHULUAN Pada bab ini berisi latar belakang masalah, rumusan masalah, tujuan dan manfaat penelitian, batasan masalah, metodologi penelitian, dan sistematika penulisan. BAB II LANDASAN TEORI Pada bab ini menguraikan pengertian mengenai tinjauan pustaka yang berisi tentang teori-teori yang mendukung dalam penilitian ini. BAB III ANALISA DAN PERANCANGAN Pada bab ini menjelaskan tentang analisis sistem, perancangan sistem dan perancangan antarmuka.
6 6 BAB IV HASIL DAN PEMBAHASAN Pada bab ini menguraikan tentang hasil dan pembahasan tentang tujuan dari penelitian ini. BAB V KESIMPULAN DAN SARAN Pada bab ini menguraikan kesimpulan dari keseluruhan bab dan diikuti dengan saran.
7 7 BAB II LANDASAN TEORI 2.1. Analisis Sentimen Penelitian mengenai analisis sentimen terus berkembang, di setiap penelitian memiliki perbedaan baik mengenai metode, data, Bahasa, algoritma maupun perhitungan pembobotan yang berbeda. Analisis Sentimen atau opinion mining mengacu pada bidang yang luas dari pengolahan bahasa alami, komputasi linguistik dan text mining yang bertujuan menganlisa pendapat, sentimen, evaluasi, sikap, penilaian dan emosi seseorang apakah pembicara atau penulis berkenaan dengan suatu topik, produk, layanan, organisasi, individu, ataupun kegiatan tertentu (Liu, 2011). Tugas dasar dalam analisis sentimen adalah mengelompokkan teks yang ada dalam sebuah kalimat atau dokumen kemudia menentukan pendapat yang dikemukakan dalam kaliamat atau dokumen tersebut apakah bersifat positif, negatif atau netral (Dehaff, M., 2010). Ekspresi atau sentiment mengacu pada fokus topik tertentu, pernyataan pada satu topik mungkin akan berbeda makna dengan pernyataan yang sama pada subject yang berbeda. Oleh karena itu pada beberapa penelitian, terutama pada review produk, pekerjaan didahului dengan
8 8 menentukan elemen dari sebuah produk yang sedang dibicarakan sebelum memulai proses opinion mining (Barber, 2010) Twitter Menurut [Jansen, B.J, Zhang, M., Sobel, K., Chowdury, A., (2009)] twitter merupakan sebuah situs web yang dimiliki dan dioperasikan oleh Twitter Inc, yang menawarkan jejaring sosial berupa mikroblog sehingga memungkinkan penggunanya untuk mengirim dan membaca pesan yang disebut tweets. Tweets melalui situs Twitter, aplikasi eksternal yang kompatibel (telepon seluler), atau dengan pesan singkat (SMS) yang tersedia di negara-negara tertentu. Pengguna dapat menulis pesan berdasarkan topik dengan menggunakan tanda # (hashtag). Sedangkan untuk menyebutkan atau membalas pesan dari pengguna lain bisa menggunakan Pesan pada awalnya diatur hanya mempunyai batasan sampai 140 karakter disesuaikan dengan kompatibilitas dengan pesan SMS, memperkenalkan singkatan notasi dan slang yang biasa digunakan dalam pesan SMS. Batas karakter 140 juga meningkatkan penggunaan layanan memperpendek URL seperti bit.ly, goo.gl, dan tr.im, dan jasa hosting konten, seperti Twitpic, Tweephoto, memozu.com dan NotePub untuk mengakomodasi multimedia isi dan teks yang lebih panjang daripada 140 karakter. Twitter menggunakan bit.ly untuk memperpendek otomatis semua URL yang dikirim-tampil. Twitter Timelines merupakan istilah yang menggambarkan kumpulan seluruh update status dari pengguna akun twitter yang di follow oleh pengguna. Biasanya ditampilkan dalam bentuk satu kolom kotak. Twitter timelines biasanya
9 9 ditampilkan berdasarkan waktu penerbitan tweet. Tweet yang terbaru akan ditampilkan dalam kotak paling atas. Jenis sosial media seperti Twitter dapat menciptakan serta menggerakkan komunitas, mengendalikan traffic di blog, website. Twitter juga bersifat real time, mengembangkan jaringan yang tak terbatas, dapat menyebarkan ide, membuka peluang pasar, menciptakan personal brand, dapat meningkatkan pelayanan kepada konsumen serta memanusiakan brand. Menurut Puntoadi (2011: ) dalam Dosi Aprilinda Palewa (2013:34), twitter memiliki kelebihan, yaitu : 1. Following : twitter dapat mengidentifikasi jumlah akun yang diikuti. 2. Followers : twitter dapat mengidentifikasi jumlah akun yang mengikuti. 3. Updates : twitter mendeteksi seberapa sering orang melakukan posting (menulis konten) 4. Men-tag nama : beberapa orang akan terlibat dalam pembicaraan apabila mencantumkan akun pada setiap status yang ditulis. 5. Re-tweet : dengan me-retweet status followers lain menunjukkan tweets tersebut menarik untuk dibahas. Tweet tersebut dapat dibaca oleh seluruh followers. 6. Keterlibatan : brand harus mampu untuk meningkatkan keterlibatan para konsumen dalam berbagai percakapan. 7. Kecepatan : konsitensi dan frekuensi diperlukan untuk mengimbangi kecepatan perubahan informasi yang beredar di twitter.
10 Text Mining Text mining adalah bidang interdisipliner yang mengacu pada pencarian informasi, pertambangan data, pembelajaran mesin, statistik, dan komputasi linguistik. Dikarenakan kebanyakan informasi (perkiraan umum mengatakan lebih dari 80%) saat ini disimpan sebagai teks, text mining diyakini memiliki potensi nilai komersial tinggi (Bridge, 2011). Text mining merupakan teknik yang digunakan untuk menangani masalah klasifikasi, clustering, information extraction dan information retrival (Berry & Kogan, 2010). Text mining (penambangan teks) adalah penambangan yang dilakukan oleh komputer untuk mendapatkan sesuatu yang baru, sesuatu yang tidak diketahui sebelumnya atau menemukan kembali informasi yang tersirat secara implisit, yang berasal dari informasi yang diekstrak secara otomatis dari sumber-sumber data teks yang berbeda- beda (Feldman & Sanger, 2007). Text mining mengacu pada proses mengambil informasi berkualitas tinggi dari teks. Informasi berkualitas tinggi biasanya diperoleh melalui peramalan pola dan kecenderungan melalui sarana seperti pembelajaran pola statistic. Proses text mining yang khas meliputi kategorisasi teks, text clustering, ekstraksi konsep/entitas, produksi taksonomi granular, sentiment analysis, penyimpulan dokumen, dan pemodelan relasi entitas (yaitu, pembelajaran hubungan antara entitas bernama) (Saraswati, 2013). Pendekatan manual text mining secara intensif dalam laboratorium pertama muncul pada pertengahan 1980-an, namun kemajuan teknologi telah memungkinkan ranah tersebut untuk berkembang selama dekade terakhir. Text mining biasanya melibatkan proses penataan teks input (biasanya parsing, bersama dengan penambahan beberapa fitur linguistik
11 11 turunan dan penghilangan beberapa diantaranya, dan penyisipan subsequent ke dalam database), menentukan pola dalam data terstruktur, dan akhirnya mengevaluasi dan menginterpretasi output. Berkualitas tinggi di bidang text mining biasanya mengacu ke beberapa kombinasi relevansi, kebaruan, dan interestingness.(saraswati, 2011). Tahap-tahap text mining secara umum adalah text preprocessing dan feature selection (Feldman & Sanger 2007, Berry & Kogan 2010). Dimana penjelasan dari tahap-tahap tersebut adalah sebagai berikut: 1. Text Preprocessing Tahap text preprocessing adalah tahap awal dari text mining. Tahap ini mencakup semua rutinitas, dan proses untuk mempersiapkan data yang akan digunakan pada operasi knowledge discovery sistem text mining (Feldman & Sanger, 2007). Tahapan yang akan dilakukan proses text mining, pada umumnya memiliki beberapa karakteristik diantaranya adalah memiliki dimensi yang tinggi, terdapat noise pada data, dan terdapat struktur teks yang tidak baik. Cara yang digunakan dalam mempelajari suatu data teks, adalah dengan terlebih dahulu menentukan fitur-fitur yang mewakili setiap kata untuk setiap fitur yang ada pada dokumen. Sebelum menentukan fitur-fitur yang mewakili, diperlukan tahap preprocessing yang dilakukan secara umum dalam teks mining pada dokumen, yaitu case folding, tokenizing, filtering, stemming, tagging dan analyzing (Triawati, 2009).
12 12 a. Case folding dan Tokenizing Case folding adalah mengubah semua huruf dalam dokumen menjadi huruf kecil. Hanya huruf a sampai dengan z yang diterima. Karakter selain huruf dihilangkan dan dianggap delimiter (Triawati, 2009). Contoh pemakaian case folding : Bagaimana keadaanmu Hari ini? bagaimana keadaanmu hari ini Tahap tokenizing / parsing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. Contoh Tokenizing : bagaimana keadaanmu hari ini bagaimana keadaanmu hari ini b. Filtering Filtering adalah tahap mengambil kata-kata penting dari hasil token. Bisa menggunakan algoritma stoplist (membuang kata yang kurang penting) atau wordlist (menyimpan kata penting). Stoplist/stopword adalah katakata yang tidak deskriptif yang dapat dibuang dalam pendekatan bag-ofwords. Contoh stopwords adalah yang, dan, di, dari, dan seterusnya.( Triawati, 2009). Contoh Filtering : bagaimana keadaanmu hari ini keadaan hari ini c. Stemming Tahap stemming adalah tahap mencari root kata dari tiap kata hasil filtering. Pada tahap ini dilakukan proses pengembalian berbagai bentukan kata ke dalam suatu representasi yang sama (Agusta, 2009).
13 13 Tahap ini kebanyakan dipakai untuk teks berbahasa Inggris dan lebih sulit diterapkan pada teks berbahasa Indonesia. 2. Feature Selection Tahap seleksi fitur (feature selection) bertujuan untuk mengurangi dimensi dari suatu kumpulan teks, atau dengan kata lain menghapus kata-kata yang dianggap tidak penting atau tidak menggambarkan isi dokumen sehingga proses pengklasifikasian lebih efektif dan akurat (Do et al, 2006., Feldman & Sanger, 2007., Berry & Kogan 2010). Saat ini text mining telah mendapat perhatian dalam berbagai bidang diantaranya (Saraswati, 2011) : 1. Aplikasi keamanan Banyak paket perangkat lunak text mining dipasarkan terhadap aplikasi keamanan, khususnya analisis plain text seperti berita internet. Hal ini juga mencakup studi enkripsi teks. 2. Aplikasi biomedis Berbagai aplikasi text mining dalam literatur biomedis telah disusun. Salah satu contohnya adalah PubGene yang mengkombinasikan text mining biomedis dengan visualisasi jaringan sebagai sebuah layanan Internet. Contoh lain text mining adalah GoPubMed.org. Kesamaan semantik juga telah digunakan oleh sistem text mining yaitu GOAnnotator. 3. Perangkat Lunak dan Aplikasi Departemen riset dan pengembangan perusahaan besar, termasuk IBM dan Microsoft, sedang meneliti teknik text mining dan mengembangkan program untuk lebih mengotomatisasi proses pertambangan dan analisis. Perangkat
14 14 lunak text mining juga sedang diteliti oleh perusahaan yang berbeda yang bekerja di bidang pencarian dan pengindeksan secara umum sebagai cara untuk meningkatkan performansinya. 4. Aplikasi Media Online Text mining sedang digunakan oleh perusahaan media besar, seperti perusahaan Tribune, untuk menghilangkan ambigu informasi dan untuk memberikan pembaca dengan pengalaman pencarian yang lebih baik, yang meningkatkan loyalitas pada site dan pendapatan. Selain itu, editor diuntungkan dengan mampu berbagi, mengasosiasi dan properti paket berita, secara signifikan meningkatkan peluang untuk menguangkan konten. 5. Aplikasi Pemasaran Text mining juga mulai digunakan dalam pemasaran, lebih spesifik dalam analisis manajemen hubungan pelanggan. 6. Sentiment Analysis Sentiment Analysis mungkin melibatkan analisis dari review film untuk memperkirakan berapa baik review untuk sebuah film. Analisis semacam ini mungkin memerlukan kumpulan data berlabel atau label dari efektifitas katakata. Sebuah sumber daya untuk efektivitas kata-kata telah dibuat untuk WordNet. 7. Aplikasi Akademik Masalah text mining penting bagi penerbit yang memiliki database besar untuk mendapatkan informasi yang memerlukan pengindeksan untuk pencarian. Hal ini terutama berlaku dalam ilmu sains, di mana informasi yang sangat spesifik sering terkandung dalam teks tertulis. Oleh karena itu, inisiatif
15 15 telah diambil seperti Nature s proposal untuk Open Text Mining Interface (OTMI) dan Health s common Journal Publishing untuk Document Type Definition (DTD) yang akan memberikan isyarat semantik pada mesin untuk menjawab pertanyaan spesifik yang terkandung dalam teks tanpa menghilangkan barrier penerbit untuk akses publik. Sebelumnya, website paling sering menggunakan pencarian berbasis teks, yang hanya menemukan dokumen yang berisi kata-kata atau frase spesifik yang ditentukan oleh pengguna. Sekarang, melalui penggunaan web semantik, text mining dapat menemukan konten berdasarkan makna dan konteks (daripada hanya dengan kata tertentu). Text mining juga digunakan dalam beberapa filter spam sebagai cara untuk menentukan karakteristik pesan yang mungkin berupa iklan atau materi yang tidak diinginkan lainnya. Dengan text mining tugas-tugas yang berhubungan dengan penganalisaan teks dengan jumlah yang besar, penemuan pola serta penggalian informasi yang mungkin berguna dari suatu teks dapat dilakukan. Sebagai bentuk aplikasi dari text mining, sistem klasifikasi berita menggunakan berita sebagai sumber informasi dan informasi klasifikasi sebagai informasi yang akan diekstrak dari sumber informasi. Informasi klasifikasi dapat berbentuk angka-angka probabilitas, set aturan atau bentuk lainnya Klasifikasi Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk memperkirakan kelas yang tidak diketahui dari suatu objek (Tan et all, 2004). Dalam pengklasifikasian data terdapat dua proses yang dilakukan yaitu:
16 16 1. Proses training Pada proses training digunakan training set yang telah diketahui labellabelnya untuk membangun model atau fungsi. 2. Proses testing Untuk mengetahui keakuratan model atau fungsi yang akan dibangun pada proses training, maka digunakan data yang disebut dengan testing set untuk memprediksi label-labelnya. Gambar 2.1 Tahapan Proses Klasifikasi ( Tujuan dari klasifikasi adalah untuk: 1. Menemukan model dari training set yang membedakan record kedalam kategori atau kelas yang sesuai, model tersebut kemudian digunakan untuk mengklasifikasikan record yang kelasnya belum diketahui sebelumnya pada test set. 2. Mengambil keputusan dengan memprediksikan suatu kasus, berdasarkan hasil klasifikasi yang diperoleh. Klasifikasi merupakan penempatan objek-objek ke salah satu dari beberapa kategori yang telah ditetapkan sebelumnya. Klasifikasi telah banyak
17 17 ditemui dalam berbagai aplikasi. Sebagai contoh, pendeteksian pesan , spam berdasarkan header dan isi atau mengklasifikasikan galaksi berdasarkan bentukbentuknya. Data input untuk klasifikasi adalah koleksi record. Setiap record dikenal sebagai instance atau contoh yang ditentukan oleh sebuah tuple (x,y). Dimana x adalah himpunan atribut dan y adalah atribut tertentu, yang dinyatakan sebagai label class (juga dikenal sebagai kategori atau atribut target). Klasifikasi adalah tugas pembelajaran sebuah fungsi target f yang memetakan setiap himpunan atribut x ke salah satu label kelas y yang telah di definisikan sebelumnya. Fungsi target juga di kenal secara informal sebagai model klasifikasi (tan et all, 2006). Model klasifikasi terdiri dari dua bagian yaitu: 1. Pemodelan Deskriptif Model klasifikasi dapat bertindak sebagai alat penjelas untuk membedakan objek objek dari kelas kelas yang berbeda. Sebagai contoh untuk para ahli Biologi, model deskriptif yang meringkas data. 2. Pemodelan Prediktif Model klasifikasi juga dapat di gunakan untuk memprediksikan label kelas dari record yangn tidak diketahui. Seperti pada gambar 2 tampak sebuah model klasifikan dapat dipandang sebagai kotak hitam yang secara otomatis memberikan sebuah label ketika dipresentasikan dengan himpunan atribut dari record yang tidak di ketahui. Attribut set (x) Input Classification model Output Class label (y) Gambar 2.2 Klasifikasi sebagai suatu tugas memetakan atribut x ke
18 18 dalam label kelas y (Tan et all, 2006) Beberapa teknik klasifikasi yang digunakan adalah decision tree classifier, rule-based classifier, neural-network, support vector machine, dan naïve bayes classifier, Setiap teknik menggunakan algoritme pembelajaran untuk mengidentifikasi model yang memberikan hubungan yang paling sesuai antara himpunan atribut dan label kelas dari data input. Pendekatan umum yang digunakan dalam masalah klasifikasi adalah, pertama,training set berisi record yang mempunyai label kelas yang diketahui haruslah tersedia. Training set digunakan untuk membangun model klasifikasi, yang kemudian diaplikasikan ke test set, yang berisi record-record dengan label kelas yang tidak di ketahui. Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam bisnis dan penelitian adalah: a. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan. b. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit yang baik atau buruk. c. Mendiagnosa penyakit seorang pasien untuk mendapatkan kategori apa. Klasifikasi dokumen adalah proses pengelompokan dokumen sesuai dengan kategori yang dimilikinya. Klasifikasi dokumen merupakan masalah yang mendasar namun sangat penting karena manfaatnya cukup besar mengingat jumlah dokumen yang ada setiap hari semakin bertambah. Sebuah dokumen dapat
19 19 dikelompokkan ke dalam kategori tertentu berdasarkan kata-kata dan kalimatkalimat yang ada di dalam dokumen tersebut. Kata atau kalimat yang terdapat di dalam sebuah dokumen memiliki makna tertentu dan dapat digunakan sebagai dasar untuk menentukan kategori dari dokumen tersebut Naïve Bayes Classifier Naïve bayes klasifikasi merupakan metode terbaru yang digunakan untuk memprediksi probabilitas. Algoritma ini memanfaatkan teori probabilitas yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman di masa sebelumnya. Dua kelompok peneliti, satu oleh Pantel dan Lin, dan yang lain oleh Microsoft Research memperkenalkan metode statistik bayesian. Tetapi yang membuat naïve bayesian ini popular adalah pendekatan yang dilakukan oleh Paul Graham. Banyak aplikasi ini menghubungkan antara atribut set dan variabel kelas yang non deterministic. Dengan kata lain, label kelas test record tidak dapat diprediksi dengan peristiwa tertentu meski atribut set identik dengan beberapa contoh training. Situasi ini makin meningkat karena noisy data atau kehadiran factor confouding tertentu yang mempengaruhi klasifikasi tetapi tidak termasuk di dalam analisis. Sebagai contoh, perhatikan tugas memprediksi apakah seseorang beresiko terkena penyakit jantung berdasarkan diet yang dilakukan dan olahraga teratur. Meski mempunyai pola makan sehat dan melakukan olahraga teratur, tetapi masih beresiko terkena penyakit jantung karena faktor faktor lain seperti keturunan, merokok, dan penyalahgunaan alkohol. Untuk menentukan apakah diet sehat dan olahraga teratur yang dilakukan sesorang adalah cukup menjadi subyek
20 20 interpretasi, yang akan memperkenalkan ketidakpastian pada masalah pembelajaran. Algoritma naive bayes classifier merupakan algoritma yang digunakan untuk mencari nilai probabilitas tertinggi untuk mengklasifikasi data uji pada kategori yang paling tepat (Feldman & Sanger 2007). Dalam penelitian ini yang menjadi data uji adalah data tweets. Ada dua tahap pada klasifikaasi data yang pertama pelatihan terhadap dokumen yang sudah diketahui kategorinya. Sedangkan kedua adalah proses klasifikasi dokumen yang belum diketahui kategorinya. Dalam algoritma naïve bayes classifier setiap dokumen direpresentasikan dengan pasangan atribut x 1, x 2, x 3,...x n dimana x 1 adalah kata pertama, x 2 adalah kata kedua dan seterusnya. Sedangkan V adalah himpunan kategori Tweet. Pada saat klasifikasi algoritma akan mencari probabilitas tertinggi dari semua kategori dokumen yang diujikan (V MAP ), dimana persamaannya adalah sebagai berikut: (2.1) Keterangan : V j = Kategori tweet j =1, 2, 3, n. P(x i V j ) = Probabilitas x i pada kategori V j P(V j ) = Probabilitas dari V j
21 21 Naïve bayes classifier memiliki asumsi bahwa hubungan antar atribut adalah saling bebas. Naïve bayes classifier memiliki beberapa keuntungan dan kelemahan yaitu diantaranya : Keuntungan : a. Hasilnya cukup baik untuk sebagian besar kasus dan mudah diimplementasikan. b. Bila asumsi saling bebas terpenuhi, maka tingkat akurasinya sangat tinggi Kelemahan : a. Adanya asumsi saling bebas antar atributnya terkadang akan menurunkan tingkat akurasi. b. Biasanya dalam kehidupan nyata selalu ada hubungan antar atribut sehingga asumsi saling bebas menjadi tidak terpenuhi dan keterkaitan tersebut tidak dapat dimodelkan oleh naïve bayes classifier. c. Perkiraan kemungkinan class yang tidak akurat. d. Batasan atau threshold harus ditentukan secara manual bukan secara analitis 2.6. MongoDB MongoDB adalah salah satu NoSQL yang berorientasi dokumen yang dikembangkan secara kode terbuka (Open Source) oleh 10 gen. Beberapa karakteristik penting dari MongoDB adalah penyimpanan data dalam collections dan masing masing collections memiliki documents yang diserialisasi dengan menggunakan BSON (Binary JSON). Perbandingan antara MongoDB dan SQL Server pernah dilakukan dalam lingkungan sistem pengambilan keputusan dan layanan data secara interaktif yang mengatakan sisi kinerja SQL Server lebih unggul meskipun aspek lainnya NoSQL memiliki keunggulan yang berbeda. [Rahardjo, A.W., Emanuel., Sentosa., J., (2013)].
22 22 MongoDB memiliki perbedaan dengan RDBMS seperti yang ditampilkan pada gambar berikut ini : Gambar 2.3. Perbedaan RDBMS dan MongoDb Tidak seperti database relasional lainnya yang menunjukkan rancangan skema beberapa tabel dan menunjukkan relasi di antaranya, pada MongoDB tidak ada istilah relasi. Keuntungan MongoDB daripada RDBMS ialah : 1. Skema berkurang, MongoDB merupakan database dokumen dimana padasetiap koleksi memiliki dokumen yang berbeda. Field, isi, ukuran dokumen bisa berbeda dari dokumen lainnya. 2. Struktur objek tunggal yang jelas 3. Tidak ada relasi 4. Kemampuan query yang mendalam 5. Mudah untuk digambarkan 6. Konversi/pemetaan dari aplikasi objek ke database objek tidak dibutuhkan
23 23 7. Menggunakan internal memori untuk penyimpanan, mampu mengakses data lebih cepat. MongoDB sangat cocok digunakan untuk Big Data, Content Management and Delivery, Mobile and Social Infrastructure, User Data Management, dan Data Hub. Ada beberapa kekurangan MongoDB diantaranya : 1. MongoDB harus di instal di sebuah server, dan ketika kita menggunakan PHP anda juga harus merestart server anda driver mongodb anda dapat digunakan oleh PHP 2. Belum support di hosting, namun bisa diakali dengan menggunakan MongoHQ (untuk free terdapat limit sampai 16MB) MongoDB hadir dengan beberapa kelebihan yaitu : 1. Performa yang ditawarkan MongoDB lebih cepat dibandingkan MySQL ini disebabkan oleh memcached dan format dokumennya yang berbentuk seperti JSON 2. Replikasi, adalah fitur yang sangat bermanfaat untuk backup data secara realtime. 3. MongoDB sangat cocok digunakan untuk portal berita ataupun blog, namun belum cocok untuk digunakan pada sistem informasi yang berkaitan dengan keuangan karena MongoDB tidak mendukung transaction SQL 4. Auto-sharding, merupakan fitur untuk memecah database yang besar menjadi beberapa bagian demi optimalisasi performa database. Penggunaannya sendiri sangat berguna ketika Anda memiliki website dengan database yang jutaan baris, sharding akan membantu memecahnya menjadi beberapa bagian
24 24 5. MongoDB juga sudah mendukung C, C++, C#, Erlang, Haskell, Java, JavaScript,.NET(C# F#, PowerShell), Lips, Perl, PHP, Python, Ruby dan Scala Cross-platform, sehingga dapat digunakan di Windows, Linux, OS X dan Solaris 6. Proses Create, Read, Update, Delete (CRUD) terasa sangat ringan. 7. Map/Reduce, akan sangat membantu ketika kita melakukan operasi agregasi. Dimana semua entry datangnya dari collection dan outputnya pun akan menjadi collection juga Unified Modeling Language (UML) Definisi Unified Modeling Language (UML) adalah standar bahasa untuk menentukan, memvisualisasikan, membangun, dan mendokumentasikan pengembangan dari sistem perangkat lunak yang berbasis Object Oriented. Pada umumnya UML digunakan untuk pemodelan sistem perangkat lunak namun bisa juga untuk memodelkan sisitem seperti aliran proses di unit manufaktur dll. UML bukanlah bahasa pemrograman tetapi media yang digunakan untuk menghasilkan kode dalam berbagai bahasa menggunakan UML diagram ( 2015). Berikut ini adalah jenis diagram UML menurut Henderi (2010:6) yaitu: 1. Use Case Diagram Use Case Diagram secara grafis menggambarkan, interaksi secara sistem, sistem eksternal dan pengguna. Dengan kata lain use case diagram secara grafis mendeskripsikan siapa yang akan menggunakan sistem dan dalam cara
25 25 apa pengguna (user) mengharapkan interaksi dengan sistem itu. Use case secara naratif digunakan untuk secara tekstual menggambarkan sekuensi langkah-langkah dari tiap interaksi. 2. Class Diagram Menggambarkan struktur object sistem. Diagram ini menunjukan class diagram yang menyusun sistem dan hubungan antara class object tersebut. 3. Sequence Diagram Secara grafis menggambarkan bagaimana object berinteraksi satu sama lain melalui pesan pada sekuensi sebuah use case atau operasi. 4. State Chart Diagram Digunakan untuk memodelkan behaviour objek khusus yang dinamis. Diagram ini mengilustrasikan siklus hidup objek berbagai keadaan yang dapat diasumsikan oleh objek dan event-event (kejadian) yang menyebabkan objek dari satu state ke state yang lain. 5. Activity Diagram Secara grafis untuk menggambarkan rangkaian aliran aktivitas baik proses bisnis maupun use case. Activity Diagram dapat juga digunakan untuk memodelkan action yang akan dilakukan saat operasi dieksekusi, dan memodelkan hasil dari action tersebut Kerangka Pemikiran
26 26 Kerangka Pemikiran pada penelitian ini akan menjelaskan alur alur pikiran yang dirangkum dalam sebuah gambar. Dalam kerangka pemikiran ini menggunakan data twitter yang ditarik dengan menggunakan Search API seperti penelitian sebelumnya. Data tweet kemudian dibersihkan dengan text mining yang didalamnya terjadi preprocessing dan feature selection serta menggunakan metode. Selanjutnya data tweet bersih akan dijadikan data training. Data training berguna sebagai data latih dimana akan diberikan nilai positif, nilai negatif secara manual. Setelah proses training selesai akan diuji dengan menggunakan klasifikasi naïve bayes classifier. Algoritma ini akan memberikan nilai sentimen negatif, sentiment positif atau netral di setiap tweet yang ada. Berikut Kerangka Pemikiran penelitian ini Mulai data tweet (ditarik dengan menggunakan twitter API) Proses text mining (akan dilakukan preprocessing dan feature selection) Algoritma Naive Bayes Classifier mengklasifikasi sentimen Nilai sentimen positif, negative atau netral 2.9. Penelitian Sebelumnya Selesai Gambar 2.4. Kerangka Pemikiran
27 27 Penelitian sebelumnya telah dilakukan oleh [Cahyanti, O.D., Saksono, P.H., Suryayusra, Negara, E.S., (2015)], penulis menggunakan twitter sebagai objek penelitian. Untuk menganalisa data twitter ini diperlukan teknik-teknik khusus untuk menjadikan data yang berupa teks dari twitter menjadi informasi yang selanjutnya dapat dijadikan bahan untuk penelitian. Penulis melakukan penelitian mengenai peristiwa jatuhnya pesawat AirAsia QZ8501 yang terjadi pada tanggal 28 Desember 2014 di selat Karimata, Indonesia. Pada penelitian ini, penulis memperlihatkan dari negara mana saja yang ikut mengamati peristiwa jatuhnya pesawat tersebut berdasarkan bahasa yang digunakan pada saat mengunggah tweets mereka. Penelitian lain dilakukan oleh [SN, Azhari., Hidayatullah, AF., 2014]. Penelitian ini melakukan analisis sentimen dan klasifikasi kategori terhadap tokoh public pada twitter. Metode klasifikasi yang digunakan adalah Support Vector Machine dan Naïve Bayes Classifier. Klasifikasi sentiment terdiri dari positif dan negatif. Penelitian yang dilakukan oleh [Permatasari, D.R. 2014]. Penelitian ini melakukan analisis sentiment nasabah bank X menggunakan pengklasifikasia naïve bayes classifier.penelitian ini mencari tingkat kecocokan naïve bayes classifier dalam mengklasifikasikan kalimat sentiment ke dalam kelas positif dan negative. Hasi dari penelitian ini naïve bayes classifier memberikan nilai error untuk mengklasifikasikan kalimat sentiment ke dalam kelas positif dan kelas negatif sebesar 24,26%. Penelitian yang serupa juga dilakukan oleh [Winarko, Edi., Putranti, ND., Penelitian ini melakukan Analisis Sentimen Twitter untuk teks Berbahasa
28 28 Indonesia dengan Maximum Entropy Support Vector Machine. Dalam penelitian ini data opini diperoleh dari jejaringan sosial twitter berdasarkan query dalam Bahasa Indonesia. Data yang sudah terkumpul dilakukan proses preprocessing dan POS tagger untuk menghasilkan suatu klasifikasi. Hasil dari klasifikasi diperoleh akurasi 86.81%.
29 29 BAB III ANALISA DAN PERANCANGAN 3.1. Analisis Sistem Analisis sistem yang digunakan untuk menyelesaikan masalah pada penelitan ini terdiri dari beberapa langkah langkah yaitu: 1. Analisis masalah 2. Pengumpulan data 3. Proses Text Mining 4. Penerapan metode Klasifikasi naïve Bayes Classifier Analisis Masalah Pengguna twitter yang semakin meningkat ini terlihat dari jutaan tweets yang di posting setiap harinya dengan berbagai topik yang berbeda. Data tweets ini dapat berupa persepsi publik baik ekonomi, perilaku sosial, fenomena alam, perdagangan yang terjadi diseluruh dunia. Data yang besar tersebut bisa dijadikan sebagai objek penelitan, seperti yang telah dilakukan oleh [Cahyanti, O.D., Saksono, P.H., Suryayusra, Negara, E.S., (2015)], dalam penelitiannya twitter sebagai objek penelitan, dengan menggunakan teknik- teknik khusus untuk menjadikan data yang berupa teks dari twitter menjadi informasi. Informasi yang telah didapatkan tersebut juga merefleksikan bagaimana perilaku masyarakat
30 30 terhadap suatu peristiwa yang sedang terjadi pada kehidupan nyata yang dituangkan pada sosial media. Informasi yang terkandung dalam tweets dapat digunakan sebagai nilai jual bagi pelaku usaha. Salah satu contoh perusahaan yang ingin mengetahui nilai jual produknya laku dipasaran atau tidak. Kita sebut saja perusahan yang memproduksi kosmetik seperti lipstick wardah, sabun cuci seperti Rinso. Perusahaan ini akan mencari opini dari pengguna produk tersebut apakah produknya di nilai positif atau negatif. Hal ini dilakukan untuk mengambil langkah strategis agar produknya tetap diminati masyarakat. Penilaian produk pada suatu perusahaan disebut dengan analisis sentimen. analisis sentiment yang ada sekarang dilakukan secara manual. Oleh karena itu untuk mendapatkan nilai sentiment secara otomatis dari suatu produk tersebut memiliki tantangan. Tantangan berupa teks yang tidak formal yang digunakan oleh pengguna twitter dalam mengeluarkan opini. Untuk itu dari penelitian ini menggunakan proses text mining yang di dalamnya terdapat tahapan preprocessing dan Ekstraksi fitur serta naïve bayes classifier sebagai metode klasifikasi nilai sentimen apakah opini bernilai positif atau negatif Pengumpulan Data Pada penelitian ini pengumpulan data dimulai dengan penarikan data tweet dari server twitter yang kemudian disimpan kedalam MongoDB. Penarikan data tweet dilakukan dengan menggunakan fasilitas Application Programming Interface (API). API adalah fasilitas yang telah disediakan oleh twitter. Application Programming Interface (API) ini mengambil data kotor tweet dari server twitter, yang selanjutnya akan dipilih menjadi data tweet bersih. Data tweet
31 31 ini akan disimpan di dalam database MongoDB. Berikut adalah gambar proses pengumpulan data : Penarikan Data tweet dengan API Server twitter Simpan di MongoDB Gambar 3.1. Proses pengumpulan data tweet Data tweet yang dijadikan sebagai data latih atau data training sebanyak 300 tweet. Data ini dijadikan sebagai data latih dimana akan dikategorikan secara manual dengan menilainya ke dalam 3 kategori sentiment yaitu tweet yang bersentimen negative, positif dan netral. Data ini disimpan ke dalam database MongoDB dengan tabel sebagai berikut : Tabel 3.1. tabel tweet training No Token tipe total 1 Enak positif 1 2 Sedap positif 2 3 Kotor negatif 1 4 Pahit negatif 1 5 Bahagia positif Proses Text Mining Pada proses text mining membutuhkan 2 (dua) tahapan yaitu : 1. Preprocessing ini dilakukan untuk menghindari data yang kurang sempurna, gangguan pada data, dan data-data yang tidak konsisten (Hemalatha, dkk, 2012). Tahapan pada text preprocessing yang dilakukan adalah:
32 32 a. Melakukan Cleaning menghilangkan kata yang tidak diperlukan agar dokumen bersih.contohnya: Mandi pakai LUX menambah wangi dan segar loh!! Mandi pakai LUX menambah wangi segar!! b. Case folding dengan mengubah semua huruf dalam dokumen menjadi huruf kecil. Hanya huruf a sampai dengan z yang diterima. Karakter selain huruf dihilangkan dan dianggap delimiter (Triawati, 2009). Contoh pemakaian case folding : Mandi pakai LUX menambah wangi segar!! mandi pakai lux menambah wangi segar c. Tahap tokenizing / parsing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. Contoh Tokenizing : mandi pakai lux menambah wangi segar mandi pakai lux menambah wangi segar d. Filtering Filtering adalah tahap mengambil kata-kata penting dari hasil token. Bisa menggunakan algoritma stoplist (membuang kata yang kurang penting) atau wordlist (menyimpan kata penting). Stoplist/stopword adalah katakata yang tidak deskriptif yang dapat dibuang dalam pendekatan bag-ofwords. Contoh stopwords adalah yang, dan, di, dari, dan seterusnya.( Triawati, 2009). Contoh Filtering : mandi pakai lux menambah wangi segar mandi pakai lux wangi segar
33 33 Berikut flowchart dari tahapan preprocessing: Mulai Tweet kotor Cleaning dan Case Folding Tokenisasi dan filtering Tweet bersih Selesai Gambar 3.2. Flowchart tahapan Preprocessing Berikut contoh hasil dari preprocessing : Input di beranda twitter (tweet kotor) : pakai AllNew CB150R? bikin tambah ganteng dengan Honda Genuine Accessories ya!@welovehonda@astramotor.pic.twitter.com/1z171bwdnv hasil tweet bersih setelah melalui tahapan preprocessing adalah pakai allnew cb150r tambah ganteng Honda genuine accessories
34 34 2. Ekstraksi Fitur Pada penelitian ini ekstraksi fitur menggunakan Term frequency adalah gagasan standar frekuensi dalam corpus based Natural Language Process atau pengolahan bahasa alami. (Yamamoto dan Church, 2001) Metode Klasifikasi Klasifikasi pada penelitian ini menggunakan Naïve Bayes Classifier.Pada tahapan ini akan dilakukan klasifikasi dengan menggunakan algoritma naïve bayes classiefier. Algoritma ini akan menghitung nilai sentimen positif, negatif atau netral. Penggunaan algoritma naïve bayes classifier adalah sebagai berikut : Contoh sentimen positif dengan dokumen pembelajaran(data latih) -> tekwan enak. Tabel 3.2. daftar kata sentiment positif No. Keyword Frekuensi (nk) 1 _t 1 2 Ek 1 3 Kw 1 4 An 1 5 n_ 2 6 _e 1 7 Na 1 8 Ak 1 Dari tabel 3.2. didapat: Jumah Frekuensi keseluruhan sentiment positif (n) = 9 Jumlah kata(kosakata) = 8
35 35 Sehingga dengan nilai tersebut dicari probabilitas dengan naïve bayes sebagai berikut : P(_t positif) = (1+1)/(9+8) = P(n_ positif) = (2+1)(9+8) =0.176 Dari data di atas dapat dilihat probabilitas kata sebagai berikut : Tabel 3.3. probabilitas kata tweet positif No. Keyword Frekuensi (nk) Probabilitas 1 _t Ek Kw An n_ _e Na Ak Berdasarkan nilai probabilitas di atas kita hitung nilai Vmap : =(0.117) (0.117) (0.117) (0.117) (0.176) (0.117) (0.117) (0.117) = E-08 Contoh dokumen sentiment negative -> tekwan gosong Tabel 3.4. daftar kata sentimen negatif No. Keyword Frekuensi (nk) 1 _t 1 2 Ek 1 3 Kw 1
36 36 4 An 1 5 n_ 2 6 _g 1 7 Os 1 8 So 1 9 Ng 1 Dari tabel 3.4. didapat: Jumah Frekuensi keseluruhan sentiment negatif (n) = 10 Jumlah kata(kosakata) = 9 Sehingga dengan nilai tersebut dicari probabilitas dengan naïve bayes sebagai berikut : P(_t positif) = (1+1)/(10+9) = P(n_ positif) = (2+1)(10+9) =0.157 Dari data di atas dapat dilihat probabilitas kata sebagai berikut: Tabel 3.5. Probabilitas tweet negatif No. Keyword Frekuensi (nk) Probabilitas 1 _t ek kw an n_ _g os so ng
37 37 Berdasarkan nilai probabilitas di atas kita hitung nilai Vmap : =(0.105) (0.105) (0.105) (0.105) (0.157) (0.105) (0.105) (0.105) (0.105) =2.3196E-09 Dari hasil perhitungan probabilitas antara sentimen positif dan sentimen negative didapatkan nilai tertinggi adalah kategori sentiment positif Perancangan Sistem Pada analisis sentiment data twitter menggunakan Unified Modeling Language (UML) untuk mendokumentasikan permasalahan dalam beberapa diagram diantarnya sebagai berikut : Diagram Use Case Pada analisis sentimen ini terdiri dari 1 aktor yaitu pengguna twitter. Berikut gambaran diagram use case dari analisis sentiment data twitter : <<uses> pengguna twitter <<include>> Beranda <<include>> <<include>> Hasil sentiment + Tokenizin g <<extend>> Klasifikasi <<extend>> Proses Data text <<extend>> praprose s <<extend>> simpan Gambar 3.3. diagram Use Case
38 38 Gambar di atas menunjukkan alur kerja analisis sentiment penelitian ini dengan penjelasan sebagai berikut : Halaman Utama : merupakan proses untuk masuk ke tahapan selanjutnya. Tokenizing : merupakan proses yang terdiri dari praproses yang didalamnya ada cleaning dan case folding untuk membersihkan data tweet. Data tweet bersih akan dikategorikan secara manual sebagai data latih yang selanjutnya disimpan di MongoDb. Klasifikasi : merupakan proses pengklasifikasian twitter dengan data tweet yang belum diketahui kategorinya dimana proses ini melewati tahapan preprocessing dan proses naïve bayes classifier sehingga menghasilkan kategori sentimen positif, negatif ataupun netral Spesifikasi Use Case Pada spesifikasi ini menjelaskan setiap use case yang ada di diagram use case pada gambar 3.3. terdiri dari 3 bagian yang dituangkan dalam tabel 3.2. berikut ini : Tabel 3.6. Spesifikasi Use Case Tipe 1 Use Case Beranda Uraian Skenario Pengguna twitter 1.Pengguna menbuka beranda 2. pengguna masuk ke pilihan selanjutnya
39 39 2 Use Case Tokenizing penjelasan aktor Tahapan 3 proses yang terdiri dari praproses yang didalamnya ada cleaning dan case folding untuk membersihkan data tweet. Data tweet bersih akan dikategorikan secara manual sebagai data latih yang selanjutnya disimpan di MongoDb. Pengguna twitter 1. Pengguna berada di halaman beranda 2. Pengguna memilih form tokenizing 3. Pengguna memilih file.txt untuk dijadikan data latih 4. Pengguna menentukan kategori positif atau negative 5. Pengguna melakukan praproses dimana didalamnya terdapat proses cleaning, case folding, filtering 6. Sistem akan menampilkan hasil praproces dalam bentuk tabel yang menjelaskan isi atau jumlah data yang di token. 7. Hasil praproses akan disimpan ke database Mongo Use Case Klasifikasi Penjelasan proses pengklasifikasian twitter dengan data tweet yang belum diketahui kategorinya dimana proses ini melewati tahapan preprocessing dan proses naïve bayes classifier sehingga menghasilkan
40 40 Tahapan kategori sentimen positif, negatif ataupun netral. 1. Pengguna berada di halaman beranda 2. Pengguna memilih form klasifikasi 3. Pengguna memasukkan trend produk yang akan diklasifikasi 4. Pengguna memasukkan jumlah tweet yang akan diklasifikasi 5. System akan mencari tweet sesuai dengan trend dan jumlah yang dicari 6. System menampilkan tweet yang dicari 7. Pengguna mengklik tombol analis 8. System akan menampilkan hasil dari proses analis dan menyimpannya Diagram Aktifitas Diagram ini berguna untuk menggambarkan alur dari aktifitas system yang sedang berjalan. Berikut diagram aktifitas yang terdiri dari 3 bagian yaitu : 1. Diagram Aktifitas Beranda Diagram ini menunjukkan alur User masuk ke dalam sistem yang dibuat User Sistem Membuka beranda Menerima permintaan buka Menerima tampilan menu pilihan Menampilkan menu pilihan Gambar 3.4. Diagram aktifitas Beranda
41 41 2. Diagram Aktifitas Tokenizing User Sistem Memilih menu tokenizing Menerima requets form tokenizing Menyisipkan file. txt dan memilih kategori positif atau negatif Menampilkan form tokenizing Menekan tombol praproses Menerima request praproses Menerima tampilan hasil praproses Melakukan praproses Gambar 3.5. Diagram aktifitas Tokenizing
42 42 3. Diagram AktifitasKlasifikasi User Sistem Memilih menu klasifikasi Menerima request form klasifikasi Masukkan trend dan jumlah Menampilkan form klasifikasi Menekan tombol cari trend Menerima request cari trend Menerima tampilan hasil pencarian Melakukan proses pencarian Menekan tombol analisa Menerima proses analisa Melakukan proses analisa naïve bayes Menerima hasil analisa Menampilkan hasil analisa Gambar 3.6. Diagram aktifitas Klasifikasi
43 Rancangan Antarmuka Perancangan antarmuka dalam analisis sentimen ini terbagi menjadi 3 tampilan yaitu: 1. Rancangan Halaman Utama Form Tokenizing Form Klasifikasi 2. Rancangan Halaman Tokenizing Gambar 3.7. Rancangan halaman utama Browse Positif Negatif Clearing Folding Tokenizing Statistic Token Positif Token Negatif total token praproses simpan tutup Gambar 3.8. Rancangan halaman Tokenizin
44 44 3. Rancangan Halaman Analisis Klasifikasi Twits Kata Kunci Trend Jumlah : Cari Trend Hasil analisa save Close Gambar 3.9. Rancangan halaman Klasifikasi
45 45 BAB IV HASIL DAN PEMBAHASAN 4.1. Hasil Implementasi sistem Setelah dilakukan analisa dan perancangan sistem maka akan dilakukan implementasi sistem analisa sentiment data twitter dengan menggunakan text mining pada suatu produk. Adapun spesifikasi perangkat keras dan lunak yang digunakan untuk mendukung penelitian ini adalah sebagai berikut : 1. Satu unit laptop dengan spesifikasi sebagai berikut : Prosesor Core i5 3337U 1.8 GHz, 14 HD Color Shine RAM 4 GB DDR3, Harddisk 500 GB VGA Nvidia Geforce GT720M 2 GB DVDRW, Wi-Fi OS Windows 7 2. Software yang di gunakan adalah sebagai berikut : NetBeans IDE 7.4 Mongo DB Java.
46 46 Seteleh Aplikasi dijalankan akan tampil Halaman beranda yang berisi menu pilihan untuk masuk ke form tokenizing dan form klasifikasi. Berikut gambar 4.1. neunjukkan tampilan halaman beranda. Gambar 4.1 Tampilan Halaman Utama Gambar 4.2. menunjukkan tampilan form tokenizing. Form ini berfungsi untuk mencari token dari setiap kalimat yang dimasukkan melalui file.txt. nilai token yang dihasilkan bernilai positif dan negative. Data token ini merupakan data latih untuk pembanding sebelum di analisa menggunakan naïve bayes classifier. Sehingga tampilan form tokenizing adalah sebagai berikut :
47 47 Gambar 4.2. Tampilan Form Tokenizing Selain form tokenizing pada sistem ini terdapat form klasifikasi. Form klasiifikasi berfungsi untuk mencari nilai kategori sentiment positif, sentiment negatif atau sentiment netral secara otomatis dengan menggunakan naïve bayes classifier. Form klasifikasi dapat dilihat pada gambar 4.3. sebagai berikut : Gambar 4.3. Tampilan Form Klasifikasi
48 Pengujian Pada tahap pngujian sistem akan mencari nilai klasifikasi terhadap data tweet secara otomatis. Nilai yang diperoleh berupa sentimen positif, sentiment negative atau netral pada setiap tweet yang ditampilkan. Pengujian ini menggunakan form klasifikasi dengan cara memasukkan trend dan jumlah data yang akan di analisa. Sebagai sampel data uji akan menggunakan produk makanan yaitu : tekwan dengan jumlah 100 tweet. Berikut tampilan hasil cari trend mengenai tekwan sebelum dianalisa pada gambar 4.4 : Gambar 4.4. Tampilan hasil mencari tweet Setelah dapat 100 tweet kita klik tombol analisa untuk mencari nilai dari setiap tweet dengan tampilan hasil sebagai berikut :
49 49 Gambar 4.5. Tampilan hasil klasifikasi tweet Pengujian lain juga bisa dilakukan dengan data latih lainnya, di sini kita mengambil contoh lagi untuk 200 data tentang produk rinso yang akan diklasifikasi dengan hasil sebagai berikut : Gambar 4.6. Tampilan hasil mencari tweet Rinso
50 50 Gambar 4.7. Tampilan hasil klasifikasi tweet Rinso 4.2. Pembahasan Berdasarkan hasil uji yang telah dilakukan didapatkan jumlah data yang terdiri dari 100 tweet tekwan didapatkan nilai dengan kategori sentimen positif sebanyak 35 sentimen negatif 0 sentimen netral 75. Hasil Uji untuk 200 data tweet dengan nama produk rinso didapatlan nilai tweet netral berjumlah 25 sentimen negative berjumlah 75 dan sentimen positif berjumlah 100.
Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk
Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma
Lebih terperinciBAB 3 ANALISIS MASALAH DAN PERANCANGAN
BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Kehadiran teknologi web yang interaktif telah merubah cara orang mengekspresikan pandangan dan opininya. Saat ini pengguna dapat menulis ulasan suatu produk pada situs
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Text Mining Text mining dapat diartikan sebagai penemuan informasi yang baru dan tidak diketahui sebelumnya oleh komputer, dengan secara otomatis mengekstrak informasi dari sumber-sumber
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
1. BAB I PENDAHULUAN 1.1 Latar Belakang website adalah salah satu layanan yang bisa digunakan untuk melakukan pencarian berbagai informasi, sehingga sangat dibutuhkan untuk keperluan pengguna dalam pencarian
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Manajemen Proyek 2.1.1. Pengertian Manajemen Menurut James A.F. Stoner (2006) Manajemen adalah suatu proses perencanaan, pengorganisasian, kepemimpinan, dan pengendalian upaya
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Liu opini merupakan pernyataan subyektif yang mencerminkan sentimen orang atau persepsi tentang entitas dan peristiwa [1]. Opini atau pendapat orang lain terhadap
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN
26 BAB III ANALISIS DAN PERANCANGAN Analisis dan perancangan berfungsi untuk mempermudah, memahami dan menyusun perancangan pada bab selanjutnya, selain itu juga berfungsi untuk memberikan gambaran dan
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Sumber opini teks saat ini tersedia berlimpah di internet akan tetapi belum sepenuhnya dimanfaatkan karena masih kurangnya tool yang ada, sedangkan perkembangan
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1. 1.1 Latar Belakang Perkembangan dunia telekomunikasi meningkat secara signifikan dalam kurun waktu satu dekade terahir. Tidak hanya dari segi jumlah pengguna, jenis layanan yang ditawarkanpun
Lebih terperinciJURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER
JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER Oleh: AGUNG PRAMONO PUTRO 12.1.03.03.0276 Dibimbing oleh : 1. NURSALIM, S.Pd,. MH 2. ARIE NUGROHO, S.Kom.,
Lebih terperinciBAB III METODOLOGI PENELITIAN
28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Situs jejaring sosial merupakan gaya hidup sosial baru yang muncul seiring berkembangnya internet. Gaya hidup baru tersebut memiliki ruang lingkup yang lebih luas
Lebih terperinciUKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
Lebih terperinciSENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER
SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER Agung Pramono 1, Rini Indriati 2, Arie Nugroho 3, 1,2,3 Sistem Informasi, Fakultas Teknik, Universitas Nusantara PGRI Kediri E-mail: 1 pramonoagung0741@gmail.com,
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Setiap matakuliah memiliki silabus perkuliahan yang berisi materi-materi mengenai matakuliah tersebut. Silabus disusun berdasarkan buku-buku referensi utama
Lebih terperinciBAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,
BAB I PENDAHULUAN 1.1. Latar Belakang Popularitas media jejaring sosial terus mengalami peningkatan dalam beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter, Facebook,
Lebih terperinciBAB IV ANALISIS, PERANCANGAN, DAN IMPLEMENTASI PERANGKAT LUNAK
BAB IV ANALISIS, PERANCANGAN, DAN IMPLEMENTASI PERANGKAT LUNAK Pada bab ini akan dibahas berbagai hal yang terkait analisis dan perancangan perangkat lunak web mining yang diusulkan sebagai solusi permasalahan.
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Text mining Menurut Feldman dan Sanger (Feldman dan Sanger, 2007), text mining dapat didefinisikan secara luas sebagai proses pengetahuan intensif yang memungkinkan pengguna berinteraksi
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1. Sistem Informasi Sistem informasi adalah sekumpulan elemen yang saling bekerja sama baik secara manual atau berbasis komputer yang didalamnya ada pengumpulan, pengolahan, pemprosesan
Lebih terperinci3.1 Desain Penelitian
24 BAB 3 METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian merupakan tahapan yang akan dilakukan penulis dalam melakukan penelitian. Tahapan penelitian yang digunakan
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
3 BAB I PENDAHULUAN 1.1. Latar Belakang Semakin banyaknya pengunaan teknologi informasi pada pemerintahan, dapat mempermudah masyarakat dalam pelayanan masyarakat itu sendiri. Seperti misalnya ketika sesorang
Lebih terperinciNur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK
Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait Penelitian terkait dengan topik analisis sentimen cukup banyak, berikut beberapa penelitian yang tekait dengan analisa sentimen yang menggunakan seleksi
Lebih terperinciBAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan
Lebih terperinciAplikasi Opinion Mining dengan Algoritma Naïve Bayes untuk Menilai Berita Online
Jurnal Integrasi, vol. 6, no. 1, 2014, 1-10 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Aplikasi Opinion Mining dengan Algoritma Naïve Bayes untuk Menilai
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN SISTEM
BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1. Analisis Sistem Analisis sistem bertujuan untuk mengidentifikasi permasalahanpermasalahan yang ada pada sistem yang meliputi perangkat lunak (software), pengguna
Lebih terperinciJurnal Ilmiah Komputer dan Informatika (KOMPUTA)
49 RANCANG BANGUN APLIKASI CHATBOT INFORMASI OBJEK WISATA KOTA BANDUNG DENGAN PENDEKATAN NATURAL LANGUAGE PROCESSING Elisabet Nila S. C. P 1, Irawan Afrianto 2 1,2 Program Studi Teknik Informatika Fakultas
Lebih terperinciBAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang
1 BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang Intelligent agent, sebagai bagian dari kecerdasan buatan yang dapat diterapkan pada sistem dalam menyelesaikan sebuah permasalahan. Agen yang diterapkan
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
1 BAB I PENDAHULUAN 1.1 Latar Belakang Human Resource Management merupakan prosedur sistematis untuk mengumpulkan, menyimpan, mempertahankan, menarik dan memvalidasi data yang di butuhkan oleh suatu organisasi
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar belakang
BAB I PENDAHULUAN 1.1 Latar belakang Dalam beberapa tahun terakhir teknologi informasi dan telekomunikasi berkembang dengan pesat. Masyarakat mendapatkan manfaat dari tekonologi informasi dan telekomunikasi
Lebih terperinciBAB III METODOLOGI PENELITIAN. Gambar 3.1 merupakan desain penelitian yang akan digunakan dalam
BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Gambar 3.1 merupakan desain penelitian yang akan digunakan dalam proses penelitian penerapan algoritma K-Means pada clustering berita berbahasa Indonesia.
Lebih terperinciIMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES
IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES Nama : Muhammad Rizki NPM : 54410806 Jurusan Pembimbing
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan
Lebih terperinciPEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES
1 BAB I PENDAHULUAN Dalam bab ini akan dibahas latar belakang dilaksanakannya penelitian, identifikasi masalah, batasan masalah, tujuan penelitian, manfaat penelitian, dan sistematika penulisan. Latar
Lebih terperinciUKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN
BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan
Lebih terperinciJurnal Informatika Mulawarman Vol. 10 No. 1 Februari
Jurnal Informatika Mulawarman Vol. 10 No. 1 Februari 2015 1 KLASIFIKASI DAN PENCARIAN BUKU REFERENSI AKADEMIK MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (NBC) (STUDI KASUS: PERPUSTAKAAN DAERAH PROVINSI
Lebih terperinciBAB I PENDAHULUAN.
BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini smartphone telah berevolusi menjadi komputer pribadi kecil dan portabel yang memungkinkan pengguna untuk melakukan penjelajahan internet, mengirim e-mail
Lebih terperinciBAB III ANALISA DAN PERANCANGAN SISTEM. Pada bab ini akan dibahas mengenai analisa dan perancangan dari sistem.
17 BAB III ANALISA DAN PERANCANGAN SISTEM Pada bab ini akan dibahas mengenai analisa dan perancangan dari sistem. Analisa system dilakukan untuk menemukan solusi dari permasalahan yang telah diajukan sebelumnya.
Lebih terperinciBAB IV PERANCANGAN SISTEM 4.1 PERANCANGAN SISTEM Untuk memudahkan pembuatan aplikasi sistem pakar berbasis website, maka akan dibuat model menggunakan UML (Unified Modeling Language). Perlu diketahui metode
Lebih terperinciPENDAHULUAN. I.1 Latar Belakang
I PENDAHULUAN I.1 Latar Belakang Internet sebagai jaringan komputer skala global telah mendorong pertambahan jumlah informasi digital. Pada sistem yang bersifat terbuka seperti internet, pertambahan informasi
Lebih terperinciBAB IV IMPLEMENTASI DAN PENGUJIAN
90 BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Sistem Tahap ini merupakan tahap dari implementasi program serta implementasi dari setiap proses tahap penelitian. 4.1.2 Persiapan Arsitektur Pada
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN Pada bab ini akan menjelaskan analisis dan perancangan sistem dari aplikasi translator bahasa Indonesia Sunda, Sunda Indonesia berbasis mobile dengan menggunakan metode
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Apa yang orang lain pikirkan telah menjadi sesuatu yang penting untuk menjadi pertimbangan dalam pengambilan keputusan (Pang and Lee, 2006). Sesuatu yang orang lain
Lebih terperinciBAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam.
BAB I PENDAHULUAN 1.1 Latar Belakang Setiap warga muslim di dunia membutuhkan informasi makanan halal, agar mereka terhindar dari yang namanya perbuatan dosa. Karena di dalam agama islam, sebagai umat
Lebih terperinciAkurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa
Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :
Lebih terperinciAPLIKASI SISTEM INFORMASI PENGOLAHAN DATA PADA DIREKTORAT RESERSE KRIMINAL KHUSUS POLDA SUMBAR
APLIKASI SISTEM INFORMASI PENGOLAHAN DATA PADA DIREKTORAT RESERSE KRIMINAL KHUSUS POLDA SUMBAR Janero Kennedy 1) 1) Magister Teknik Informatika, STMIK AMIKOM, Kota Yogyakarta. Jl Ring road Utara, Condongcatur,
Lebih terperinciBAB II LANDASAN TEORI Konsep Dasar Membangun Aplikasi Berbasis Web
BAB II LANDASAN TEORI 2.1. Konsep Dasar Membangun Aplikasi Berbasis Web Aplikasi berbasis web adalah aplikasi yang dijalankan melalui browser dan diakses melalui jaringan komputer. Aplikasi berbasis web
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen
Lebih terperinciSISTEM PEMANTAUAN DISTRIBUSI PEMBAYARAN PARKIR MELALUI INTERNET
SISTEM PEMANTAUAN DISTRIBUSI PEMBAYARAN PARKIR MELALUI INTERNET Kartika Megasari Jurusan Sistem Informasi Fakultas Ilmu Komputer Universitas Gunadarma kartika87ms@gmail.com 29 September 2009 ABSTRAKSI
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1. Desain Penelitian Desain penelitian merupakan tahapan atau gambaran yang akan dilakukan dalam melakukan penelitian. Tahapan-tahapan yang dilakukan dalam penelitian ini
Lebih terperinciABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA
ABSTRAK Twitter merupakan sebuah aplikasi social networking yang memungkinkan usernya untuk dapat mengirimkan pesan pada waktu yang bersamaan. Data yang diambil melalui Twitter dapat dijadikan sebagai
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan media online mendorong munculnya informasi tekstual yang tidak terbatas, sehingga muncul kebutuhan penyajian tanpa mengurangi nilai dari informasi tersebut.
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Pada penelitian ini ada beberapa tahapan penelitian yang akan dilakukan seperti terlihat pada gambar 3.1 berikut : Mulai Identifikasi Masalah Pengumpulan Data Analisa Aplikasi
Lebih terperinciBAB IV ANALISIS DAN PERANCANGAN SISTEM
BAB IV ANALISIS DAN PERANCANGAN SISTEM 4.1 Analisis Yang Berjalan Sebelum merancang suatu sistem, ada baiknya terlebih dahulu menganalisis sistem yang sedang berjalan di Distro yang akan dibangun tersebut.
Lebih terperinciDAFTAR ISI. KATA PENGANTAR... i. DAFTAR ISI... iii. DAFTAR GAMBAR... viii. DAFTAR TABEL... xii. DAFTAR LAMPIRAN... xiii
DAFTAR ISI KATA PENGANTAR... i DAFTAR ISI... iii DAFTAR GAMBAR... viii DAFTAR TABEL... xii DAFTAR LAMPIRAN... xiii BAB I PENDAHULUAN 1.1. Latar Belakang Masalah... 1 1.2 Rumusan Masalah... 3 1.3 Tujuan...
Lebih terperinciIMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir
IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA Tugas Akhir Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Situs belanja online sering disebut juga dengan situs e-commerce yaitu suatu proses membeli dan menjual produk-produk secara elektronik oleh konsumen dan dari perusahaan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Twitter Twiter adalah sebuah layanan media sosial yang memungkinkan penggunanya untuk menulis maksimal 140 karakter, yang dikenal sebagai Tweet. Twitter didirikan oleh Jack Dorsey
Lebih terperinciBAB 4 IMPLEMENTASI DAN EVALUASI. Menggunakan server dengan spesifikasi sebagai berikut : - Processor 1.2 GHz 2007 Opteron or 2007 Xeon processor
BAB 4 IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Sistem Menggunakan server dengan spesifikasi sebagai berikut : - Processor 1.2 GHz 2007 Opteron or 2007 Xeon processor - Memory 512MB DDR - Harddisk 5GB
Lebih terperinciOleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak
TEKNIK DATA MINING MENGGUNAKAN METODE BAYES CLASSIFIER UNTUK OPTIMALISASI PENCARIAN PADA APLIKASI PERPUSTAKAAN (STUDI KASUS : PERPUSTAKAAN UNIVERSITAS PASUNDAN BANDUNG) Oleh : Selvia Lorena Br Ginting,
Lebih terperinciBAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan
1 BAB I PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan media sosial menawarkan pengguna kesempatan untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan tidak lagi memiliki
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.
Lebih terperinciBAB I PENDAHULUAN. memproduksi kapas seperti kapas kecantikan dengan merek Selection Cotton.
BAB I PENDAHULUAN I.1. Latar Belakang Sistem Informasi Geografis adalah sistem informasi khusus yang mengelola data yang memiliki informasi spasial (bereferensi keruangan). Atau dalam arti yang lebih sempit,
Lebih terperinciBAB I PENDAHULUAN. sebagai sumber pertama dan utama yang banyak memuat ajaran-ajaran yang
BAB I PENDAHULUAN 1.1 Latar Belakang Al-qur an dan hadits sebagai sumber pedoman hidup, sumber hukum dan ajaran dalam islam antara satu dengan yang lain tidak dapat dipisahkan. Al qur an sebagai sumber
Lebih terperinciIMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET
IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Lebih terperinciBAB I PENDAHULUAN. pengembangan pendidikan di bumi nusantara ini adalah sekolah baik sekolah
BAB I PENDAHULUAN I.1. Latar Belakang Pada saat ini kebutuhan akan informasi yang cepat sangatlah penting, terutama dengan perkembangan teknologi informasi pada segala bidang maka penggunaan teknologi
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN Pada bagian ini akan dijelaskan tentang pendahuluan dalam penyusunan Laporan Penelitian. Pendahuluan meliputi latar belakang masalah, rumusan masalah, tujuan penelitian, batasan masalah,
Lebih terperinciBAB III ANALISIS DAN DESAIN SISTEM
BAB III ANALISIS DAN DESAIN SISTEM III.1. Analisis Masalah Kebutuhan akan teori dalam dunia pendidikan sangat besar. Teori banyak di tulis ke dalam sebuah buku maupun jurnal. Pada universitas potensi utama,
Lebih terperinciUnified Modelling Language (UML)
Unified Modelling Language (UML) Tatik yuniati Abstrak Unified Modelling Language (UML) adalah sebuah bahasa yg telah menjadi standar dalam industri untuk visualisasi, merancang dan mendokumentasikan sistem
Lebih terperinciBAB III METODE PENELITIAN. Pendekatan metode pengembangan sistem yang digunakan peneliti merupakan
BAB III METODE PENELITIAN 3.1. Metode Pengembangan Sistem Pendekatan metode pengembangan sistem yang digunakan peneliti merupakan salah satu dari agile methods yaitu extreme Programming (XP). Dalam metode
Lebih terperinciBAB I PENDAHULUAN. informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentimen
BAB I PENDAHULUAN I.1. Latar Belakang Analisis sentimen terhadap layanan merupakan proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang terkandung
Lebih terperinciBAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah
BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini, microblogging menjadi sangat popular untuk alat komunikasi antara pengguna internet. Setiap hari jutaan pesan muncul di website penyedia microblogging diantaranya
Lebih terperinciKLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO
F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1 Alat dan Bahan 3.1.1 Alat Dalam penelitian ini, alat yang di gunakan adalah sebagai berikut: 1. Perangkat Keras (Hardware) a) Personal Computer (PC)/Laptop 32/64 bit architecture
Lebih terperinciANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( )
ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. (0927050) Jurusan Sistem Komputer, Fakultas Teknik, Jalan Prof. Drg. Suria Sumantri
Lebih terperinciUKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Berkembangnya teknologi telah membuat banyak informasi bermunculan. Informasi-informasi tersebut tertuang dalam bentuk dokumen terutama dokumen digital. Semakin
Lebih terperinciBAB 3. METODOLOGI PENELITIAN
BAB 3. METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian Pada penelitian ini menggunakan alat penelitian berupa perangkat keras dan perangkat lunak, yaitu : 1. Perangkat keras a. Processor Intel Core
Lebih terperinciBAB IV ANALISIS DAN PERANCANGAN SISTEM. permasalahan dari suatu sistem informasi. Hasil akhir dari analisis sistem
BAB IV ANALISIS DAN PERANCANGAN SISTEM 4.1. Analisis yang Berjalan Analisis sistem merupakan proses memilah-milah suatu permasalahan menjadi elemen-elemen yang lebih kecil untuk dipelajari guna mempermudah
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA Bab Tinjauan Pustaka memuat uraian gambaran umum dan fungsi-fungsi pada perpustakaan, pengertian sistem informasi, dan kaitan antara perpustakaan dan sistem informasi. 2.1. Perpustakaan
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Selain sebagai media komunikasi, Twitter memberikan akses bagi pihak ketiga yang ingin mengembangkan aplikasi yang memanfaatkan layanannya melalui Twitter API. Salah
Lebih terperinciBab 3 Metoda dan Perancangan Sistem
Bab 3 Metoda dan Perancangan Sistem Pada bab ini akan dibahas mengenai metode perancangan yang digunakan dalam membuat perancangan sistem aplikasi pendeteksian kata beserta rancangan design interface yang
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 1.1 Teori Umum 1.1.1 Aplikasi SMS Lokal Komputer Aplikasi SMS Lokal Komputer digunakan untuk pengiriman SMS ke pelanggan dengan menggunakan PC yang disambungkan dengan Handphone agar
Lebih terperinciBAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang
BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan
Lebih terperinciBAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan
BAB I PENDAHULUAN 1.1 Latar Belakang Social media merupakan salah satu tren yang berkembang di masyarakat sebagai tempat untuk berinteraksi. Selain untuk berinteraksi dengan lingkungan sosialnya pengguna
Lebih terperinci