BAB I PENDAHULUAN. Perkembangan teknologi informasi yang semakin meningkat memberi

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB I PENDAHULUAN. Perkembangan teknologi informasi yang semakin meningkat memberi"

Transkripsi

1 1 BAB I PENDAHULUAN 1.1. Latar Belakang Perkembangan teknologi informasi yang semakin meningkat memberi dampak pada pertukaran informasi dan komunikasi yang semakin mudah. Hal ini ditandai dengan dengan munculnya media sosial seperti Twitter, Facebook, Yahoo, Google, Youtube, Instagram, Path. Pertumbuhan media sosial ini juga mendorng adanya informasi tekstual yang besar sehingga muncul kebutuhan penyajian data yang memudahkan pengguna mendapatkan informasi yang akurat. Media sosial twitter merupakan salah satu media komunikasi populer saat ini. Hal ini terlihat dari peningkatan pengguna twitter yang tercatat di seluruh dunia. Berdasarkan data yang dirilis infografis (tahun ) Twitter memiliki 302 juta pengguna aktif yang 80 persennya berasal dari perangkat mobile. Dari angka itu, 37 persen pengguna Twitter berusia tahun, sedangkan 25 persen lainnya berada di rentan usia tahun. Dengan jumlah pengguna aktif sebanyak itu, Twitter menerima kicauan sebanyak 500 juta setiap harinya. Sebanyak 68 persen berupa kicauan balasan, 26 persen berupa kicauan, dan 6 persen adalah kicauan ulang.

2 2 Pengguna twitter yang semakin meningkat ini terlihat dari jutaan tweets yang di posting setiap harinya dengan berbagai topik yang berbeda. Data tweets ini dapat berupa persepsi publik baik ekonomi, perilaku sosial, fenomena alam, perdagangan yang terjadi diseluruh dunia. Data yang besar tersebut bisa dijadikan sebagai objek penelitan, seperti yang telah dilakukan oleh [Cahyanti, O.D., Saksono, P.H., Suryayusra, Negara, E.S., (2015)], dalam penelitiannya twitter sebagai objek penelitan, dengan menggunakan teknik- teknik khusus untuk menjadikan data yang berupa teks dari twitter menjadi informasi. Informasi yang telah didapatkan tersebut juga merefleksikan bagaimana perilaku masyaratak terhadap suatu peristiwa yang sedang terjadi pada kehidupan nyata yang dituangkan pada sosial media. Hasil penelitian yang dilakukan oleh [Cahyanti, O.D., Saksono, P.H., Suryayusra, Negara, E.S., (2015)] mengenai peristiwa jatuhnya pesawat AirAsia QZ8501 yang terjadi tanggal 28 Desember 2014 di Selat Karimata memperlihatkan dari negara mana saja yang ikut mengamati peristiwa jatuhnya pesawat tersebut berdasarkan bahasa yang digunakan pada saat mengunggah tweets, mengidentifikasi tipe pengguna twitter, rentang usia pengguna serta jenis kelamin. Berdasarkan penelitian yang telah ada sebelumnya, penelitan ini mencoba melakukan analisis sentimen data dengan mengklasifikasi data twitter berbahasa Indonesia pada suatu produk. Data tersebut akan diproses dengan text mining untuk menghindari data yang kurang sempurna kemudian mengklasifikasi data tweet ke dalam tiga klasifikasi yaitu klasifikasi positif, negatif, netral. Klasifikasi ini menggunakan algoritma Naïve Bayes Classifier.

3 3 Dari uraian uraian yang telah dijelaskan dapat diambil suatu masalah untuk dijadikan bahan penelitian yang berjudul Analisa Sentimen Pada Data Twitter Dengan Menggunakan Text Mining Terhadap Suatu Produk Perumusan Masalah Berdasarkan latar belakang yang telah diuraikan maka permasalahan yang akan dibahas adalah Bagaimana Menganalisis dan mengklasifikasi Sentimen Pada Data Twitter Menggunakan Text Mining terhadap Suatu Produk.? 1.3. Batasan Masalah Untuk lebih memudahkan dalam melakukan analisis data dan menghindari pembahasan yang terlalu jauh maka akan dibatasi permasalahan sebagai berikut: 1. Naïve Bayes Classifier merupakan algoritma yang digunakan untuk pengklasifikasian data Twitter suatu produk berbahasa Indonesia. 2. Penelitian ini menggunakan data teks berbahasa Indonesia yang bersumber dari media sosial yaitu Twitter Tujuan dan Manfaat Penelitian Tujuan Penelitian Adapun tujuan penelitian ini adalah : 1. Mengklasifikasikan data Twitter dengan menggunakan Algoritma Naïve Bayes Classifier. 2. Mendapatkan Kategori Analisis Sentimen positif, negatiif dan netral dari text berbahasa Indonesia yang ada pada data twitter suatu produk.

4 Manfaat Penelitian Adapun manfaat penelitian ini adalah: 1. Memperoleh informasi terkait dengan suatu produk dan menentukan apakah produk tersebut dinilai positif, negatif atau netral di twitter. 2. Memperoleh klasifikasi sentimen pada twitter secara otomatis Metodologi Penelitian Waktu dan Tempat Penelitian Pada Penelitian ini penulis membutuhkan waktu 6 bulan untuk melakukan analisis data, perancangan, pengkodean, pengujian hingga pendokumentasian. Objek pada penelitian ini adalah media social yaitu Twitter Metode Penelitian Metode penelitian yang di gunakan dalam penelitian ini ialah metode Deskriptif. Metode deskriptif adalah suatu metode yang digunakan untuk menggambarkan atau menganalisis suatu hasil penelitian tetapi tidak digunakan untuk membuat kesimpulan yang lebih luas. [Sugiyono, (2005: 21)]. Dalam penelitian ini penulis menggunakan metode penelitian deskriptif untuk mendeskripsikan fenomena yang terjadi di seluruh dunia melalui media sosial twitter. Dengan menganalisa data tweet yang di up-date oleh pengguna twitter seputar informasi terhangat yang terjadi di seluruh dunia Metode Pengumpulan Data Metode pengumpulan data yang digunakan oleh penulis adalah kajian kepustakaan, dimana sumber data utama dalam penelitian ini berasal dari jurnal-

5 5 jurnal ilmiah, artikel ilmiah, internet, dan laporan-laporan yang berkaitan dengan pemanfaatan data tweet pada media sosial twitter Metode Analisis Pada metode analisis terdapat langkah-langkah dasar yang akan dilakukan adalah: 1. Identify, yaitu melakukan proses identifikasi masalah. 2. Understand, yaitu memahami kerja dari sistem yang ada. 3. Analysis, yaitu melakukan analisa terhadap sistem. 4. Report, yaitu membuat laporan dari hasil analisis [Mulyanto, (2009:129)] Sistematika Penulisan Sistematika dalam penulisan ini menguraikan struktur bab dalam penelitian dan gambaran umum sebagai berikut : BAB I PENDAHULUAN Pada bab ini berisi latar belakang masalah, rumusan masalah, tujuan dan manfaat penelitian, batasan masalah, metodologi penelitian, dan sistematika penulisan. BAB II LANDASAN TEORI Pada bab ini menguraikan pengertian mengenai tinjauan pustaka yang berisi tentang teori-teori yang mendukung dalam penilitian ini. BAB III ANALISA DAN PERANCANGAN Pada bab ini menjelaskan tentang analisis sistem, perancangan sistem dan perancangan antarmuka.

6 6 BAB IV HASIL DAN PEMBAHASAN Pada bab ini menguraikan tentang hasil dan pembahasan tentang tujuan dari penelitian ini. BAB V KESIMPULAN DAN SARAN Pada bab ini menguraikan kesimpulan dari keseluruhan bab dan diikuti dengan saran.

7 7 BAB II LANDASAN TEORI 2.1. Analisis Sentimen Penelitian mengenai analisis sentimen terus berkembang, di setiap penelitian memiliki perbedaan baik mengenai metode, data, Bahasa, algoritma maupun perhitungan pembobotan yang berbeda. Analisis Sentimen atau opinion mining mengacu pada bidang yang luas dari pengolahan bahasa alami, komputasi linguistik dan text mining yang bertujuan menganlisa pendapat, sentimen, evaluasi, sikap, penilaian dan emosi seseorang apakah pembicara atau penulis berkenaan dengan suatu topik, produk, layanan, organisasi, individu, ataupun kegiatan tertentu (Liu, 2011). Tugas dasar dalam analisis sentimen adalah mengelompokkan teks yang ada dalam sebuah kalimat atau dokumen kemudia menentukan pendapat yang dikemukakan dalam kaliamat atau dokumen tersebut apakah bersifat positif, negatif atau netral (Dehaff, M., 2010). Ekspresi atau sentiment mengacu pada fokus topik tertentu, pernyataan pada satu topik mungkin akan berbeda makna dengan pernyataan yang sama pada subject yang berbeda. Oleh karena itu pada beberapa penelitian, terutama pada review produk, pekerjaan didahului dengan

8 8 menentukan elemen dari sebuah produk yang sedang dibicarakan sebelum memulai proses opinion mining (Barber, 2010) Twitter Menurut [Jansen, B.J, Zhang, M., Sobel, K., Chowdury, A., (2009)] twitter merupakan sebuah situs web yang dimiliki dan dioperasikan oleh Twitter Inc, yang menawarkan jejaring sosial berupa mikroblog sehingga memungkinkan penggunanya untuk mengirim dan membaca pesan yang disebut tweets. Tweets melalui situs Twitter, aplikasi eksternal yang kompatibel (telepon seluler), atau dengan pesan singkat (SMS) yang tersedia di negara-negara tertentu. Pengguna dapat menulis pesan berdasarkan topik dengan menggunakan tanda # (hashtag). Sedangkan untuk menyebutkan atau membalas pesan dari pengguna lain bisa menggunakan Pesan pada awalnya diatur hanya mempunyai batasan sampai 140 karakter disesuaikan dengan kompatibilitas dengan pesan SMS, memperkenalkan singkatan notasi dan slang yang biasa digunakan dalam pesan SMS. Batas karakter 140 juga meningkatkan penggunaan layanan memperpendek URL seperti bit.ly, goo.gl, dan tr.im, dan jasa hosting konten, seperti Twitpic, Tweephoto, memozu.com dan NotePub untuk mengakomodasi multimedia isi dan teks yang lebih panjang daripada 140 karakter. Twitter menggunakan bit.ly untuk memperpendek otomatis semua URL yang dikirim-tampil. Twitter Timelines merupakan istilah yang menggambarkan kumpulan seluruh update status dari pengguna akun twitter yang di follow oleh pengguna. Biasanya ditampilkan dalam bentuk satu kolom kotak. Twitter timelines biasanya

9 9 ditampilkan berdasarkan waktu penerbitan tweet. Tweet yang terbaru akan ditampilkan dalam kotak paling atas. Jenis sosial media seperti Twitter dapat menciptakan serta menggerakkan komunitas, mengendalikan traffic di blog, website. Twitter juga bersifat real time, mengembangkan jaringan yang tak terbatas, dapat menyebarkan ide, membuka peluang pasar, menciptakan personal brand, dapat meningkatkan pelayanan kepada konsumen serta memanusiakan brand. Menurut Puntoadi (2011: ) dalam Dosi Aprilinda Palewa (2013:34), twitter memiliki kelebihan, yaitu : 1. Following : twitter dapat mengidentifikasi jumlah akun yang diikuti. 2. Followers : twitter dapat mengidentifikasi jumlah akun yang mengikuti. 3. Updates : twitter mendeteksi seberapa sering orang melakukan posting (menulis konten) 4. Men-tag nama : beberapa orang akan terlibat dalam pembicaraan apabila mencantumkan akun pada setiap status yang ditulis. 5. Re-tweet : dengan me-retweet status followers lain menunjukkan tweets tersebut menarik untuk dibahas. Tweet tersebut dapat dibaca oleh seluruh followers. 6. Keterlibatan : brand harus mampu untuk meningkatkan keterlibatan para konsumen dalam berbagai percakapan. 7. Kecepatan : konsitensi dan frekuensi diperlukan untuk mengimbangi kecepatan perubahan informasi yang beredar di twitter.

10 Text Mining Text mining adalah bidang interdisipliner yang mengacu pada pencarian informasi, pertambangan data, pembelajaran mesin, statistik, dan komputasi linguistik. Dikarenakan kebanyakan informasi (perkiraan umum mengatakan lebih dari 80%) saat ini disimpan sebagai teks, text mining diyakini memiliki potensi nilai komersial tinggi (Bridge, 2011). Text mining merupakan teknik yang digunakan untuk menangani masalah klasifikasi, clustering, information extraction dan information retrival (Berry & Kogan, 2010). Text mining (penambangan teks) adalah penambangan yang dilakukan oleh komputer untuk mendapatkan sesuatu yang baru, sesuatu yang tidak diketahui sebelumnya atau menemukan kembali informasi yang tersirat secara implisit, yang berasal dari informasi yang diekstrak secara otomatis dari sumber-sumber data teks yang berbeda- beda (Feldman & Sanger, 2007). Text mining mengacu pada proses mengambil informasi berkualitas tinggi dari teks. Informasi berkualitas tinggi biasanya diperoleh melalui peramalan pola dan kecenderungan melalui sarana seperti pembelajaran pola statistic. Proses text mining yang khas meliputi kategorisasi teks, text clustering, ekstraksi konsep/entitas, produksi taksonomi granular, sentiment analysis, penyimpulan dokumen, dan pemodelan relasi entitas (yaitu, pembelajaran hubungan antara entitas bernama) (Saraswati, 2013). Pendekatan manual text mining secara intensif dalam laboratorium pertama muncul pada pertengahan 1980-an, namun kemajuan teknologi telah memungkinkan ranah tersebut untuk berkembang selama dekade terakhir. Text mining biasanya melibatkan proses penataan teks input (biasanya parsing, bersama dengan penambahan beberapa fitur linguistik

11 11 turunan dan penghilangan beberapa diantaranya, dan penyisipan subsequent ke dalam database), menentukan pola dalam data terstruktur, dan akhirnya mengevaluasi dan menginterpretasi output. Berkualitas tinggi di bidang text mining biasanya mengacu ke beberapa kombinasi relevansi, kebaruan, dan interestingness.(saraswati, 2011). Tahap-tahap text mining secara umum adalah text preprocessing dan feature selection (Feldman & Sanger 2007, Berry & Kogan 2010). Dimana penjelasan dari tahap-tahap tersebut adalah sebagai berikut: 1. Text Preprocessing Tahap text preprocessing adalah tahap awal dari text mining. Tahap ini mencakup semua rutinitas, dan proses untuk mempersiapkan data yang akan digunakan pada operasi knowledge discovery sistem text mining (Feldman & Sanger, 2007). Tahapan yang akan dilakukan proses text mining, pada umumnya memiliki beberapa karakteristik diantaranya adalah memiliki dimensi yang tinggi, terdapat noise pada data, dan terdapat struktur teks yang tidak baik. Cara yang digunakan dalam mempelajari suatu data teks, adalah dengan terlebih dahulu menentukan fitur-fitur yang mewakili setiap kata untuk setiap fitur yang ada pada dokumen. Sebelum menentukan fitur-fitur yang mewakili, diperlukan tahap preprocessing yang dilakukan secara umum dalam teks mining pada dokumen, yaitu case folding, tokenizing, filtering, stemming, tagging dan analyzing (Triawati, 2009).

12 12 a. Case folding dan Tokenizing Case folding adalah mengubah semua huruf dalam dokumen menjadi huruf kecil. Hanya huruf a sampai dengan z yang diterima. Karakter selain huruf dihilangkan dan dianggap delimiter (Triawati, 2009). Contoh pemakaian case folding : Bagaimana keadaanmu Hari ini? bagaimana keadaanmu hari ini Tahap tokenizing / parsing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. Contoh Tokenizing : bagaimana keadaanmu hari ini bagaimana keadaanmu hari ini b. Filtering Filtering adalah tahap mengambil kata-kata penting dari hasil token. Bisa menggunakan algoritma stoplist (membuang kata yang kurang penting) atau wordlist (menyimpan kata penting). Stoplist/stopword adalah katakata yang tidak deskriptif yang dapat dibuang dalam pendekatan bag-ofwords. Contoh stopwords adalah yang, dan, di, dari, dan seterusnya.( Triawati, 2009). Contoh Filtering : bagaimana keadaanmu hari ini keadaan hari ini c. Stemming Tahap stemming adalah tahap mencari root kata dari tiap kata hasil filtering. Pada tahap ini dilakukan proses pengembalian berbagai bentukan kata ke dalam suatu representasi yang sama (Agusta, 2009).

13 13 Tahap ini kebanyakan dipakai untuk teks berbahasa Inggris dan lebih sulit diterapkan pada teks berbahasa Indonesia. 2. Feature Selection Tahap seleksi fitur (feature selection) bertujuan untuk mengurangi dimensi dari suatu kumpulan teks, atau dengan kata lain menghapus kata-kata yang dianggap tidak penting atau tidak menggambarkan isi dokumen sehingga proses pengklasifikasian lebih efektif dan akurat (Do et al, 2006., Feldman & Sanger, 2007., Berry & Kogan 2010). Saat ini text mining telah mendapat perhatian dalam berbagai bidang diantaranya (Saraswati, 2011) : 1. Aplikasi keamanan Banyak paket perangkat lunak text mining dipasarkan terhadap aplikasi keamanan, khususnya analisis plain text seperti berita internet. Hal ini juga mencakup studi enkripsi teks. 2. Aplikasi biomedis Berbagai aplikasi text mining dalam literatur biomedis telah disusun. Salah satu contohnya adalah PubGene yang mengkombinasikan text mining biomedis dengan visualisasi jaringan sebagai sebuah layanan Internet. Contoh lain text mining adalah GoPubMed.org. Kesamaan semantik juga telah digunakan oleh sistem text mining yaitu GOAnnotator. 3. Perangkat Lunak dan Aplikasi Departemen riset dan pengembangan perusahaan besar, termasuk IBM dan Microsoft, sedang meneliti teknik text mining dan mengembangkan program untuk lebih mengotomatisasi proses pertambangan dan analisis. Perangkat

14 14 lunak text mining juga sedang diteliti oleh perusahaan yang berbeda yang bekerja di bidang pencarian dan pengindeksan secara umum sebagai cara untuk meningkatkan performansinya. 4. Aplikasi Media Online Text mining sedang digunakan oleh perusahaan media besar, seperti perusahaan Tribune, untuk menghilangkan ambigu informasi dan untuk memberikan pembaca dengan pengalaman pencarian yang lebih baik, yang meningkatkan loyalitas pada site dan pendapatan. Selain itu, editor diuntungkan dengan mampu berbagi, mengasosiasi dan properti paket berita, secara signifikan meningkatkan peluang untuk menguangkan konten. 5. Aplikasi Pemasaran Text mining juga mulai digunakan dalam pemasaran, lebih spesifik dalam analisis manajemen hubungan pelanggan. 6. Sentiment Analysis Sentiment Analysis mungkin melibatkan analisis dari review film untuk memperkirakan berapa baik review untuk sebuah film. Analisis semacam ini mungkin memerlukan kumpulan data berlabel atau label dari efektifitas katakata. Sebuah sumber daya untuk efektivitas kata-kata telah dibuat untuk WordNet. 7. Aplikasi Akademik Masalah text mining penting bagi penerbit yang memiliki database besar untuk mendapatkan informasi yang memerlukan pengindeksan untuk pencarian. Hal ini terutama berlaku dalam ilmu sains, di mana informasi yang sangat spesifik sering terkandung dalam teks tertulis. Oleh karena itu, inisiatif

15 15 telah diambil seperti Nature s proposal untuk Open Text Mining Interface (OTMI) dan Health s common Journal Publishing untuk Document Type Definition (DTD) yang akan memberikan isyarat semantik pada mesin untuk menjawab pertanyaan spesifik yang terkandung dalam teks tanpa menghilangkan barrier penerbit untuk akses publik. Sebelumnya, website paling sering menggunakan pencarian berbasis teks, yang hanya menemukan dokumen yang berisi kata-kata atau frase spesifik yang ditentukan oleh pengguna. Sekarang, melalui penggunaan web semantik, text mining dapat menemukan konten berdasarkan makna dan konteks (daripada hanya dengan kata tertentu). Text mining juga digunakan dalam beberapa filter spam sebagai cara untuk menentukan karakteristik pesan yang mungkin berupa iklan atau materi yang tidak diinginkan lainnya. Dengan text mining tugas-tugas yang berhubungan dengan penganalisaan teks dengan jumlah yang besar, penemuan pola serta penggalian informasi yang mungkin berguna dari suatu teks dapat dilakukan. Sebagai bentuk aplikasi dari text mining, sistem klasifikasi berita menggunakan berita sebagai sumber informasi dan informasi klasifikasi sebagai informasi yang akan diekstrak dari sumber informasi. Informasi klasifikasi dapat berbentuk angka-angka probabilitas, set aturan atau bentuk lainnya Klasifikasi Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk memperkirakan kelas yang tidak diketahui dari suatu objek (Tan et all, 2004). Dalam pengklasifikasian data terdapat dua proses yang dilakukan yaitu:

16 16 1. Proses training Pada proses training digunakan training set yang telah diketahui labellabelnya untuk membangun model atau fungsi. 2. Proses testing Untuk mengetahui keakuratan model atau fungsi yang akan dibangun pada proses training, maka digunakan data yang disebut dengan testing set untuk memprediksi label-labelnya. Gambar 2.1 Tahapan Proses Klasifikasi ( Tujuan dari klasifikasi adalah untuk: 1. Menemukan model dari training set yang membedakan record kedalam kategori atau kelas yang sesuai, model tersebut kemudian digunakan untuk mengklasifikasikan record yang kelasnya belum diketahui sebelumnya pada test set. 2. Mengambil keputusan dengan memprediksikan suatu kasus, berdasarkan hasil klasifikasi yang diperoleh. Klasifikasi merupakan penempatan objek-objek ke salah satu dari beberapa kategori yang telah ditetapkan sebelumnya. Klasifikasi telah banyak

17 17 ditemui dalam berbagai aplikasi. Sebagai contoh, pendeteksian pesan , spam berdasarkan header dan isi atau mengklasifikasikan galaksi berdasarkan bentukbentuknya. Data input untuk klasifikasi adalah koleksi record. Setiap record dikenal sebagai instance atau contoh yang ditentukan oleh sebuah tuple (x,y). Dimana x adalah himpunan atribut dan y adalah atribut tertentu, yang dinyatakan sebagai label class (juga dikenal sebagai kategori atau atribut target). Klasifikasi adalah tugas pembelajaran sebuah fungsi target f yang memetakan setiap himpunan atribut x ke salah satu label kelas y yang telah di definisikan sebelumnya. Fungsi target juga di kenal secara informal sebagai model klasifikasi (tan et all, 2006). Model klasifikasi terdiri dari dua bagian yaitu: 1. Pemodelan Deskriptif Model klasifikasi dapat bertindak sebagai alat penjelas untuk membedakan objek objek dari kelas kelas yang berbeda. Sebagai contoh untuk para ahli Biologi, model deskriptif yang meringkas data. 2. Pemodelan Prediktif Model klasifikasi juga dapat di gunakan untuk memprediksikan label kelas dari record yangn tidak diketahui. Seperti pada gambar 2 tampak sebuah model klasifikan dapat dipandang sebagai kotak hitam yang secara otomatis memberikan sebuah label ketika dipresentasikan dengan himpunan atribut dari record yang tidak di ketahui. Attribut set (x) Input Classification model Output Class label (y) Gambar 2.2 Klasifikasi sebagai suatu tugas memetakan atribut x ke

18 18 dalam label kelas y (Tan et all, 2006) Beberapa teknik klasifikasi yang digunakan adalah decision tree classifier, rule-based classifier, neural-network, support vector machine, dan naïve bayes classifier, Setiap teknik menggunakan algoritme pembelajaran untuk mengidentifikasi model yang memberikan hubungan yang paling sesuai antara himpunan atribut dan label kelas dari data input. Pendekatan umum yang digunakan dalam masalah klasifikasi adalah, pertama,training set berisi record yang mempunyai label kelas yang diketahui haruslah tersedia. Training set digunakan untuk membangun model klasifikasi, yang kemudian diaplikasikan ke test set, yang berisi record-record dengan label kelas yang tidak di ketahui. Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam bisnis dan penelitian adalah: a. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan. b. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit yang baik atau buruk. c. Mendiagnosa penyakit seorang pasien untuk mendapatkan kategori apa. Klasifikasi dokumen adalah proses pengelompokan dokumen sesuai dengan kategori yang dimilikinya. Klasifikasi dokumen merupakan masalah yang mendasar namun sangat penting karena manfaatnya cukup besar mengingat jumlah dokumen yang ada setiap hari semakin bertambah. Sebuah dokumen dapat

19 19 dikelompokkan ke dalam kategori tertentu berdasarkan kata-kata dan kalimatkalimat yang ada di dalam dokumen tersebut. Kata atau kalimat yang terdapat di dalam sebuah dokumen memiliki makna tertentu dan dapat digunakan sebagai dasar untuk menentukan kategori dari dokumen tersebut Naïve Bayes Classifier Naïve bayes klasifikasi merupakan metode terbaru yang digunakan untuk memprediksi probabilitas. Algoritma ini memanfaatkan teori probabilitas yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman di masa sebelumnya. Dua kelompok peneliti, satu oleh Pantel dan Lin, dan yang lain oleh Microsoft Research memperkenalkan metode statistik bayesian. Tetapi yang membuat naïve bayesian ini popular adalah pendekatan yang dilakukan oleh Paul Graham. Banyak aplikasi ini menghubungkan antara atribut set dan variabel kelas yang non deterministic. Dengan kata lain, label kelas test record tidak dapat diprediksi dengan peristiwa tertentu meski atribut set identik dengan beberapa contoh training. Situasi ini makin meningkat karena noisy data atau kehadiran factor confouding tertentu yang mempengaruhi klasifikasi tetapi tidak termasuk di dalam analisis. Sebagai contoh, perhatikan tugas memprediksi apakah seseorang beresiko terkena penyakit jantung berdasarkan diet yang dilakukan dan olahraga teratur. Meski mempunyai pola makan sehat dan melakukan olahraga teratur, tetapi masih beresiko terkena penyakit jantung karena faktor faktor lain seperti keturunan, merokok, dan penyalahgunaan alkohol. Untuk menentukan apakah diet sehat dan olahraga teratur yang dilakukan sesorang adalah cukup menjadi subyek

20 20 interpretasi, yang akan memperkenalkan ketidakpastian pada masalah pembelajaran. Algoritma naive bayes classifier merupakan algoritma yang digunakan untuk mencari nilai probabilitas tertinggi untuk mengklasifikasi data uji pada kategori yang paling tepat (Feldman & Sanger 2007). Dalam penelitian ini yang menjadi data uji adalah data tweets. Ada dua tahap pada klasifikaasi data yang pertama pelatihan terhadap dokumen yang sudah diketahui kategorinya. Sedangkan kedua adalah proses klasifikasi dokumen yang belum diketahui kategorinya. Dalam algoritma naïve bayes classifier setiap dokumen direpresentasikan dengan pasangan atribut x 1, x 2, x 3,...x n dimana x 1 adalah kata pertama, x 2 adalah kata kedua dan seterusnya. Sedangkan V adalah himpunan kategori Tweet. Pada saat klasifikasi algoritma akan mencari probabilitas tertinggi dari semua kategori dokumen yang diujikan (V MAP ), dimana persamaannya adalah sebagai berikut: (2.1) Keterangan : V j = Kategori tweet j =1, 2, 3, n. P(x i V j ) = Probabilitas x i pada kategori V j P(V j ) = Probabilitas dari V j

21 21 Naïve bayes classifier memiliki asumsi bahwa hubungan antar atribut adalah saling bebas. Naïve bayes classifier memiliki beberapa keuntungan dan kelemahan yaitu diantaranya : Keuntungan : a. Hasilnya cukup baik untuk sebagian besar kasus dan mudah diimplementasikan. b. Bila asumsi saling bebas terpenuhi, maka tingkat akurasinya sangat tinggi Kelemahan : a. Adanya asumsi saling bebas antar atributnya terkadang akan menurunkan tingkat akurasi. b. Biasanya dalam kehidupan nyata selalu ada hubungan antar atribut sehingga asumsi saling bebas menjadi tidak terpenuhi dan keterkaitan tersebut tidak dapat dimodelkan oleh naïve bayes classifier. c. Perkiraan kemungkinan class yang tidak akurat. d. Batasan atau threshold harus ditentukan secara manual bukan secara analitis 2.6. MongoDB MongoDB adalah salah satu NoSQL yang berorientasi dokumen yang dikembangkan secara kode terbuka (Open Source) oleh 10 gen. Beberapa karakteristik penting dari MongoDB adalah penyimpanan data dalam collections dan masing masing collections memiliki documents yang diserialisasi dengan menggunakan BSON (Binary JSON). Perbandingan antara MongoDB dan SQL Server pernah dilakukan dalam lingkungan sistem pengambilan keputusan dan layanan data secara interaktif yang mengatakan sisi kinerja SQL Server lebih unggul meskipun aspek lainnya NoSQL memiliki keunggulan yang berbeda. [Rahardjo, A.W., Emanuel., Sentosa., J., (2013)].

22 22 MongoDB memiliki perbedaan dengan RDBMS seperti yang ditampilkan pada gambar berikut ini : Gambar 2.3. Perbedaan RDBMS dan MongoDb Tidak seperti database relasional lainnya yang menunjukkan rancangan skema beberapa tabel dan menunjukkan relasi di antaranya, pada MongoDB tidak ada istilah relasi. Keuntungan MongoDB daripada RDBMS ialah : 1. Skema berkurang, MongoDB merupakan database dokumen dimana padasetiap koleksi memiliki dokumen yang berbeda. Field, isi, ukuran dokumen bisa berbeda dari dokumen lainnya. 2. Struktur objek tunggal yang jelas 3. Tidak ada relasi 4. Kemampuan query yang mendalam 5. Mudah untuk digambarkan 6. Konversi/pemetaan dari aplikasi objek ke database objek tidak dibutuhkan

23 23 7. Menggunakan internal memori untuk penyimpanan, mampu mengakses data lebih cepat. MongoDB sangat cocok digunakan untuk Big Data, Content Management and Delivery, Mobile and Social Infrastructure, User Data Management, dan Data Hub. Ada beberapa kekurangan MongoDB diantaranya : 1. MongoDB harus di instal di sebuah server, dan ketika kita menggunakan PHP anda juga harus merestart server anda driver mongodb anda dapat digunakan oleh PHP 2. Belum support di hosting, namun bisa diakali dengan menggunakan MongoHQ (untuk free terdapat limit sampai 16MB) MongoDB hadir dengan beberapa kelebihan yaitu : 1. Performa yang ditawarkan MongoDB lebih cepat dibandingkan MySQL ini disebabkan oleh memcached dan format dokumennya yang berbentuk seperti JSON 2. Replikasi, adalah fitur yang sangat bermanfaat untuk backup data secara realtime. 3. MongoDB sangat cocok digunakan untuk portal berita ataupun blog, namun belum cocok untuk digunakan pada sistem informasi yang berkaitan dengan keuangan karena MongoDB tidak mendukung transaction SQL 4. Auto-sharding, merupakan fitur untuk memecah database yang besar menjadi beberapa bagian demi optimalisasi performa database. Penggunaannya sendiri sangat berguna ketika Anda memiliki website dengan database yang jutaan baris, sharding akan membantu memecahnya menjadi beberapa bagian

24 24 5. MongoDB juga sudah mendukung C, C++, C#, Erlang, Haskell, Java, JavaScript,.NET(C# F#, PowerShell), Lips, Perl, PHP, Python, Ruby dan Scala Cross-platform, sehingga dapat digunakan di Windows, Linux, OS X dan Solaris 6. Proses Create, Read, Update, Delete (CRUD) terasa sangat ringan. 7. Map/Reduce, akan sangat membantu ketika kita melakukan operasi agregasi. Dimana semua entry datangnya dari collection dan outputnya pun akan menjadi collection juga Unified Modeling Language (UML) Definisi Unified Modeling Language (UML) adalah standar bahasa untuk menentukan, memvisualisasikan, membangun, dan mendokumentasikan pengembangan dari sistem perangkat lunak yang berbasis Object Oriented. Pada umumnya UML digunakan untuk pemodelan sistem perangkat lunak namun bisa juga untuk memodelkan sisitem seperti aliran proses di unit manufaktur dll. UML bukanlah bahasa pemrograman tetapi media yang digunakan untuk menghasilkan kode dalam berbagai bahasa menggunakan UML diagram ( 2015). Berikut ini adalah jenis diagram UML menurut Henderi (2010:6) yaitu: 1. Use Case Diagram Use Case Diagram secara grafis menggambarkan, interaksi secara sistem, sistem eksternal dan pengguna. Dengan kata lain use case diagram secara grafis mendeskripsikan siapa yang akan menggunakan sistem dan dalam cara

25 25 apa pengguna (user) mengharapkan interaksi dengan sistem itu. Use case secara naratif digunakan untuk secara tekstual menggambarkan sekuensi langkah-langkah dari tiap interaksi. 2. Class Diagram Menggambarkan struktur object sistem. Diagram ini menunjukan class diagram yang menyusun sistem dan hubungan antara class object tersebut. 3. Sequence Diagram Secara grafis menggambarkan bagaimana object berinteraksi satu sama lain melalui pesan pada sekuensi sebuah use case atau operasi. 4. State Chart Diagram Digunakan untuk memodelkan behaviour objek khusus yang dinamis. Diagram ini mengilustrasikan siklus hidup objek berbagai keadaan yang dapat diasumsikan oleh objek dan event-event (kejadian) yang menyebabkan objek dari satu state ke state yang lain. 5. Activity Diagram Secara grafis untuk menggambarkan rangkaian aliran aktivitas baik proses bisnis maupun use case. Activity Diagram dapat juga digunakan untuk memodelkan action yang akan dilakukan saat operasi dieksekusi, dan memodelkan hasil dari action tersebut Kerangka Pemikiran

26 26 Kerangka Pemikiran pada penelitian ini akan menjelaskan alur alur pikiran yang dirangkum dalam sebuah gambar. Dalam kerangka pemikiran ini menggunakan data twitter yang ditarik dengan menggunakan Search API seperti penelitian sebelumnya. Data tweet kemudian dibersihkan dengan text mining yang didalamnya terjadi preprocessing dan feature selection serta menggunakan metode. Selanjutnya data tweet bersih akan dijadikan data training. Data training berguna sebagai data latih dimana akan diberikan nilai positif, nilai negatif secara manual. Setelah proses training selesai akan diuji dengan menggunakan klasifikasi naïve bayes classifier. Algoritma ini akan memberikan nilai sentimen negatif, sentiment positif atau netral di setiap tweet yang ada. Berikut Kerangka Pemikiran penelitian ini Mulai data tweet (ditarik dengan menggunakan twitter API) Proses text mining (akan dilakukan preprocessing dan feature selection) Algoritma Naive Bayes Classifier mengklasifikasi sentimen Nilai sentimen positif, negative atau netral 2.9. Penelitian Sebelumnya Selesai Gambar 2.4. Kerangka Pemikiran

27 27 Penelitian sebelumnya telah dilakukan oleh [Cahyanti, O.D., Saksono, P.H., Suryayusra, Negara, E.S., (2015)], penulis menggunakan twitter sebagai objek penelitian. Untuk menganalisa data twitter ini diperlukan teknik-teknik khusus untuk menjadikan data yang berupa teks dari twitter menjadi informasi yang selanjutnya dapat dijadikan bahan untuk penelitian. Penulis melakukan penelitian mengenai peristiwa jatuhnya pesawat AirAsia QZ8501 yang terjadi pada tanggal 28 Desember 2014 di selat Karimata, Indonesia. Pada penelitian ini, penulis memperlihatkan dari negara mana saja yang ikut mengamati peristiwa jatuhnya pesawat tersebut berdasarkan bahasa yang digunakan pada saat mengunggah tweets mereka. Penelitian lain dilakukan oleh [SN, Azhari., Hidayatullah, AF., 2014]. Penelitian ini melakukan analisis sentimen dan klasifikasi kategori terhadap tokoh public pada twitter. Metode klasifikasi yang digunakan adalah Support Vector Machine dan Naïve Bayes Classifier. Klasifikasi sentiment terdiri dari positif dan negatif. Penelitian yang dilakukan oleh [Permatasari, D.R. 2014]. Penelitian ini melakukan analisis sentiment nasabah bank X menggunakan pengklasifikasia naïve bayes classifier.penelitian ini mencari tingkat kecocokan naïve bayes classifier dalam mengklasifikasikan kalimat sentiment ke dalam kelas positif dan negative. Hasi dari penelitian ini naïve bayes classifier memberikan nilai error untuk mengklasifikasikan kalimat sentiment ke dalam kelas positif dan kelas negatif sebesar 24,26%. Penelitian yang serupa juga dilakukan oleh [Winarko, Edi., Putranti, ND., Penelitian ini melakukan Analisis Sentimen Twitter untuk teks Berbahasa

28 28 Indonesia dengan Maximum Entropy Support Vector Machine. Dalam penelitian ini data opini diperoleh dari jejaringan sosial twitter berdasarkan query dalam Bahasa Indonesia. Data yang sudah terkumpul dilakukan proses preprocessing dan POS tagger untuk menghasilkan suatu klasifikasi. Hasil dari klasifikasi diperoleh akurasi 86.81%.

29 29 BAB III ANALISA DAN PERANCANGAN 3.1. Analisis Sistem Analisis sistem yang digunakan untuk menyelesaikan masalah pada penelitan ini terdiri dari beberapa langkah langkah yaitu: 1. Analisis masalah 2. Pengumpulan data 3. Proses Text Mining 4. Penerapan metode Klasifikasi naïve Bayes Classifier Analisis Masalah Pengguna twitter yang semakin meningkat ini terlihat dari jutaan tweets yang di posting setiap harinya dengan berbagai topik yang berbeda. Data tweets ini dapat berupa persepsi publik baik ekonomi, perilaku sosial, fenomena alam, perdagangan yang terjadi diseluruh dunia. Data yang besar tersebut bisa dijadikan sebagai objek penelitan, seperti yang telah dilakukan oleh [Cahyanti, O.D., Saksono, P.H., Suryayusra, Negara, E.S., (2015)], dalam penelitiannya twitter sebagai objek penelitan, dengan menggunakan teknik- teknik khusus untuk menjadikan data yang berupa teks dari twitter menjadi informasi. Informasi yang telah didapatkan tersebut juga merefleksikan bagaimana perilaku masyarakat

30 30 terhadap suatu peristiwa yang sedang terjadi pada kehidupan nyata yang dituangkan pada sosial media. Informasi yang terkandung dalam tweets dapat digunakan sebagai nilai jual bagi pelaku usaha. Salah satu contoh perusahaan yang ingin mengetahui nilai jual produknya laku dipasaran atau tidak. Kita sebut saja perusahan yang memproduksi kosmetik seperti lipstick wardah, sabun cuci seperti Rinso. Perusahaan ini akan mencari opini dari pengguna produk tersebut apakah produknya di nilai positif atau negatif. Hal ini dilakukan untuk mengambil langkah strategis agar produknya tetap diminati masyarakat. Penilaian produk pada suatu perusahaan disebut dengan analisis sentimen. analisis sentiment yang ada sekarang dilakukan secara manual. Oleh karena itu untuk mendapatkan nilai sentiment secara otomatis dari suatu produk tersebut memiliki tantangan. Tantangan berupa teks yang tidak formal yang digunakan oleh pengguna twitter dalam mengeluarkan opini. Untuk itu dari penelitian ini menggunakan proses text mining yang di dalamnya terdapat tahapan preprocessing dan Ekstraksi fitur serta naïve bayes classifier sebagai metode klasifikasi nilai sentimen apakah opini bernilai positif atau negatif Pengumpulan Data Pada penelitian ini pengumpulan data dimulai dengan penarikan data tweet dari server twitter yang kemudian disimpan kedalam MongoDB. Penarikan data tweet dilakukan dengan menggunakan fasilitas Application Programming Interface (API). API adalah fasilitas yang telah disediakan oleh twitter. Application Programming Interface (API) ini mengambil data kotor tweet dari server twitter, yang selanjutnya akan dipilih menjadi data tweet bersih. Data tweet

31 31 ini akan disimpan di dalam database MongoDB. Berikut adalah gambar proses pengumpulan data : Penarikan Data tweet dengan API Server twitter Simpan di MongoDB Gambar 3.1. Proses pengumpulan data tweet Data tweet yang dijadikan sebagai data latih atau data training sebanyak 300 tweet. Data ini dijadikan sebagai data latih dimana akan dikategorikan secara manual dengan menilainya ke dalam 3 kategori sentiment yaitu tweet yang bersentimen negative, positif dan netral. Data ini disimpan ke dalam database MongoDB dengan tabel sebagai berikut : Tabel 3.1. tabel tweet training No Token tipe total 1 Enak positif 1 2 Sedap positif 2 3 Kotor negatif 1 4 Pahit negatif 1 5 Bahagia positif Proses Text Mining Pada proses text mining membutuhkan 2 (dua) tahapan yaitu : 1. Preprocessing ini dilakukan untuk menghindari data yang kurang sempurna, gangguan pada data, dan data-data yang tidak konsisten (Hemalatha, dkk, 2012). Tahapan pada text preprocessing yang dilakukan adalah:

32 32 a. Melakukan Cleaning menghilangkan kata yang tidak diperlukan agar dokumen bersih.contohnya: Mandi pakai LUX menambah wangi dan segar loh!! Mandi pakai LUX menambah wangi segar!! b. Case folding dengan mengubah semua huruf dalam dokumen menjadi huruf kecil. Hanya huruf a sampai dengan z yang diterima. Karakter selain huruf dihilangkan dan dianggap delimiter (Triawati, 2009). Contoh pemakaian case folding : Mandi pakai LUX menambah wangi segar!! mandi pakai lux menambah wangi segar c. Tahap tokenizing / parsing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. Contoh Tokenizing : mandi pakai lux menambah wangi segar mandi pakai lux menambah wangi segar d. Filtering Filtering adalah tahap mengambil kata-kata penting dari hasil token. Bisa menggunakan algoritma stoplist (membuang kata yang kurang penting) atau wordlist (menyimpan kata penting). Stoplist/stopword adalah katakata yang tidak deskriptif yang dapat dibuang dalam pendekatan bag-ofwords. Contoh stopwords adalah yang, dan, di, dari, dan seterusnya.( Triawati, 2009). Contoh Filtering : mandi pakai lux menambah wangi segar mandi pakai lux wangi segar

33 33 Berikut flowchart dari tahapan preprocessing: Mulai Tweet kotor Cleaning dan Case Folding Tokenisasi dan filtering Tweet bersih Selesai Gambar 3.2. Flowchart tahapan Preprocessing Berikut contoh hasil dari preprocessing : Input di beranda twitter (tweet kotor) : pakai AllNew CB150R? bikin tambah ganteng dengan Honda Genuine Accessories ya!@welovehonda@astramotor.pic.twitter.com/1z171bwdnv hasil tweet bersih setelah melalui tahapan preprocessing adalah pakai allnew cb150r tambah ganteng Honda genuine accessories

34 34 2. Ekstraksi Fitur Pada penelitian ini ekstraksi fitur menggunakan Term frequency adalah gagasan standar frekuensi dalam corpus based Natural Language Process atau pengolahan bahasa alami. (Yamamoto dan Church, 2001) Metode Klasifikasi Klasifikasi pada penelitian ini menggunakan Naïve Bayes Classifier.Pada tahapan ini akan dilakukan klasifikasi dengan menggunakan algoritma naïve bayes classiefier. Algoritma ini akan menghitung nilai sentimen positif, negatif atau netral. Penggunaan algoritma naïve bayes classifier adalah sebagai berikut : Contoh sentimen positif dengan dokumen pembelajaran(data latih) -> tekwan enak. Tabel 3.2. daftar kata sentiment positif No. Keyword Frekuensi (nk) 1 _t 1 2 Ek 1 3 Kw 1 4 An 1 5 n_ 2 6 _e 1 7 Na 1 8 Ak 1 Dari tabel 3.2. didapat: Jumah Frekuensi keseluruhan sentiment positif (n) = 9 Jumlah kata(kosakata) = 8

35 35 Sehingga dengan nilai tersebut dicari probabilitas dengan naïve bayes sebagai berikut : P(_t positif) = (1+1)/(9+8) = P(n_ positif) = (2+1)(9+8) =0.176 Dari data di atas dapat dilihat probabilitas kata sebagai berikut : Tabel 3.3. probabilitas kata tweet positif No. Keyword Frekuensi (nk) Probabilitas 1 _t Ek Kw An n_ _e Na Ak Berdasarkan nilai probabilitas di atas kita hitung nilai Vmap : =(0.117) (0.117) (0.117) (0.117) (0.176) (0.117) (0.117) (0.117) = E-08 Contoh dokumen sentiment negative -> tekwan gosong Tabel 3.4. daftar kata sentimen negatif No. Keyword Frekuensi (nk) 1 _t 1 2 Ek 1 3 Kw 1

36 36 4 An 1 5 n_ 2 6 _g 1 7 Os 1 8 So 1 9 Ng 1 Dari tabel 3.4. didapat: Jumah Frekuensi keseluruhan sentiment negatif (n) = 10 Jumlah kata(kosakata) = 9 Sehingga dengan nilai tersebut dicari probabilitas dengan naïve bayes sebagai berikut : P(_t positif) = (1+1)/(10+9) = P(n_ positif) = (2+1)(10+9) =0.157 Dari data di atas dapat dilihat probabilitas kata sebagai berikut: Tabel 3.5. Probabilitas tweet negatif No. Keyword Frekuensi (nk) Probabilitas 1 _t ek kw an n_ _g os so ng

37 37 Berdasarkan nilai probabilitas di atas kita hitung nilai Vmap : =(0.105) (0.105) (0.105) (0.105) (0.157) (0.105) (0.105) (0.105) (0.105) =2.3196E-09 Dari hasil perhitungan probabilitas antara sentimen positif dan sentimen negative didapatkan nilai tertinggi adalah kategori sentiment positif Perancangan Sistem Pada analisis sentiment data twitter menggunakan Unified Modeling Language (UML) untuk mendokumentasikan permasalahan dalam beberapa diagram diantarnya sebagai berikut : Diagram Use Case Pada analisis sentimen ini terdiri dari 1 aktor yaitu pengguna twitter. Berikut gambaran diagram use case dari analisis sentiment data twitter : <<uses> pengguna twitter <<include>> Beranda <<include>> <<include>> Hasil sentiment + Tokenizin g <<extend>> Klasifikasi <<extend>> Proses Data text <<extend>> praprose s <<extend>> simpan Gambar 3.3. diagram Use Case

38 38 Gambar di atas menunjukkan alur kerja analisis sentiment penelitian ini dengan penjelasan sebagai berikut : Halaman Utama : merupakan proses untuk masuk ke tahapan selanjutnya. Tokenizing : merupakan proses yang terdiri dari praproses yang didalamnya ada cleaning dan case folding untuk membersihkan data tweet. Data tweet bersih akan dikategorikan secara manual sebagai data latih yang selanjutnya disimpan di MongoDb. Klasifikasi : merupakan proses pengklasifikasian twitter dengan data tweet yang belum diketahui kategorinya dimana proses ini melewati tahapan preprocessing dan proses naïve bayes classifier sehingga menghasilkan kategori sentimen positif, negatif ataupun netral Spesifikasi Use Case Pada spesifikasi ini menjelaskan setiap use case yang ada di diagram use case pada gambar 3.3. terdiri dari 3 bagian yang dituangkan dalam tabel 3.2. berikut ini : Tabel 3.6. Spesifikasi Use Case Tipe 1 Use Case Beranda Uraian Skenario Pengguna twitter 1.Pengguna menbuka beranda 2. pengguna masuk ke pilihan selanjutnya

39 39 2 Use Case Tokenizing penjelasan aktor Tahapan 3 proses yang terdiri dari praproses yang didalamnya ada cleaning dan case folding untuk membersihkan data tweet. Data tweet bersih akan dikategorikan secara manual sebagai data latih yang selanjutnya disimpan di MongoDb. Pengguna twitter 1. Pengguna berada di halaman beranda 2. Pengguna memilih form tokenizing 3. Pengguna memilih file.txt untuk dijadikan data latih 4. Pengguna menentukan kategori positif atau negative 5. Pengguna melakukan praproses dimana didalamnya terdapat proses cleaning, case folding, filtering 6. Sistem akan menampilkan hasil praproces dalam bentuk tabel yang menjelaskan isi atau jumlah data yang di token. 7. Hasil praproses akan disimpan ke database Mongo Use Case Klasifikasi Penjelasan proses pengklasifikasian twitter dengan data tweet yang belum diketahui kategorinya dimana proses ini melewati tahapan preprocessing dan proses naïve bayes classifier sehingga menghasilkan

40 40 Tahapan kategori sentimen positif, negatif ataupun netral. 1. Pengguna berada di halaman beranda 2. Pengguna memilih form klasifikasi 3. Pengguna memasukkan trend produk yang akan diklasifikasi 4. Pengguna memasukkan jumlah tweet yang akan diklasifikasi 5. System akan mencari tweet sesuai dengan trend dan jumlah yang dicari 6. System menampilkan tweet yang dicari 7. Pengguna mengklik tombol analis 8. System akan menampilkan hasil dari proses analis dan menyimpannya Diagram Aktifitas Diagram ini berguna untuk menggambarkan alur dari aktifitas system yang sedang berjalan. Berikut diagram aktifitas yang terdiri dari 3 bagian yaitu : 1. Diagram Aktifitas Beranda Diagram ini menunjukkan alur User masuk ke dalam sistem yang dibuat User Sistem Membuka beranda Menerima permintaan buka Menerima tampilan menu pilihan Menampilkan menu pilihan Gambar 3.4. Diagram aktifitas Beranda

41 41 2. Diagram Aktifitas Tokenizing User Sistem Memilih menu tokenizing Menerima requets form tokenizing Menyisipkan file. txt dan memilih kategori positif atau negatif Menampilkan form tokenizing Menekan tombol praproses Menerima request praproses Menerima tampilan hasil praproses Melakukan praproses Gambar 3.5. Diagram aktifitas Tokenizing

42 42 3. Diagram AktifitasKlasifikasi User Sistem Memilih menu klasifikasi Menerima request form klasifikasi Masukkan trend dan jumlah Menampilkan form klasifikasi Menekan tombol cari trend Menerima request cari trend Menerima tampilan hasil pencarian Melakukan proses pencarian Menekan tombol analisa Menerima proses analisa Melakukan proses analisa naïve bayes Menerima hasil analisa Menampilkan hasil analisa Gambar 3.6. Diagram aktifitas Klasifikasi

43 Rancangan Antarmuka Perancangan antarmuka dalam analisis sentimen ini terbagi menjadi 3 tampilan yaitu: 1. Rancangan Halaman Utama Form Tokenizing Form Klasifikasi 2. Rancangan Halaman Tokenizing Gambar 3.7. Rancangan halaman utama Browse Positif Negatif Clearing Folding Tokenizing Statistic Token Positif Token Negatif total token praproses simpan tutup Gambar 3.8. Rancangan halaman Tokenizin

44 44 3. Rancangan Halaman Analisis Klasifikasi Twits Kata Kunci Trend Jumlah : Cari Trend Hasil analisa save Close Gambar 3.9. Rancangan halaman Klasifikasi

45 45 BAB IV HASIL DAN PEMBAHASAN 4.1. Hasil Implementasi sistem Setelah dilakukan analisa dan perancangan sistem maka akan dilakukan implementasi sistem analisa sentiment data twitter dengan menggunakan text mining pada suatu produk. Adapun spesifikasi perangkat keras dan lunak yang digunakan untuk mendukung penelitian ini adalah sebagai berikut : 1. Satu unit laptop dengan spesifikasi sebagai berikut : Prosesor Core i5 3337U 1.8 GHz, 14 HD Color Shine RAM 4 GB DDR3, Harddisk 500 GB VGA Nvidia Geforce GT720M 2 GB DVDRW, Wi-Fi OS Windows 7 2. Software yang di gunakan adalah sebagai berikut : NetBeans IDE 7.4 Mongo DB Java.

46 46 Seteleh Aplikasi dijalankan akan tampil Halaman beranda yang berisi menu pilihan untuk masuk ke form tokenizing dan form klasifikasi. Berikut gambar 4.1. neunjukkan tampilan halaman beranda. Gambar 4.1 Tampilan Halaman Utama Gambar 4.2. menunjukkan tampilan form tokenizing. Form ini berfungsi untuk mencari token dari setiap kalimat yang dimasukkan melalui file.txt. nilai token yang dihasilkan bernilai positif dan negative. Data token ini merupakan data latih untuk pembanding sebelum di analisa menggunakan naïve bayes classifier. Sehingga tampilan form tokenizing adalah sebagai berikut :

47 47 Gambar 4.2. Tampilan Form Tokenizing Selain form tokenizing pada sistem ini terdapat form klasifikasi. Form klasiifikasi berfungsi untuk mencari nilai kategori sentiment positif, sentiment negatif atau sentiment netral secara otomatis dengan menggunakan naïve bayes classifier. Form klasifikasi dapat dilihat pada gambar 4.3. sebagai berikut : Gambar 4.3. Tampilan Form Klasifikasi

48 Pengujian Pada tahap pngujian sistem akan mencari nilai klasifikasi terhadap data tweet secara otomatis. Nilai yang diperoleh berupa sentimen positif, sentiment negative atau netral pada setiap tweet yang ditampilkan. Pengujian ini menggunakan form klasifikasi dengan cara memasukkan trend dan jumlah data yang akan di analisa. Sebagai sampel data uji akan menggunakan produk makanan yaitu : tekwan dengan jumlah 100 tweet. Berikut tampilan hasil cari trend mengenai tekwan sebelum dianalisa pada gambar 4.4 : Gambar 4.4. Tampilan hasil mencari tweet Setelah dapat 100 tweet kita klik tombol analisa untuk mencari nilai dari setiap tweet dengan tampilan hasil sebagai berikut :

49 49 Gambar 4.5. Tampilan hasil klasifikasi tweet Pengujian lain juga bisa dilakukan dengan data latih lainnya, di sini kita mengambil contoh lagi untuk 200 data tentang produk rinso yang akan diklasifikasi dengan hasil sebagai berikut : Gambar 4.6. Tampilan hasil mencari tweet Rinso

50 50 Gambar 4.7. Tampilan hasil klasifikasi tweet Rinso 4.2. Pembahasan Berdasarkan hasil uji yang telah dilakukan didapatkan jumlah data yang terdiri dari 100 tweet tekwan didapatkan nilai dengan kategori sentimen positif sebanyak 35 sentimen negatif 0 sentimen netral 75. Hasil Uji untuk 200 data tweet dengan nama produk rinso didapatlan nilai tweet netral berjumlah 25 sentimen negative berjumlah 75 dan sentimen positif berjumlah 100.

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kehadiran teknologi web yang interaktif telah merubah cara orang mengekspresikan pandangan dan opininya. Saat ini pengguna dapat menulis ulasan suatu produk pada situs

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Text Mining Text mining dapat diartikan sebagai penemuan informasi yang baru dan tidak diketahui sebelumnya oleh komputer, dengan secara otomatis mengekstrak informasi dari sumber-sumber

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang website adalah salah satu layanan yang bisa digunakan untuk melakukan pencarian berbagai informasi, sehingga sangat dibutuhkan untuk keperluan pengguna dalam pencarian

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Manajemen Proyek 2.1.1. Pengertian Manajemen Menurut James A.F. Stoner (2006) Manajemen adalah suatu proses perencanaan, pengorganisasian, kepemimpinan, dan pengendalian upaya

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Liu opini merupakan pernyataan subyektif yang mencerminkan sentimen orang atau persepsi tentang entitas dan peristiwa [1]. Opini atau pendapat orang lain terhadap

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN 26 BAB III ANALISIS DAN PERANCANGAN Analisis dan perancangan berfungsi untuk mempermudah, memahami dan menyusun perancangan pada bab selanjutnya, selain itu juga berfungsi untuk memberikan gambaran dan

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Sumber opini teks saat ini tersedia berlimpah di internet akan tetapi belum sepenuhnya dimanfaatkan karena masih kurangnya tool yang ada, sedangkan perkembangan

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1. 1.1 Latar Belakang Perkembangan dunia telekomunikasi meningkat secara signifikan dalam kurun waktu satu dekade terahir. Tidak hanya dari segi jumlah pengguna, jenis layanan yang ditawarkanpun

Lebih terperinci

JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER

JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER Oleh: AGUNG PRAMONO PUTRO 12.1.03.03.0276 Dibimbing oleh : 1. NURSALIM, S.Pd,. MH 2. ARIE NUGROHO, S.Kom.,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Situs jejaring sosial merupakan gaya hidup sosial baru yang muncul seiring berkembangnya internet. Gaya hidup baru tersebut memiliki ruang lingkup yang lebih luas

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER

SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER Agung Pramono 1, Rini Indriati 2, Arie Nugroho 3, 1,2,3 Sistem Informasi, Fakultas Teknik, Universitas Nusantara PGRI Kediri E-mail: 1 pramonoagung0741@gmail.com,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Setiap matakuliah memiliki silabus perkuliahan yang berisi materi-materi mengenai matakuliah tersebut. Silabus disusun berdasarkan buku-buku referensi utama

Lebih terperinci

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter, BAB I PENDAHULUAN 1.1. Latar Belakang Popularitas media jejaring sosial terus mengalami peningkatan dalam beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter, Facebook,

Lebih terperinci

BAB IV ANALISIS, PERANCANGAN, DAN IMPLEMENTASI PERANGKAT LUNAK

BAB IV ANALISIS, PERANCANGAN, DAN IMPLEMENTASI PERANGKAT LUNAK BAB IV ANALISIS, PERANCANGAN, DAN IMPLEMENTASI PERANGKAT LUNAK Pada bab ini akan dibahas berbagai hal yang terkait analisis dan perancangan perangkat lunak web mining yang diusulkan sebagai solusi permasalahan.

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Text mining Menurut Feldman dan Sanger (Feldman dan Sanger, 2007), text mining dapat didefinisikan secara luas sebagai proses pengetahuan intensif yang memungkinkan pengguna berinteraksi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1. Sistem Informasi Sistem informasi adalah sekumpulan elemen yang saling bekerja sama baik secara manual atau berbasis komputer yang didalamnya ada pengumpulan, pengolahan, pemprosesan

Lebih terperinci

3.1 Desain Penelitian

3.1 Desain Penelitian 24 BAB 3 METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian merupakan tahapan yang akan dilakukan penulis dalam melakukan penelitian. Tahapan penelitian yang digunakan

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang 3 BAB I PENDAHULUAN 1.1. Latar Belakang Semakin banyaknya pengunaan teknologi informasi pada pemerintahan, dapat mempermudah masyarakat dalam pelayanan masyarakat itu sendiri. Seperti misalnya ketika sesorang

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait Penelitian terkait dengan topik analisis sentimen cukup banyak, berikut beberapa penelitian yang tekait dengan analisa sentimen yang menggunakan seleksi

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

Aplikasi Opinion Mining dengan Algoritma Naïve Bayes untuk Menilai Berita Online

Aplikasi Opinion Mining dengan Algoritma Naïve Bayes untuk Menilai Berita Online Jurnal Integrasi, vol. 6, no. 1, 2014, 1-10 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Aplikasi Opinion Mining dengan Algoritma Naïve Bayes untuk Menilai

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB III ANALISIS DAN PERANCANGAN SISTEM BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1. Analisis Sistem Analisis sistem bertujuan untuk mengidentifikasi permasalahanpermasalahan yang ada pada sistem yang meliputi perangkat lunak (software), pengguna

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 49 RANCANG BANGUN APLIKASI CHATBOT INFORMASI OBJEK WISATA KOTA BANDUNG DENGAN PENDEKATAN NATURAL LANGUAGE PROCESSING Elisabet Nila S. C. P 1, Irawan Afrianto 2 1,2 Program Studi Teknik Informatika Fakultas

Lebih terperinci

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang 1 BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang Intelligent agent, sebagai bagian dari kecerdasan buatan yang dapat diterapkan pada sistem dalam menyelesaikan sebuah permasalahan. Agen yang diterapkan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Human Resource Management merupakan prosedur sistematis untuk mengumpulkan, menyimpan, mempertahankan, menarik dan memvalidasi data yang di butuhkan oleh suatu organisasi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN. 1.1 Latar belakang BAB I PENDAHULUAN 1.1 Latar belakang Dalam beberapa tahun terakhir teknologi informasi dan telekomunikasi berkembang dengan pesat. Masyarakat mendapatkan manfaat dari tekonologi informasi dan telekomunikasi

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Gambar 3.1 merupakan desain penelitian yang akan digunakan dalam

BAB III METODOLOGI PENELITIAN. Gambar 3.1 merupakan desain penelitian yang akan digunakan dalam BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Gambar 3.1 merupakan desain penelitian yang akan digunakan dalam proses penelitian penerapan algoritma K-Means pada clustering berita berbahasa Indonesia.

Lebih terperinci

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES Nama : Muhammad Rizki NPM : 54410806 Jurusan Pembimbing

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan

Lebih terperinci

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES 1 BAB I PENDAHULUAN Dalam bab ini akan dibahas latar belakang dilaksanakannya penelitian, identifikasi masalah, batasan masalah, tujuan penelitian, manfaat penelitian, dan sistematika penulisan. Latar

Lebih terperinci

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

Jurnal Informatika Mulawarman Vol. 10 No. 1 Februari

Jurnal Informatika Mulawarman Vol. 10 No. 1 Februari Jurnal Informatika Mulawarman Vol. 10 No. 1 Februari 2015 1 KLASIFIKASI DAN PENCARIAN BUKU REFERENSI AKADEMIK MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (NBC) (STUDI KASUS: PERPUSTAKAAN DAERAH PROVINSI

Lebih terperinci

BAB I PENDAHULUAN.

BAB I PENDAHULUAN. BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini smartphone telah berevolusi menjadi komputer pribadi kecil dan portabel yang memungkinkan pengguna untuk melakukan penjelajahan internet, mengirim e-mail

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM. Pada bab ini akan dibahas mengenai analisa dan perancangan dari sistem.

BAB III ANALISA DAN PERANCANGAN SISTEM. Pada bab ini akan dibahas mengenai analisa dan perancangan dari sistem. 17 BAB III ANALISA DAN PERANCANGAN SISTEM Pada bab ini akan dibahas mengenai analisa dan perancangan dari sistem. Analisa system dilakukan untuk menemukan solusi dari permasalahan yang telah diajukan sebelumnya.

Lebih terperinci

BAB IV PERANCANGAN SISTEM 4.1 PERANCANGAN SISTEM Untuk memudahkan pembuatan aplikasi sistem pakar berbasis website, maka akan dibuat model menggunakan UML (Unified Modeling Language). Perlu diketahui metode

Lebih terperinci

PENDAHULUAN. I.1 Latar Belakang

PENDAHULUAN. I.1 Latar Belakang I PENDAHULUAN I.1 Latar Belakang Internet sebagai jaringan komputer skala global telah mendorong pertambahan jumlah informasi digital. Pada sistem yang bersifat terbuka seperti internet, pertambahan informasi

Lebih terperinci

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB IV IMPLEMENTASI DAN PENGUJIAN 90 BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Sistem Tahap ini merupakan tahap dari implementasi program serta implementasi dari setiap proses tahap penelitian. 4.1.2 Persiapan Arsitektur Pada

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN BAB III ANALISIS DAN PERANCANGAN Pada bab ini akan menjelaskan analisis dan perancangan sistem dari aplikasi translator bahasa Indonesia Sunda, Sunda Indonesia berbasis mobile dengan menggunakan metode

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Apa yang orang lain pikirkan telah menjadi sesuatu yang penting untuk menjadi pertimbangan dalam pengambilan keputusan (Pang and Lee, 2006). Sesuatu yang orang lain

Lebih terperinci

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam.

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam. BAB I PENDAHULUAN 1.1 Latar Belakang Setiap warga muslim di dunia membutuhkan informasi makanan halal, agar mereka terhindar dari yang namanya perbuatan dosa. Karena di dalam agama islam, sebagai umat

Lebih terperinci

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :

Lebih terperinci

APLIKASI SISTEM INFORMASI PENGOLAHAN DATA PADA DIREKTORAT RESERSE KRIMINAL KHUSUS POLDA SUMBAR

APLIKASI SISTEM INFORMASI PENGOLAHAN DATA PADA DIREKTORAT RESERSE KRIMINAL KHUSUS POLDA SUMBAR APLIKASI SISTEM INFORMASI PENGOLAHAN DATA PADA DIREKTORAT RESERSE KRIMINAL KHUSUS POLDA SUMBAR Janero Kennedy 1) 1) Magister Teknik Informatika, STMIK AMIKOM, Kota Yogyakarta. Jl Ring road Utara, Condongcatur,

Lebih terperinci

BAB II LANDASAN TEORI Konsep Dasar Membangun Aplikasi Berbasis Web

BAB II LANDASAN TEORI Konsep Dasar Membangun Aplikasi Berbasis Web BAB II LANDASAN TEORI 2.1. Konsep Dasar Membangun Aplikasi Berbasis Web Aplikasi berbasis web adalah aplikasi yang dijalankan melalui browser dan diakses melalui jaringan komputer. Aplikasi berbasis web

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen

Lebih terperinci

SISTEM PEMANTAUAN DISTRIBUSI PEMBAYARAN PARKIR MELALUI INTERNET

SISTEM PEMANTAUAN DISTRIBUSI PEMBAYARAN PARKIR MELALUI INTERNET SISTEM PEMANTAUAN DISTRIBUSI PEMBAYARAN PARKIR MELALUI INTERNET Kartika Megasari Jurusan Sistem Informasi Fakultas Ilmu Komputer Universitas Gunadarma kartika87ms@gmail.com 29 September 2009 ABSTRAKSI

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1. Desain Penelitian Desain penelitian merupakan tahapan atau gambaran yang akan dilakukan dalam melakukan penelitian. Tahapan-tahapan yang dilakukan dalam penelitian ini

Lebih terperinci

ABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA

ABSTRAK. Kata Kunci: analisis sentimen, pre-processing, mutual information, dan Naïve Bayes. UNIVERSITAS KRISTEN MARANATHA ABSTRAK Twitter merupakan sebuah aplikasi social networking yang memungkinkan usernya untuk dapat mengirimkan pesan pada waktu yang bersamaan. Data yang diambil melalui Twitter dapat dijadikan sebagai

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan media online mendorong munculnya informasi tekstual yang tidak terbatas, sehingga muncul kebutuhan penyajian tanpa mengurangi nilai dari informasi tersebut.

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian ini ada beberapa tahapan penelitian yang akan dilakukan seperti terlihat pada gambar 3.1 berikut : Mulai Identifikasi Masalah Pengumpulan Data Analisa Aplikasi

Lebih terperinci

BAB IV ANALISIS DAN PERANCANGAN SISTEM

BAB IV ANALISIS DAN PERANCANGAN SISTEM BAB IV ANALISIS DAN PERANCANGAN SISTEM 4.1 Analisis Yang Berjalan Sebelum merancang suatu sistem, ada baiknya terlebih dahulu menganalisis sistem yang sedang berjalan di Distro yang akan dibangun tersebut.

Lebih terperinci

DAFTAR ISI. KATA PENGANTAR... i. DAFTAR ISI... iii. DAFTAR GAMBAR... viii. DAFTAR TABEL... xii. DAFTAR LAMPIRAN... xiii

DAFTAR ISI. KATA PENGANTAR... i. DAFTAR ISI... iii. DAFTAR GAMBAR... viii. DAFTAR TABEL... xii. DAFTAR LAMPIRAN... xiii DAFTAR ISI KATA PENGANTAR... i DAFTAR ISI... iii DAFTAR GAMBAR... viii DAFTAR TABEL... xii DAFTAR LAMPIRAN... xiii BAB I PENDAHULUAN 1.1. Latar Belakang Masalah... 1 1.2 Rumusan Masalah... 3 1.3 Tujuan...

Lebih terperinci

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA Tugas Akhir Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Situs belanja online sering disebut juga dengan situs e-commerce yaitu suatu proses membeli dan menjual produk-produk secara elektronik oleh konsumen dan dari perusahaan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Twitter Twiter adalah sebuah layanan media sosial yang memungkinkan penggunanya untuk menulis maksimal 140 karakter, yang dikenal sebagai Tweet. Twitter didirikan oleh Jack Dorsey

Lebih terperinci

BAB 4 IMPLEMENTASI DAN EVALUASI. Menggunakan server dengan spesifikasi sebagai berikut : - Processor 1.2 GHz 2007 Opteron or 2007 Xeon processor

BAB 4 IMPLEMENTASI DAN EVALUASI. Menggunakan server dengan spesifikasi sebagai berikut : - Processor 1.2 GHz 2007 Opteron or 2007 Xeon processor BAB 4 IMPLEMENTASI DAN EVALUASI 4.1 Spesifikasi Sistem Menggunakan server dengan spesifikasi sebagai berikut : - Processor 1.2 GHz 2007 Opteron or 2007 Xeon processor - Memory 512MB DDR - Harddisk 5GB

Lebih terperinci

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak TEKNIK DATA MINING MENGGUNAKAN METODE BAYES CLASSIFIER UNTUK OPTIMALISASI PENCARIAN PADA APLIKASI PERPUSTAKAAN (STUDI KASUS : PERPUSTAKAAN UNIVERSITAS PASUNDAN BANDUNG) Oleh : Selvia Lorena Br Ginting,

Lebih terperinci

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan 1 BAB I PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan media sosial menawarkan pengguna kesempatan untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan tidak lagi memiliki

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

BAB I PENDAHULUAN. memproduksi kapas seperti kapas kecantikan dengan merek Selection Cotton.

BAB I PENDAHULUAN. memproduksi kapas seperti kapas kecantikan dengan merek Selection Cotton. BAB I PENDAHULUAN I.1. Latar Belakang Sistem Informasi Geografis adalah sistem informasi khusus yang mengelola data yang memiliki informasi spasial (bereferensi keruangan). Atau dalam arti yang lebih sempit,

Lebih terperinci

BAB I PENDAHULUAN. sebagai sumber pertama dan utama yang banyak memuat ajaran-ajaran yang

BAB I PENDAHULUAN. sebagai sumber pertama dan utama yang banyak memuat ajaran-ajaran yang BAB I PENDAHULUAN 1.1 Latar Belakang Al-qur an dan hadits sebagai sumber pedoman hidup, sumber hukum dan ajaran dalam islam antara satu dengan yang lain tidak dapat dipisahkan. Al qur an sebagai sumber

Lebih terperinci

IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET

IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang

Lebih terperinci

BAB I PENDAHULUAN. pengembangan pendidikan di bumi nusantara ini adalah sekolah baik sekolah

BAB I PENDAHULUAN. pengembangan pendidikan di bumi nusantara ini adalah sekolah baik sekolah BAB I PENDAHULUAN I.1. Latar Belakang Pada saat ini kebutuhan akan informasi yang cepat sangatlah penting, terutama dengan perkembangan teknologi informasi pada segala bidang maka penggunaan teknologi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah BAB I PENDAHULUAN Pada bagian ini akan dijelaskan tentang pendahuluan dalam penyusunan Laporan Penelitian. Pendahuluan meliputi latar belakang masalah, rumusan masalah, tujuan penelitian, batasan masalah,

Lebih terperinci

BAB III ANALISIS DAN DESAIN SISTEM

BAB III ANALISIS DAN DESAIN SISTEM BAB III ANALISIS DAN DESAIN SISTEM III.1. Analisis Masalah Kebutuhan akan teori dalam dunia pendidikan sangat besar. Teori banyak di tulis ke dalam sebuah buku maupun jurnal. Pada universitas potensi utama,

Lebih terperinci

Unified Modelling Language (UML)

Unified Modelling Language (UML) Unified Modelling Language (UML) Tatik yuniati Abstrak Unified Modelling Language (UML) adalah sebuah bahasa yg telah menjadi standar dalam industri untuk visualisasi, merancang dan mendokumentasikan sistem

Lebih terperinci

BAB III METODE PENELITIAN. Pendekatan metode pengembangan sistem yang digunakan peneliti merupakan

BAB III METODE PENELITIAN. Pendekatan metode pengembangan sistem yang digunakan peneliti merupakan BAB III METODE PENELITIAN 3.1. Metode Pengembangan Sistem Pendekatan metode pengembangan sistem yang digunakan peneliti merupakan salah satu dari agile methods yaitu extreme Programming (XP). Dalam metode

Lebih terperinci

BAB I PENDAHULUAN. informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentimen

BAB I PENDAHULUAN. informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentimen BAB I PENDAHULUAN I.1. Latar Belakang Analisis sentimen terhadap layanan merupakan proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang terkandung

Lebih terperinci

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini, microblogging menjadi sangat popular untuk alat komunikasi antara pengguna internet. Setiap hari jutaan pesan muncul di website penyedia microblogging diantaranya

Lebih terperinci

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Alat dan Bahan 3.1.1 Alat Dalam penelitian ini, alat yang di gunakan adalah sebagai berikut: 1. Perangkat Keras (Hardware) a) Personal Computer (PC)/Laptop 32/64 bit architecture

Lebih terperinci

ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( )

ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. ( ) ANALISIS SENTIMEN TERHADAP OPINI PUBLIK MELALUI JEJARING SOSIAL TWITTER MENGGUNAKAN METODE NAIVE BAYES Alfarizy M. G. (0927050) Jurusan Sistem Komputer, Fakultas Teknik, Jalan Prof. Drg. Suria Sumantri

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Berkembangnya teknologi telah membuat banyak informasi bermunculan. Informasi-informasi tersebut tertuang dalam bentuk dokumen terutama dokumen digital. Semakin

Lebih terperinci

BAB 3. METODOLOGI PENELITIAN

BAB 3. METODOLOGI PENELITIAN BAB 3. METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian Pada penelitian ini menggunakan alat penelitian berupa perangkat keras dan perangkat lunak, yaitu : 1. Perangkat keras a. Processor Intel Core

Lebih terperinci

BAB IV ANALISIS DAN PERANCANGAN SISTEM. permasalahan dari suatu sistem informasi. Hasil akhir dari analisis sistem

BAB IV ANALISIS DAN PERANCANGAN SISTEM. permasalahan dari suatu sistem informasi. Hasil akhir dari analisis sistem BAB IV ANALISIS DAN PERANCANGAN SISTEM 4.1. Analisis yang Berjalan Analisis sistem merupakan proses memilah-milah suatu permasalahan menjadi elemen-elemen yang lebih kecil untuk dipelajari guna mempermudah

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Berikut merupakan desain penelitian yang akan digunakan pada proses penelitian penerapan Hidden Markov Models : 40 Studi Literatur dan Kepustakaan Rumusan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Bab Tinjauan Pustaka memuat uraian gambaran umum dan fungsi-fungsi pada perpustakaan, pengertian sistem informasi, dan kaitan antara perpustakaan dan sistem informasi. 2.1. Perpustakaan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Selain sebagai media komunikasi, Twitter memberikan akses bagi pihak ketiga yang ingin mengembangkan aplikasi yang memanfaatkan layanannya melalui Twitter API. Salah

Lebih terperinci

Bab 3 Metoda dan Perancangan Sistem

Bab 3 Metoda dan Perancangan Sistem Bab 3 Metoda dan Perancangan Sistem Pada bab ini akan dibahas mengenai metode perancangan yang digunakan dalam membuat perancangan sistem aplikasi pendeteksian kata beserta rancangan design interface yang

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Teori Umum 1.1.1 Aplikasi SMS Lokal Komputer Aplikasi SMS Lokal Komputer digunakan untuk pengiriman SMS ke pelanggan dengan menggunakan PC yang disambungkan dengan Handphone agar

Lebih terperinci

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan BAB I PENDAHULUAN 1.1 Latar Belakang Social media merupakan salah satu tren yang berkembang di masyarakat sebagai tempat untuk berinteraksi. Selain untuk berinteraksi dengan lingkungan sosialnya pengguna

Lebih terperinci