BAB 2 TINJAUAN PUSTAKA

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB 2 TINJAUAN PUSTAKA"

Transkripsi

1 BAB 2 TINJAUAN PUSTAKA 2.1 Penelitian Terkait Pada bagian ini akan dipaparkan beberapa penelitian dengan domain yang sama, yakni terkait dengan analisis sentimen terhadap pelayanan perusahaan ataupun analisis sentimen terhadap suatu kejadian. Penulis memilih penelitian yang telah dipublikasi maksimal 5 tahun yang lalu, melalui sejumlah jurnal atau prosedur nasional maupun internasional. Dari paparan yang diberikan, sejumlah pengetahuan disimpulkan untuk dijadikan sebagai pijakan atau penguatan pada penelitian yang peneliti lakukan Analisis Sentimen pada Jasa Ojek Online Menggunakan Metode Naive Bayes[10] Didik, Yulison, dan Agung melakukan penelitian analisis sentimen mengenai layanan pada jasa ojek online untuk mengklasifikasikan opini masyarakat yang bersifat positif, negatif ataupun netral. Pada penelitian ini dilakukan pengujian dengan menggunakan 800 tweet yang dibagi menjadi 300 data latih dan 500 data uji, kemudian dari 300 data latih dibagi pada setiap klasifikasinya 100 data latih positif, 100 data latih negatif, dan 100 data latih netral. Data latih untuk kelas sentimen positif antara lain promo, gratis, nyaman, thanks dan baik. Kemudian data latih untuk kelas sentimen negatif yaitu jarang, rugi dan kecewa. Sedangkan data latih untuk kelas sentimen netral yaitu driver, gojek, orderan, dan gojekindonesia. Pada proses ini mengunakan preprocessing case folding, tokenizing, stemming, dan filtering. Hasil dari preprocessing tersebut diklasifikasi menggunakan algoritma Naive Bayes yang nantinya akan muncul hasil klasifikasi sentimen positif, netral dan negatif. Menggunakan algoritma Naïve Bayes mampu menghasilkan tingkat akurasi mencapai 80%, namun dalam penelitian ini 8

2 9 diungkapkan bahwa sering terjadi kesalahan pada data fitur yang muncul tidak sesuai dengan klasifikasinya Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine[11] Anita, Mira dan Veronikha melakukan analisis sentimen mengenai pelayanan transportasi umum di dalam kota. Penelitian ini untuk mengklasifikasikan opini positif atau negatif dari masyarakat melalui twitter untuk mengetahui penilaian terhadap pelayanan transportasi umum yang berada didalam kota. Dataset menggunakan opini berbahasa indonesia, memilih sebagai sampel transportasi umum antara lain angkot, kopaja, metromini dan transjakarta. Pada proses ini dataset dilakukan preprocessing kemudian apabila ditemukan data uji maka diproses dengan POS Tagging, kemudian ekstraksi opini yang nantinya akan menghasilkan hasil klasifikasi dari opini tersebut. Apablia data latih yang ditemukan maka data latih tersebut diproses terlebih dahulu dengan menggunakan stopword removal, pembobotan, klasifikasi menggunakan algoritma SVM, kemudian ditemukan hasil klasifikasi dan kesimpulan proses. Menggunakan algoritma Support Vector Machine menghasilkan tingkat akurasi yang lebih tinggi dibandingkan dengan metode lain yaitu mencapai 78,12% dan berhasil mengklasifikasikan dokumen dengan baik, namun sangat dipengaruhi oleh data training, data testing, jumlah data set, jumlah data positif dan jumlah data negatif Sentiment Analysis Pada Review Barang Berbahasa Indonesia Dengan Metode K-Nearest Neighbor (K-NN)[13] Yugo, Mardji, dan Lailil melakukan penelitian analisis sentimen terhadap produk kosmetik untuk mengklasifikasikan opini positifatau negatif dari masyarakat tentang produk pada penelitian ini. Proses yang digunakan pada penelitian ini yaitu pada dataset di lakukan preprocessing antaralain cleansing, case folding, tokenizing, stopwords removal, kemudian stemming. Dari hasil tersebut dilakukan proses pembobotan yang nantinya akan di evaluasi dan validasi nilai sentimen

3 10 yang ada. Pada penelitian ini mengatakan bahwa tingkat akurasi dengan menggunakan algoritma K-NN jauh lebih baik dibandingkan dengan NaïveBayes, akan tetapi penulis menggunakan data berupa emotikon yang seharusnya dihilangkan dalam proses filtering. Penambahan emotikon mengakibatkan meningkatnya noisy data, namun metode K-NN terbukti lebih baik untuk mengatasi noisy data Penerapan Algoritma K-Nearest Neighbor untuk Penentuan Resiko Kredit Kepemilikan Kendaraan Bemotor[12] Henny melakukan penelitian suatu perusahaan dengan mengklasifikasi kelayakan pemberian kredit khususnya pada kredit kepemilikan kendaraan bermotor. Pada penelitian ini penulis menggunakan 558 data transaksi kredit bermasalah dan tidak bermasalah, dengan menentukan atribut diantaranya status perkawinan, jumlah tanggungan, pendidikan terakhir, usia, kepemilikan rumah, lama tinggal, kondisi rumah, jenis pekerjaan, status perusahaan, penghasilan perbulan, pembayaran pertama dan masa kerja. Melalui tahap pemilihan data uji kemudian dilakukan preprocessing, setelah itu pengujian menggunakan algoritma KNN dan analisa data uji. Menggunakan algoritma K-NN menunjukkan bahwa metode yang digunakan menghasilkan tingkat akurasi mencapai 81,46%. Pada penelitian ini mengatakan bahwa untuk mengukur kinerja algoritma K-NN digunakan metode Cross Validation,Confusion Matrix dan Kurva ROC Analisis Sentimen Terhadap Telkom IndiHome Berdasarkan Opini Publik menggunakan Metode K-Nearest Neighbor[9] Herdiawan melakukan analisis sentimen tehadap produk layanan atau service pada perusahaan Telkom IndiHome guna mengetahui bagaimana respon customer terhadap produk Indihome. Analisis sentimen yang dilakukan Herdiawan pada perusahaan Telkom IndiHome ini menggunakan metode K-Nearest Neighbor untuk melakukan mengklasifikasikan opini positif dan negatif pada customer Telkom IndiHome. Pada penelitian ini dilakukan preprocessing convert negation, cleansing, case folding, convert negation, tokenizing, filtering, stemming. Setelah

4 11 melalui tahap preprocessing selanjutnya proses pembobotan menggunakan TF- IDF. Hasil dari pembobotan akan di uji dengan menggunakan algoritma K- Nearest-Neighbor (KNN). Hasil yang dilakukan bahwa menggunakan algoritma K-NN dapat mengklasifikasikan opini negatif dan opini positif dengan akurat mencapai 80%, dengan menggunakan pengujian Precision, Recall dan F- Measure Application of K-Nearest Neighbour Classification in Medical Data Mining[14] Khamis, Kipruto dan Stephen melakukan penelitian untuk mengklasifikasi diagnosis penyakit, dengan membagi data latih dan data uji sebelum dilakukannya preprocessing, serta menentukan variabel seperti kecelakaan, usia, alergi, tekanan darah, kebiasaan merokok, kolesterol, diabetes dan hipertensi. Pada penelitian ini penulis menggunakan algoritma K-Nearest Neighbor dengan hasil akurasi yang tinggi dalam menentukan diagnosis penyakit pada pasien di rumah sakit. 2.2 Justifikasi dari Penelitian Terkait Berdasarkan paparan dari beberapa penelitian terkait yang sudah dipaparkan pada sub bab sebelumnya penulis meringkasnya dalam tabel perbandingan sebagaimana tampak pada tabel 2.1. Dari paparan tersebut, pada penelitian ini penulis mengusulkan analisa sentimen pelanggan dengan menggunakan algoritma K-Nearest Neighbor (KNN) untuk klasifikasi opini positif dan negatif karena memiliki tingkat akurasi yang cukup tinggi. Pada proses preprocessing dilakukan dengan proses cleansing, case folding, tokenizing, stopwords removing, dan stemming. Kemudian untuk menguji validasi dan keakuratan pada penelitian ini digunakan dengan metode confusion matrix.

5 12 Tabel 2.1 Penelitian Terkait No Topik Riset Masalah Metode Dataset Hasil 1. Analisis layanan ojek online berbasis Naïve Bayes [10] Sering terjadi kesalahan pada data uji fitur yang muncul tidak sesuai dengan klasifikasinya, serta tingkat akurasi bergantung pada jumlah data latih Pada penelitian ini menggunakan metode Naïve Bayes Data publik dengan 300 data latih dan 500 data uji Menggunakan metode Naïve Bayes mendapatkan akurasi sebesar 80% 2. Analisis mengenai penggunaan transportasi umum darat berbasis Support Vector Machine [11] Variabel yang berpengaruh terhadap akurasi adalah jumlah data, perbandingan jumlah data uji dan data latih, serta perbandingan jumlah yang digunakan pada data positif dan data negatif Metode yang digunakan yaitu Support Vector Machine Data publik dengan jumlah dataset 1138 Analisis sentimen menggunakan metode Support Vector Machine pada penelitian ini tingkat akurasi mencapai 78,12% 3 Analisis pada review barang berbasis K- Nearest Neighbor [13] Dalam paper ini kurang optimal dikarenakan sistem mengabaikan kata yang memiliki makna yang sama Menggunakan metode K- Nearest Neighbor Data publik dengan jumlah dataset 2000, 1000 sebagai data latih dan 1000 sebagai data uji Analisis ini dapat mengklasifikasikan sentimen berdasarkan review barang secara otomatis dengan acuan nilai k yang tepat

6 13 No Topik Riset Masalah Metode Dataset Hasil 4 Penentuan resiko kredit kepemilikan kendaraan bermotor berbasis K- Nearest Neighbor [12] Pada penelitian ini mengungkapkan bahwa untuk mendapat akurasi yang baik perlu dilakukan preprocessing sebelum diterapkan ke dalam algoritma dan menggunakan metode cross validation untuk mengukur kinerja algoritma Penggunaan metode K- Nearest Neighbor dalam melakukan klasifikasi pada customer pada kredit kepemilikan kendaraan bermotor Data privat Penerapan metode K- Nearest Neighbor pada penelitian ini menghasilkan tingkat akurasi mencapai 81,46% 5 Analisis terhadap layanan IndiHome berdasarkan opini publik berbasis K- Nearest Neighbor [9] Dalam penelitian ini mendapatkan hasil yang baik, akan tetapi pada proses pembobotan, sistem menghitung kemiripanberdasarkan frekuensi kemunculan kata,sehingga untuk mendapatkan hasil yang optimalsebaiknya digunakan sistem yang dapatmengecek kata yang bersinonim. Menggunakan metode K- Nearest Neighbor untuk melakukan analisis sentimen terhadap Telkom IndiHome Data publik Dihasilkan akurasi mencapai 80% dengan dengan menggunakan precision sebesar 80% dan recall sebesar 80%.

7 14 No Topik Riset Masalah Metode Dataset Hasil 6 Klasifikasi data medical berbasis K- Nearest Neighbor Dalam penelitian ini mendapatkan hasil yang baik, namun penulis mengatakan bahwa hasil dari akurasi sangat dipengaruhi pada saat menentukan variabel. Menggunakan metode K- Nearest Neighbor Data privat Penerapan metode K- Nearest Neighbo rmampu mengklasifikasi dengan baik sehingga mampu mengurangi kesalahan dalam mendiagnosis, dan meningkatkan efisiensi dan efektivitas dalam pengobatan.

8 Tinjauan Pustaka Pada bagian merupakan penjelasan tentang bagian serta metode yang digunakan pada penelitian ini seperti data mining, analisis sentimen, twitter API, klasifikasi, TF-IDF, K-Nearest Neighbor (KNN), serta alat ukur dan validasi Data Mining Data mining yaitu beberapa rangkaian proses guna menggali nilai tambah berupa informasi belum diketahui saat ini bahwa secara manual dari suatu basis data dapat dilakukan penggalian pola-pola dari data, bertujuan untuk memanipulasi data menjadi suatu informasi yang bermanfaat dengan diperoleh melalui cara ekstraksi dan mengenali pola data di dalam basisdata yang penting dan menarik [15]. Data mining merupakan suatu proses yang memiliki prosedur tertentu dan bersifat interaktif serta memiliki umpan balik dari setiap tahapan sebelumnya [16]. Tahapan data mining dapat dilihat pada gambar 2.1. Gambar 2.1 Tahap-Tahap Data Mining[17]

9 16 Alasan utama mengapa menggunakan data mining karena adanya data dalam jumlah yang besar serta semakin banyaknya kebutuhan untuk melakukan manipulasi data tersebut menjadi informasi yang berguna. Tahapan tersebut bersifat interaktif dimana pengguna dapat terlibat langsung dengan melalui knowledge base. Berikut tahapanan data mining : 1. Cleaning, merupakan proses untuk menghilangkan data yang tidak konsisten atau data tidak relevan (noise). Pada dasarnya data yang telah diperoleh, baik itu dari database suatu perusahaan maupun dari hasil eksperimen, memiliki makna yang tidak sempurna sama halnya dengan data yang hilang atau data yang tidak valid meskipun sekedar salah ketik. Disisi lain, terdapat juga atribut-atribut data hipotesa data mining yang dimiliki tidak relevan. Datadata yang tidak relevan itu lebih baik dihapus. Pengaruh performasi dari teknik data mining ini dengan cara pembersihan data, karena jumlah data dan kompleksitas data yang didapat berkurang. 2. Integration, merupakan penggabungan data dari macamnya jumlah database ke dalam suatu database yang baru. Data yang diperlukan untuk data mining tidak hanya berasal dari satu database, akan tetapi berasal dari beberapa database. Integrasi data dapat dilakukan pada atribut-aribut yang mengidentifikasikan entitas yang unik seperti atribut nama, alamat, pekerjaan nomor pelanggan dan lainnya sebagainya. Integrasi data ini perlu dilakukan dengan cara cermat karena suatu kesalahan pada integrasi data dapat menghasilkan hasil sesuatu yang menyimpang saat pengambilan proses selanjutnya. 3. Selection, yaitu data yang tersedia di database sering kali semuanya tidak dipakai, maka dari itu hanya data-data yang sesuai dari database yang dapat dianalisis. 4. Transformation, manipulasi data atau dijadikan satu ke dalam suatu format yang sesuai. Format data yang khusus dibutuhkan dalam beberapa metode data mining sebelum melakukan pengaplikasian. Beberapa metode dalam data mining seperti analisis dan klasifikasi hanya mampu menerima input

10 17 data kategorikal. Karena data berupa angka numerik masih perlu dibagi menjadi beberapa interval. 5. Proses Mining, yaitu suatu proses utama dimana metode diterapkan untuk menemukan informasi bermanfaat dan data tersembunyi. 6. Pattern Discovery, merupakan proses esensial untuk mengekstrak pola data serta mengidentifikasikan pola yang benar-benar unik dan dapat mewakili informasi berdasarkan beberapa tindakan yang menarik. 7. Knowledge Presentation, yaitu untuk mengidentifikasikan pola menarik dalam jumlah besar kedalam knowledge based. Pada tahap ini menghasilkan pola-pola yang khas maupun model evaluasi untuk dinilai apakah hipotesa yang ada sudah tercapai. Apabila hasil yang diperoleh ternyata tidak sesuai dengan hipotesa maka dapat diambil alternatif seperti menjadikan umpan balik guna memperbaiki proses data mining, menerima hasil yang di luar dugaan yang mungkin hasil tersebut bermanfaat Analisis Sentimen Analisis sentimen atau yang sering disebut dengan opinion mining, merupakan salah satu cabang ilmu dari data mining yang memiliki tujuan untuk menganalisis, memahami, mengekstrak, dan mengolah data tekstual berupa opini terhadap suatu entitas seperti layanan, publik figur, lembaga, produk, peristiwa atau topik-topik tertentu [18]. Secara umum analisis sentimen dibagi menjadi 2 yaitu [19]: 1. Analisis sentimen coarse-grained Pada analisis sentimen coarse-grained, proses klasifikasi dilakukan berdasarkan orientasi sebuah dokumen secara keseluruhan. Orientasi dibagi menjadi 3 jenis yaitu negatif, netral dan positif. Namun orientasi ini menjadi kontinu atau dapat juga dikatakan bahwa orientasinya bersifat tidak diskrit.

11 18 2. Analisis senitmen fined-grained Peneliti sekarang ini kebanyakan berfokus pada kategori analisis sentimen fined-grained, karena metode ini menggunakan objek dengan berupa kalimat, bukan sebuah dokumen secara keseluruhan. Contoh : a. Saya sangat puas dengan pelayanan JNE (positif) b. Pengiriman JNE tidak tepat waktu (negatif) c. Paket saya telat, tetapi saya senang akhirnya datang juga (netral) Analisis sentimen dibagi menjadi 3 subproses besar. Masing-masing dari subproses mampu dijadikan sebagai topik penelitian, karena dari semua subproses tersebut membutuhkan teknik dan metode yang rumit. Subproses tersebut diantaranya[20]: 1. Subjectivity Classification (menentukan kalimat berupa opini) Contoh: Mobil itu memliliki 4 roda VS Itu mobil yang sangat keren! 2. Orientation Detection (setelah berhasil pada proses subjectivity classification sekarang tinggal menentukan apakah termasuk kedalam opini positif, netral atau negatif) Contoh: Mobil itu sangat keren! VS Mobil itu jelek sekali! 3. Opinion Holder and Target Detection (menentukan bagian Opinion Holder dan target) Contoh: Budi mengatakan bahwa mobil itu sangat keren. Masalah yang sering muncul pada kasus analisis sentimen ini yaitu masih yang membuat tweet dengan menggunakan kata yang tidak sesuai dengan kaidah, sehingga menyebabkan banyak variasi bahasa. Sebagai contoh kata tidak memiliki banyak variasi seperti nggak, gak, tdk, ga, gk, nda, kagak, kgk dan lain sebagainya.

12 19 Gambar 2.2 Proses Analisis Sentimen pada Produk[21] Analisis sentimen dapat dikatakan sebagai proses klasifikasi seperti yang diilustrasikan pada gambar 2.2. Ada 3 tingkatan klasifikasi dalam melakukan analisis sentiment [21] : 1. Document-Level Sentiment Analysis Document-Level Sentiment Analysis bertujuan untuk mengklasifikasikan dokumen opini positif atau negatif pada suatu topik. 2. Sentence-Level Sentiment Analysis Sentence-Level Sentiment Analysis bertujuan untuk mengklasifikasikan opini di setiap kalimat, dengan cara mengidentifikasi kalimat apakah kalimat tersebut masuk kedalam kalimat subjektif atau kalimat objektif. Kemudian Sentence-Level Sentiment Analysis akan menentukan apakah kalimat tersebut masuk kedalam opini positif atau opini negatif.

13 20 3. Aspect-Level Sentiment Analysis Aspect-Level Sentiment Analysis bertujuan untuk mengklasifikasikan sentimen dengan aspek-aspek tertentu dari sebuah entitas dengan cara mengidentifikasi entitas dan aspeknya. Karena opini bisa memberikan pendapat yang berbeda untuk aspek yang berbeda dari entitas yang sama. Contoh : Kualitas ponsel ini tidak baik, tetapi daya tahan baterainya sangat lama Twitter Search API Dalam setiap harinya twitter menghasilkan lebih dari 65 juta tweet per hari. Setiap tweet tersimpan pada corpus twitter dan dapat diakses oleh publik dengan menggunakan Antarmuka Pemrograman Aplikasi (API). API merupakan bagian dari twitter, dari API memungkinkan pengembang untuk membangun aplikasi mereka sendiri. Twitter menyediakan satu set API untuk mengakses data dan mekanisme ini memungkinkan query terhadap tweet dengan menggunakan kata kunci, hastagh, lokasi dan kriteria lainnya. API dibagi menjadi 3 bagian diantaranya [22]: 1. REST API, disediakannya akses program untuk menulis dan membaca data pada twitter. REST API mengidentifikasi user dan aplikasi twitter seperti tweet baru, membaca profil penulis dan data follower, dan masih banyak lagi. 2. Stream API, streaming API memberikan developer akses latency rendah ke stream global yang ada pada data twitter. Streaming API akan mendorong pesan dengan menunjukkan tweet dan acara lainnya telah terjadi, tanpa adanya overhead terkait dengan pengambilan endpoint REST. 3. Ads API, ads Twitter API mengintegrasikan mitra dengan platform iklan twitter dengan menggunakan iklan mereka sendiri. Mitra yang dipilih memiliki kemampuan untuk menciptakan alat custom untuk melaksanakan dan mengelola kampanye iklan di twitter.

14 Klasifikasi Dalam metode text mining dikategorikan sebagai supervised learning atau unsupervised learning. Perbedaan dari kedua metode tersebut antara lain supervised learning bertujuan untuk menemukan pola baru dengan cara menghubungkan pola data yang baru dengan data yang sudah ada. Sedangkan pada unsupervised learning, belum memiliki pola data apapun, maka dari itu unsupervised learning bertujuan untuk menemukan pola dalam sebuah data. Klasifikasi termasuk supervised learning dimana ada data atau variabel yang telah diprediksi terhadap data lain agar diketahui dikelas manakah objek tersebut masuk kedalam model yang mudah disimpan [23]. Klasifikasi merupakan proses dimana bertujuan menemukan fungsi atau model yang membedakan antara kelas data, bertujuan untuk memperkirakan kelas yang tidak diketahui objeknya. Dalam pengklasifikasian data terdapat tiga proses yang dilakukan yaitu: 1. Proses Training Pada proses training ini menggunakan data latih yang telah diketahui labelnya untuk membangun suatu model atau fungsi. 2. Proses Testing Untuk mengetahui keakuratan model maupun fungsi yang akan dibangun pada proses training, maka dari itu digunakannya data yang sering disebut sebagai data uji. Pemrosesan awal dokumen atau preprocessing yaitu tahapan dimana pada setiap proses berfungsi untuk mentransformasikan dokumen kedalam bentuk representasi yang lain. Dengan tujuan untuk mempercepat pemrosesan terhadap dokumen, mempermudah proses dalam pencarian query ke dalam sebuah dokumen, serta mempermudah pada proses pengurutan dokumen. Proses preprocessing pada penelitian ini adalah sebagai berikut [24] : 1. Cleansing Proses cleansing ini dilakukan untuk membersihkan dokumen dari kata yang tidak diperlukan untuk mengurangi noise. Kata yang dihilangkan adalah

15 22 karakter HTML, kata kunci, emotikon, hashtag (#), username url dan Case Folding Pada tahap ini yaitu merubah huruf ke dalam sebuah dokumen menjadi huruf kecil atau lowercase. Karakter selain huruf dalam tahapan ini dihilangkan. 3. Tokenizing Tokenizing atau tokenisasi merupakan proses untuk memisahkan atau memecahkan suatu kalimat menjadi kata-kata yang terpisah. Token yaitu suatu turunan dari urutan karakter kedalam beberapa dokumen tertentu,dimana dokumen dikelompokkan sebagai unit semantik yang layak untuk diproses. 4. Stopwords Removing Menyaring kata hasil dari proses tokenizing yang dianggap tidak berguna atau tidak penting dalam proses text mining atau yang sering disebut stoplist. Stoplist berisi kata-kata yang sering muncul secara umum pada sebuah dokumen dengan jumlah yang banyak akan tetapi tidak ada kaitannya dengan tema tertentu. Kata per kata hasil dari tokenizing akan dicocokkan kedalam kamus stopword di dalam database, apabila kata tersebut cocok dengan salah satu kata maka kata tersebut akan dihilangkan, sementara untuk kata yang tidak cocok akan dianggap cocok dan akan diproses lebih lanjut. 5. Stemming Mengembalikan kata-kata yang diperoleh dari hasil stopwords removing kedalam bentuk dasar, melakukan dengan cara menghilangkan imbuhan awal (prefix) dan akhir (sufix) sehingga akan di peroleh hanya kata dasar. Menghasilkan keluaran berupa root word metode stemming ini memerlukan masukan berupa kata yang terdapat dalam suatu dokumen Term Frequency Inverse Document Frequency (TF-IDF) Pembobotan TF-IDF ini termasuk dalam jenis pembobotan yang sering digunakan oleh Information Retrieval serta text mining. Pada pembobotan ini merupakan suatu pengukuran statistik dimana penting sebuah kata dalam kumpulan dokumen

16 23 untuk diukur. Meningkatnya tingkat kepentingan dokumen yaitu pada saat kata muncul beberapa kali dalam sebuah dokumen tetapi diimbangi dengan frekuensi kemunculan kata tersebut dalam kumpulan dokumen. Berikut ini rumusan dari TF-IDF : [25] ( ) ( ) (2.1) Dimana dihitung terlebih dahulu Term Frequency (TF) yaitu frekuensi kemunculan suatu term di setiap dokumen. Kemudian dilakukan perhitungan Inverse Document Frequency (IDF) yaitu menghitung nilai bobot suatu term dari seringnya suatu term muncul di beberapa dokumen. Semakin sering suatu term muncul, maka nilai IDF nya akan kecil. Berikut rumusan TF dan IDF : ( ) ( ) (2.2) (2.3) K-Nearest Neighbor (KNN) Algoritma K-Nearest Neighbor (KNN) merupakan salah satu metode yang digunakan dalam proses klasifikasi terhadap sebuah objek berdasarkan data pembelajaran yang memiliki jarak terdekat dengan objek tersebut[26]. Algoritma ini mendeskripsikan data learning dengan atribut numerik n-dimensi. Dengan menerapkan konsep learning by analogy. Setiap data learning merepresentasikan sebuah titik, yang ditandai dengan c, dalam ruang n-dimensi. Apabila data query yang dimasukkan tidak diketahui labelnya, maka K-Nearest

17 24 Neighbor (KNN) akan mencari k buah data learning yang memiliki jarak terdekat dengan query dalam ruang n-dimensi. Pengukuran jarak antara data learning dengan query dilakukan dengan mengukur jarak antar titik yang merepresentasikan data query dengan semua titik data learning menggunakan perhitungan Euclidean Distance [26]. Gambaran umum algoritma KNN ini dapat dilihat dalam flowchart berikut [26] : Gambar 2.3 Flowchart KNN Pada tahap fase training, algoritma ini hanya menyimpan vektor-vektor fitur dan klasifikasi data training sample. Saat fase klasifikasi, semua fitur yang sama dihitung untuk kemudian dilakukan testing data. Jarak vektor baru yang terbentuk kemudian dihitung seluruh vektor training sampel, kemudian jumlah k buah yang

18 25 terdekat diambil. Klasifikasinya diprediksikan pada titik yang baru termasuk pada klasifikasi terbanyak berdasarkan titik-titik tersebut [26]. Nilai k merupakan jumlah titik pembanding yang akan dibandingkan dengan titik uji. Pada k=1 akan dicari jarak terdekat dengan nilai titik uji. Untuk nilai k lebih dari satu, selanjutnya akan dilakukan voting berdasarkan mayoritas keberadaan kelasnya. Maka dari itu besar nilai k harus merupakan bilangan ganjil, supaya dapat dilakukan voting berdasarkan mayoritas keberadaannya didalam suatu kelas[27]. Nilai k dapat dikatakan bagus apabila dipilih dengan optimasi parameter, seperti contoh menggunakan confusion matrix. Pada contoh kasus tertentu disebut algoritma nearest neighbor apabila klasifikasi diprediksikan berdasarkan data pembelajaran yang paling dekat (dengan kata lain, k = 1) [26]. Algoritma KNN ini sangat dipengaruhi oleh eksistensi fitur-fitur yang tidak relevan, dengan kata lain bobot fitur tidak setara dengan relevansinya terhadap klasifikasi. Sebagian besar penelitian menggunakan algoritma ini yaitu membahas bagaimana memilih dan memberi bobot pada tiap fitur, agar performa klasifikasi menjadi lebih baik [26]. K buah data learning menentukan label mayoritas dengan melakukan voting. Label data query ditentukan berdasarkan label mayoritas dan apabila ada lebih dari satu label mayoritas maka label secara acak data query akan dipilih di antara label mayoritas yang ada [26]. Setelah melalui tahap preprocessing, setiap dokumen akan menjadi fitur vektor yang memiliki dimensi ke-m tahapan penerapan Algoritma KNN dapat dituliskan sebagai berikut [28]: 1. Menentukan nilai k sebagai k terdekat dari data latih. 2. Mengubah dari masing-masing dokumen setelah preprocessing menjadi sebuah term. Kemudian dihitung bobot per-term menggunakan TF-IDF. 3. Hitung jarak titik ruang dengan menggunakan Euclidean Distance. 4. Memberikan 2 buah titik Q dan P dalamsebuah ruang vektor n-dimensi dengan Q (q 1, q 2,..., q n ) dan P (p 1, p 2,..., p n ), maka jarak antara Q dan P dapat dihitung menggunakan persamaan Euclidean Distance berikut [25] :

19 26 (2.5) Dimana q dan p merupakan titik pada vektor n pada ruang vektor n dimensi sedangkan q i dan p i merupakan besaran skalar untuk dimensi ke i dalam ruang vektor n dimensi. 5. Menghitung jumlah bobot pada proses Euclidean Distance pada setiap dokumen. 6. Menentukan hasil jarak terdekat antara data uji dengan data latih. 7. Menentukan kelas dari obyek berdasarkan kelas yang paling dominan Alat Ukur & Validasi Ada beberapa alat untuk mengukur akurasi algoritma klasifikasi, metode yang digunakan yaitu : 1. Confusion Matrix Confusion matrix merupakan alat ukur yang biasanya digunakan dalam melakukan perhitungan akurasi pada konsep data mining. Tabel matrik digunakan dalam metode ini, jika data set hanya terdiri dari dua kelas, maka satu kelas dianggap sebagai kelas positif dan lainnya kelas negatif. True positives yaitu jumlah record positif yang diklasifikasikan sebagai kelas positif, dan false positives yaitu jumlah record negative yang diklasifikasikan sebagai kelas positif, sedangkan false negatives yaitu jumlah record positif yang diklasifikasikan sebagai kelas negatif, dan true negatives yaitu jumlah record negatif yang diklasifikasikan sebagai kelas negatif, setelah itu masukkan data uji. Kemudian data uji dimasukkan ke dalam confusion matrix, dan hitung nilai-nilai yang telah dimasukkan untuk menghitung jumlah sensitivity (recall), specificity, precision dan accuracy. Seperti yang dapat di dalam tabel 2.2 berikut [29] : Tabel 2.2 Model Confusion Matrix Klasifikasi Diklasifikasikan sebagai yang benar + -

20 27 + True Positives - False Positives False Negatives True Negatives Sensitivity atau recall ini digunakan untuk membandingkan jumlah TP dari jumlah record yang bernilai positif, sedangkan specificity yaitu membandingkan jumlah TN darijumlah record yang bernilai negatif. Berikut persamaan yang digunakan untuk melakukan perhitungannya [29] : Precission = (2.6) Recall = (2.7) Precision = (2.8) Accuracy = (2.9) Keterangan : TP = Jumah True Positives TN = Jumah True Negatives P = Jumlah Record Positives N = Jumlah Tupel Negatives FP = Jumlah False Positives R Programming R merupakan suatu kesatuan software yang terintegrasi dengan menyediakan beberapa fasilitas antara lain fasilitas untuk melakukan manipulasi, perhitungan dan menampilkan grafik dengan baik. R ini merupakan bahasa pemrograman yang berbasis pada bahasa pemrograman S yang telah dikembangkan oleh AT & T Laboratories yang sekarang lebih dikenal Lucent Technologies. R itu sendiri memliliki beragam jenis model statistik, seperti linear dan nonlinear modeling,

21 28 classical statistical tests, time series analysis, classification, clustering, dan lain sebagainya [30]. R juga termasuk bahasa terinterpretasi atau interpreted. Bahasa terinterpretasi yaitu setiap perintah tunggal harus dievaluasi dan dieksekusi. Sedangkan bahasa kompilasi yaitu keseluruhan program harus dikompilasi oleh sebuah kompiler yang menerjemahkan bahasa pemrograman ke dalam bahasa mesin [30]. Gambar 2.4 R Programming Berikut penjelasan sesuai nomor pada gambar 2.4 : 1. Menu Toolbar, kumpulan perintah-perintah yang dapat digunakan di R 2. Halaman untuk membuat coding atau script code. 3. Halaman untuk membuat function. 4. Files Browser, untuk mencari folder atau file pada laman kerja. 5. Objek Dinamis dan Packages Browser. 6. Penjelasan mengenai dokumen yang kita buat. 7. Functions Browser, untuk memilih function yang akan dibuat.

22 29 R memiliki teknik komputasi grafik dimana Source Code yang multiplatform (tersedia padasistem operasi Windows, Linux dan Unix) dan tersedia secara bebas dibawah lisensi oleh GNU General Public License, dan versi precompiled binary tersedia untuk berbagai sistem operasi. R didukung dengan model serta teori statistik terdepan, dengan menggunakan standar tertinggi bagi analisis data. R dapat dikatakan hampir bisa untuk digunakan dalam berbagai bidang, seperti kalkulasi biasa layaknya kalkulator, statistik, ekonometri, geografi, sampai pemrograman computer [30].

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Penelitian Terkait Pada penelitian yang dilakukan dalam paper [4], penggunaan metode Support Vector Machine (SVM) menghasilkan tingkat akurasi yang relatif lebih tinggi dibandingkan

Lebih terperinci

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah 1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Liu opini merupakan pernyataan subyektif yang mencerminkan sentimen orang atau persepsi tentang entitas dan peristiwa [1]. Opini atau pendapat orang lain terhadap

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1. 1.1 Latar Belakang Perkembangan dunia telekomunikasi meningkat secara signifikan dalam kurun waktu satu dekade terahir. Tidak hanya dari segi jumlah pengguna, jenis layanan yang ditawarkanpun

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Penelitian terdahulu sangat penting bagi penulis untuk mengetahui referensi dan hubungan antara penelitian terdahulu dengan penelitian yang dilakukan saat ini, sehingga hal duplikasi

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Text mining Menurut Feldman dan Sanger (Feldman dan Sanger, 2007), text mining dapat didefinisikan secara luas sebagai proses pengetahuan intensif yang memungkinkan pengguna berinteraksi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

3.1 Desain Penelitian

3.1 Desain Penelitian 24 BAB 3 METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian merupakan tahapan yang akan dilakukan penulis dalam melakukan penelitian. Tahapan penelitian yang digunakan

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Apa yang orang lain pikirkan telah menjadi sesuatu yang penting untuk menjadi pertimbangan dalam pengambilan keputusan (Pang and Lee, 2006). Sesuatu yang orang lain

Lebih terperinci

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam

Lebih terperinci

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA Prawidya Destarianto 1, Wahyu Kurnia Dewanto 2, Hermawan Arief Putranto 3 1,2,3 Jurusan, Teknologi

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal

Lebih terperinci

Gambar 1.1 Proses Text Mining [7]

Gambar 1.1 Proses Text Mining [7] 1. BAB II LANDASAN TEORI 2.1 Text Mining Text mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES

ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES Analisis Sentimen pada Jasa Ojek Online... (Nugroho dkk.) ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES Didik Garbian Nugroho *, Yulison Herry Chrisnanto, Agung Wahana Jurusan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kehadiran teknologi web yang interaktif telah merubah cara orang mengekspresikan pandangan dan opininya. Saat ini pengguna dapat menulis ulasan suatu produk pada situs

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Informasi telah menjadi kebutuhan utama dalam kehidupan manusia. Informasi bisa dikatakan sebagai pengetahuan yang didapatkan dari pembelajaran, pengalaman, atau instruksi.

Lebih terperinci

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR Erik Hardiyanto 1), Faisal Rahutomo 1) 1 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 1.1. Rancangan Penelitian Rancangan penelitian adalah rencana dan struktur penyelidikan yang disusun sedemikian rupa sehingga penelitian akan memperoleh jawaban untuk pertanyaan-pertanyaan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini, microblogging menjadi sangat popular untuk alat komunikasi antara pengguna internet. Setiap hari jutaan pesan muncul di website penyedia microblogging diantaranya

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang website adalah salah satu layanan yang bisa digunakan untuk melakukan pencarian berbagai informasi, sehingga sangat dibutuhkan untuk keperluan pengguna dalam pencarian

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISIS DAN PERANCANGAN BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Empiris BAB II TINJAUAN PUSTAKA Pada penelitian ini, peneliti menggunakan beberapa penelitian yang pernah dilakukan sebelumnya sebagai tinjauan studi. Berikut ialah tinjauan empiris yang digunakan:

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Penelitian Terkait Pada bab ini akan dipaparkan penelitian terkait analisa sentiment, teknik atau metode dalam perancangan penilitian serta hal-hal terkait penilitian yang perlu

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI)

K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI) K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI) Disusun Oleh : Alfian Sukma 081116007 Dian Ramadhan 081211631003 Bagus Puji Santoso 081211631061 Tiara Ratna Sari 081211632014 Ni

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah BAB I PENDAHULUAN Pada bagian ini akan dijelaskan tentang pendahuluan dalam penyusunan Laporan Penelitian. Pendahuluan meliputi latar belakang masalah, rumusan masalah, tujuan penelitian, batasan masalah,

Lebih terperinci

Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine

Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine Analisis Sentimen pada Twitter untuk Mengenai Penggunaan Transportasi Umum Darat Dalam Kota dengan Metode Support Vector Machine Anita Novantirani 1, Mira Kania Sabariah S.T., M.T 2, Veronikha Effendy,

Lebih terperinci

BAB III ANALISIS DAN PENYELESAIAN MASALAH

BAB III ANALISIS DAN PENYELESAIAN MASALAH BAB III ANALISIS DAN PENYELESAIAN MASALAH 3.1 Deskripsi Sistem Gambar III-1 Deskripsi Umum Sistem Pada gambar III-1 dapat dilihat deskripsi sistem sederhana yang mendeteksi intrusi pada jaringan menggunakan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu

Lebih terperinci

BAB I PENDAHULUAN.

BAB I PENDAHULUAN. BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini smartphone telah berevolusi menjadi komputer pribadi kecil dan portabel yang memungkinkan pengguna untuk melakukan penjelajahan internet, mengirim e-mail

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Pada bab ini berisi tentang data dan informasi yang berkaitan dengan pokok permasalahan yang akan diuji, yaitu dengan mendalami tentang klasifikasi teks. Selain itu juga membahas

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Text Mining Text Mining merupakan penerapan konsep dari teknik data mining untuk mencari pola dalam teks, bertujuan untuk mencari informasi yang bermanfaat dengan tujuan tertentu.

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1. Desain Penelitian Desain penelitian merupakan tahapan yang akan dilakukan oleh penulis untuk memberikan gambaran serta kemudahan dalam melakukan penelitian. Berikut tahapan

Lebih terperinci

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Yusra 1, Dhita Olivita 2, Yelfi Vitriani 3 1,2,3 Jurusan Teknik

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

Penerapan Deep Sentiment Analysis pada Angket Penilaian Terbuka Menggunakan K-Nearest Neighbor

Penerapan Deep Sentiment Analysis pada Angket Penilaian Terbuka Menggunakan K-Nearest Neighbor Jurnal Sisfo Vol. 06 No. 01 (2016) 147 156 is.its.ac.id/pubs/oajis/ Penerapan Deep Sentiment Analysis pada Angket Penilaian Terbuka Menggunakan K-Nearest Neighbor Jane Riany *, Mohammad Fajar, Musfirah

Lebih terperinci

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks

Lebih terperinci

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang,

BAB I PENDAHULUAN. Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang, BAB I PENDAHULUAN Pada bagian awal penelitian ini dipaparkan secara lengkap latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, metodologi, dan sistematika penulisan. 1.1 Latar Belakang

Lebih terperinci

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan 1 BAB I PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan media sosial menawarkan pengguna kesempatan untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan tidak lagi memiliki

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA

BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA BAB 3 ANALISIS KEBUTUHAN IMPLEMENTASI ALGORITMA 3. Analisis Masalah Analisis masalah adalah suatu gambaran masalah yang diangkat dalam penulisan skripsi tentang Analisis sentimen pengguna twitter pada

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait Penelitian terkait dengan topik analisis sentimen cukup banyak, berikut beberapa penelitian yang tekait dengan analisa sentimen yang menggunakan seleksi

Lebih terperinci

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik DAFTAR ISI PERNYATAAN... iii PRAKATA... vi DAFTAR ISI... viii DAFTAR GAMBAR... xi DAFTAR TABEL... xiv DAFTAR PERSAMAAN... xv DAFTAR ALGORITMA... xvi DAFTAR LAMPIRAN... xvii INTISARI... xviii ABSTRACT...

Lebih terperinci

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE DRAFT JURNAL ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE SENTIMENT ANALYSIS FOR TWITTER ABOUT ONLINE INDONESIAN TRANSPORTATION WITH

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang 3 BAB I PENDAHULUAN 1.1. Latar Belakang Semakin banyaknya pengunaan teknologi informasi pada pemerintahan, dapat mempermudah masyarakat dalam pelayanan masyarakat itu sendiri. Seperti misalnya ketika sesorang

Lebih terperinci

JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG

JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG KLASIFIKASI ENTERTAINER BERDASARKAN TWEET MENGGUNAKAN METODE SCORING BERBASIS LEXICON BASED TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Sentimen Analisis Analisis sentimen juga dapat dikatakan sebagai opinion mining. Analisis sentimen dapat digunakan dalam berbagai kemungkian domain, dari produk konsumen, jasa

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN. 1.1 Latar belakang BAB I PENDAHULUAN 1.1 Latar belakang Dalam beberapa tahun terakhir teknologi informasi dan telekomunikasi berkembang dengan pesat. Masyarakat mendapatkan manfaat dari tekonologi informasi dan telekomunikasi

Lebih terperinci

1. BAB I PENDAHULUAN 1.1 Latar Belakang

1. BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini dunia telah memasuki era dimana masyarakat dapat secara bebas menyuarakan pendapat mereka di berbagai media, salah satunya melalui media sosial. Masyarakat

Lebih terperinci

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES F.4 ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES Raflialdy Raksanagara*, Yulison Herry Chrisnanto, Asep Id Hadiana Jurusan Informatika, Fakultas Matematika dan Ilmu Pengetahuan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu tanggung jawab sosial PT. Telkom dalam program kemitraan dengan masyarakat sekitarnya adalah memberikan kredit lunak bagi pelaku Usaha Kecil Menengah (UKM).

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan media online mendorong munculnya informasi tekstual yang tidak terbatas, sehingga muncul kebutuhan penyajian tanpa mengurangi nilai dari informasi tersebut.

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Seiring berkembangnya teknologi informasi saat ini maka berkembang pula perangkat perangkat yang mendukung guna akses informasi yang semakin dibutuhkan dalam waktu

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Sistem Rekomendasi 2.1.1 Pengantar Sistem Rekomendasi Proses memberitahukan kepada seseorang atau lebih bahwa sesuatu yang dapat dipercaya, dapat juga merekomendasikan diartikan

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Salah satu faktor penting penunjang globalisasi ialah internet. Semakin majunya teknologi internet menyebabkan banyaknya pengembang perangkat lunak membuat berbagai

Lebih terperinci