ENSEMBLE LEARNING DAN ANALISIS SENTIMEN PADA DATA ULASAN PRODUK

Ukuran: px
Mulai penontonan dengan halaman:

Download "ENSEMBLE LEARNING DAN ANALISIS SENTIMEN PADA DATA ULASAN PRODUK"

Transkripsi

1 ENSEMBLE LEARNING DAN ANALISIS SENTIMEN PADA DATA ULASAN PRODUK Rimbun Siringoringo 1), Resianta Perangin Angin 2), Mufria J. Purba 3) Universitas Methodist Indonesia Jl. Hang Tuah No. 8, Sumatera Utara 1, 2, 3 ABSTRACK The majority of internet users are currently searching the internet before buying certain products. One consideration of prospective buyers is product reviews (product review). Prospective consumers can decide to buy a product because it is influenced by reviews with positive sentiments, or decide not to buy a particular product because it is influenced by a negative sentiment review. Product reviews are a way of delivering consumer opinions and sentiments to a product online. In essence, the product review data mined directly from the database is unbalanced, between positive sentiment and negative sentiment. This condition makes it difficult for machine learning algorithms to perform classification and clustering functions. In this study, sentiment analysis was conducted based on Trendy Shoes products from Denim Shoes. The stages of sentiment analysis consist of data collection, initial processing, data transformation, feature selection and classification stages using SMOTE. Initial processing applies the stages of text mining namely case folding, non alpha numeric removal, stop words removal, and stemming. The results of sentiment analysis were measured using the criteria of Accuracy, G-Mean, and F-Measure. By applying the test to two types of sentiment data, the results show that SMOTE can classify sentiments well. SMOTE's performance is compared to other ensemble techniques namely ADA, RUS, and SMOTEBagging. Classification results of review_1 data, SMOTEboost is better in accuracy and G-Mean. While for the review_2 data, SMOTE has better results for all criteria, both accuracy, F-Measure and G-Mean Keywords sentiment analysis, text mining, support vector machine, product review ABSTRAK Mayoritas pengguna internet saat ini melakukan penelusuran di internet sebelum membeli produk tertentu. Salah satu pertimbangan calon pembeli adalah ulasan produk (product review). Calon konsumen dapat memutuskan untuk membeli produk karena dipengaruhi oleh ulasan dengan sentimen positif, atau memutuskan untuk tidak membeli produk tertentu karena dipengaruhi oleh ulasan sentimen negatif. Ulasan produk merupakan salah satu bentuk penyampaian opini dan sentimen konsumen terhadap sebuah produk secara online. Pada hakekatnya data ulasan produk yang ditambang langsung dari database adalah tidak seimbang, 9

2 antara sentiment positif dan sentimen negatif. Kondisi tersebut menyulitkan algoritma-algoritma machine learning dalam melakukan fungsi-sungsi klasifikasi maupun klasterisasi. Pada penelitian ini dilakukan analisis sentimen berdasarkan ulasan produk sepatu Trendy Shoes merek Denim. Tahapan analisis sentimen terdiri dari pengumpulan data, pemrosesan awal, transformasi data, seleksi fitur dan tahapan klasifikasi menggunakan SMOTE. Pemrosesan awal menerapkan tahapan text mining yakni case folding, non alpha numeric removal, stop words removal, dan stemming. Hasil analisis sentimen diukur menggunakan kriteria Akurasi, G-Mean, dan F-Measure. Dengan menerapkan pengujian pada dua jenis data sentimen diperoleh hasil bahwa SMOTE dapat mengklasifikasi sentimen dengan baik. Performa SMOTE dibandingkan dengan teknik ensemble lain yaitu ADA, RUS, dan SMOTEBagging. Hasil klasifiasi data ulasan_1, SMOTEboost lebih baik pada accuracy dan G-Mean. Sementara untuk data ulasan_2, SMOTE memiliki hasil yang lebih baik untuk semua kriteria, baik Accuracy, F-Measure maupun G-Mean Kata kunci analisis sentimen, text mining, support vector machine, ulasan produk 1. PENDAHULUAN Hasil penelitian yang dirilis oleh marketing research (Nielsen, 2014), sebanyak 71 % pengguna internet saat ini melakukan memaca dan menelusuri ulasan produk sebelum membeli produk tertentu. Hasil penelitian dimensional research, 91 % calon pembeli memutuskan untuk membeli produk karena dipengaruhi oleh ulasan dengan sentimen positif, dan sebesar 86 % calon pembeli memutuskan untuk tidak membeli produk tertentu karena dipengaruhi oleh ulasan sentimen negatif (Ariska et al., n.d.). Pada hakekatnya data ulasan produk yang ditambang langsung dari database adalah tidak seimbang, antara sentiment positif dan sentimen negatif. Kondisi tersebut menyulitkan algoritma-algoritma machine learning dalam melakukan fungsisungsi klasifikasi maupun klasterisasi. Pada umumnya, algoritma-algoritma klasifikasi seperti Naive Bayes, Decision Tree, K- Nearest Neighbor dan yang lainnya menghasilkan performa yang sangat buruk ketika bekerja pada data tidak seimbang karena algoritma-algoritma di atas tidak delengkapi dengan kemampuan untuk menangani masalah ketidak seimbangan kelas. Klasifikasi pada data dengan kelas tidak seimbang merupakan salah satu masalah utama pada bidang machine learning dan data mining, misalnya pada masalah medis (Kothandan, 2015), (M et al., 2017), klasifikasi teks (Wu et al., 2014), sosial media (Li and Liu, n.d.). Jika bekerja pada data tidak seimbang, hampir semua algoritma klasifikasi akan menghasilkan akurasi yang jauh lebih tinggi untuk kelas mayoritas dari pada kelas minoritas (Gu et al., 2016), disisi lain kelas minoritas justru lebih penting untuk diidentifikasi dari pada kelas mayoritas. Pada kasus kartu kredit, pada umumnya status transaksi adalah transaksi yang normal, hanya sedikit kasus yang dapat ditemukan dimana terjadi transaksi yang ilegal atau fraud. Meskipun demikian, keberadaan transaksi yang fraud jauh lebih penting untuk di identifikasi daripada transaksi yang normal meskipun jumlah kasusnya jauh lebih sedikit (Gu et al., 2016). 10

3 2. METODOLOGI PENELITIAN Penerapan SMOTE pada bidang klasifikasi menunjukkan perbaikan performa dari metode klasifikasi yang ada. Penerapan SMOTE pada masalah klasifikasi infertilitas menggunakan metode klasifikasi Multi Level Perceptron (MLP), k-nearest Neighbor (k- NN), Naïve Bayes, Random Forest, dan Support Vector Machine (Karlik et al., 2016). SMOTE berhasil meningkatkan performa klasifikasi dengan hasil terbaik didapatkan dengan metode Naive Bayes sebesar 90,7%. Penerapan SMOTE pada masalah klasifikasi pada dataset menggunakan Fuzzy C-Means (Pruengkarn et al., 2017) dapat mengatasi ketidak seimbangan kelas pada data set tersebut. Pada masalah clustering dengan metode k- Means Clustering, Penerapan SMOTE berhasil menghilangkan noise serta menyelesaikan masalah ketidak seimbangan pada 71 dataset. Penerapan SMOTE dapat memperbaiki kualitas clustering (Last et al., 2017). Ada dua tantangan utama dalam melakukan analisis sentimen, pertama sering sekali bahwa sentimen yang dihasilkan oleh model-model prediksi berbeda dengan sentimen yang aktual, kedua cara konsumen mengekpresikan emosi dan sentimen selalu berbeda beda dari waktu ke waktu (Nagamma et al., 2015) Data mining dan text mining menawarkan pendekatan komputasional dalam menganalisis sentimen. Data mining juga telah menjadi pendekatan yang paling populer saat ini untuk menggali opini publik (Amolik et al., 2016). Beberapa penelitian terkait penerapan data mining pada sentimen analisis adalah penerapan Naive Bayes Classifier (Fang and Zhan, 2015) pada analisis sentimen terhadap produk buku dan elektronik berdasarkan ulasan produk yang dikumpulkan dari situs jual beli Amazon.com. Penerapan metode K-Means Clustering (KMC) dan Decision Tree pada analisis sentimen untuk mengidentifikasi opini konsumen terhadap produk baru (Soni and Mathai, 2016). Metode Support Vector Machine (SVM) diterapkan pada analisis sentimen terhadap film box-office berdasarkan ulasan produk pada situs imdb.com (Nagamma et al., 2015) 3. RANCANGAN PENELITIAN 3.1 Prosedur kerja Prosedur kerja penelitian ditampilkan pada gambar 3. Data ulasan produk yang digunakan bersumber dari beberapa situs e- commerce yang ada di Indonesia. 3.2 Data penelitian Penelitian ini menggunakan data ulasan produk yang dikumpulkan dari beberapa situs jual beli online di Indonesia. Pada tabel 1 berikut ini disajikan contoh ulasan produk sepatu sepatu anak. 11

4 Data Crawling Ulasan Produk Preprocessing Konversi dokumen ke CSV, Case Folding, Non Alpha Numeric Removal, Stop words Removal, dan Stemming Pengumpulan Data Awal Seleksi Fitur Data Splitting 5 Fold CV Pengujian Model Penerapan Model ADA, SMOTE pada Data Training Kategorisasi Data Testing Penerapan data testing pada model Klasifikasi data tidak seimbang Validasi dan Performa Accuracy, F-Measure, G-Mean Gambar 1 Prosedur kerja penelitian 4. ANALISA DAN HASIL 4.1 Sampel ulasan produk Data ulasan produk yang digunakan bersumber dari beberapa situs e-commerce yang ada di indonesia. Sampel ulasan produk dapat ditampilkan pada tabel 1. Tabel 1. Sampel acak ulasan produk awal No Ulasan Produk 1 Sepatunya bagus. Tp ukuran nya agak kecil dari size biasanya. Jd mesti order size lebih besar dari size biasanya 2 kiriman cepat sampai, barang sesuai 3 Kirimannya cepat sekali saya terima, packing rapi dibungkus kado, barang juga bagus seperti tampak fotonya, cocoklah untuk harganya, kalau size lebih kecil dibanding size standar makanya saya sengaja pilih no yg lebih besar...anak saya juga suka sekali dengan sepatu barunya. terima kasih seller 4 Anak saya pas dipesenin ga mau..tapi ketika barang nya datang, wooww dia suka bangetss. 5 Sepatu nya keren 6 Sepatu nya keren, cocok banget buat anak aku. 7 Barang udah sampai, sesuai dg picture, sepatunya bagus, jahitan rapi, kerren, semoga msh yg t' OK n tdk mengecewakan 4.2 Pemrosesan awal data Setelah data ulasan produk berhasil di kumpulkan, maka tahap selanjutnya adalah tahap pemrosesan awal (pre-processing) agar data ulasan produk dapat diterapkan pada algoritma machine learning. Tahapan pre-processing yang diterapkan adalah Case Folding, Non Alpha Numeric Removal, Stop words Removal, dan Stemming. Daftar stop words untuk Bahasa Indonesia terdiri atas 760 kata (Tala, 2003). Algoritma Stemming yang diterapkan adalah algoritma stemming khusus untuk bahasa Indonesia yaitu algoritma nazief-andriani (Adriani et al., 2007). Hasil akhir pre-processing ditampilkan pada tabel 2 berikut. Tabel 2. Hasil akhir text pre-processing No Uasan Produk 1 sepatu bagus ukur ukur mesti pesan ukur ukur 2 kirim cepat barang sesuai 3 kirim cepat terima bungkus rapi bungkus kado barang bagus 4 anak pas pesan barang suka 5 sepatu keren 6 sepatu keren cocok anak 12

5 7 barang sesuai gambar sepatu bagus jahit rapi keren 4.3 TF-IDF Untuk menentukan bobot setiap fitur pada data ulasan diterapkan algoritma TF-IDF. Hasil penerapan TF-IDF menghasilkan matriks data dengan dimensi 14 atribut x 1073 data. Tedapat 567 tag atau term pada ulasan produk_1. Berikut ini adalah gambar tag cloud dari dokumen ulasan. Gambar 2. Tag cloud dokumen ulasan Pada gambar berikut ditampilkan grafik term frekuensi dokumen ulasan. Term bagus merupakan term dengan frekuensi kemunculan paling besar di dalam dokumen dengan persentase 11,65 %. Term ke dua adalah sesuai dengan frekuensi kemunculan 4,67 %. 4.4 Seleksi fitur data Jumlah fitur tersebut pada gambar di atas masih sangat besar dan tidak efektif untuk dianalisis. Untuk membuang fitur fitur yang tidak signifikan terhadap proses text mining, dilakukan seleksi fitur menggunakan algoritma Coefficint feature selection (CFS) yang tersedia pada WEKA. Seleksi atribut menghasilkan sebanyak 14 fitur. Pada tabel terdapat 14 kata kunci yang paling sering muncul di dalam ulasan produk, disusun berdasarkan abjad. Dari 14 kata kunci tersebut, terdapat 6 kata kunci positif dan 8 kata kunci negatif. Pada tabel 3 ditampilkan sample 5 fitur atau kata kunci dengan bobot tertinggi TF- IDF. Kata kunci Bagus memiliki bobot dengan nilai TF-IDF terkecil yaitu 0,520. Tabel 3. Daftar 5 fitur dengan bobot tertinggi data ulasan produk sepatu No Fitur TF-IDF 1 Bagus 0,520 2 Sesuai 1,030 3 Terimakasih 1,236 4 Suka 1,464 5 Cepat 1,588 Penelitian ini menggunakan 2 jenis data ulasan produk. Data ulasan pertama terdiri atas 768 ulasan positif dan 564 ulasan negatif. Data ulasan kedua terdiri atas 268 ulasan positif dan 568 ulasan negatif. Pada tabel berikut ditampilkan deskripsi data ulasan produk yang digunakan pada penelitian ini. Tabel 4. Deskripsi data ulasan Data #Pos #Neg #Ex #IR #Atts Ulasan Ulasan Deskripsi lengkap data ulasan ditampilkan pada tabel 5. Pada tabel tersebut dideskripsikan banyak sentimen positif (#Pos.), banyak sentimen negatif (#Neg.), banyaknya data keseluruhan (#Ex.), tingkat 13

6 ketidak seimbangan kelas (#IR.), dan banyaknya atribut (#Atts) 4.5 Teknik validasi dan evaluasi Teknik evaluasi dan estimasi performa pada penelitian ini menggunakan skema 5- fold cross-validation. Hal ini berarti, dataset ulasan dibagi menjadi 5 bagian atau fold yang sama, setiap fold berisi 20% dataset, kemudian dilakukan proses learning sebanyak 5 kali. Pada tabel ditampilkan hasil partisi data ulasan_1. Tabel 5. Partisi data ulasan_1 Partisi Dataset Jumlah Fungsi data ulasan1-1tra.dat 1065 Training ulasan1-1tst.dat 267 Testing ulasan1-2tra.dat 1065 Training ulasan1-2tst.dat 267 Testing ulasan1-3tra.dat 1065 Training ulasan1-3tst.dat 267 Testing ulasan1-4tra.dat 1065 Training ulasan1-4tst.dat 267 Testing ulasan1-5tra.dat 1065 Training ulasan1-5tst.dat 267 Testing 4.6 Pengukuran Performa Metode pengukuran performa memiliki peranan yang sangat penting untuk mengevaluasi kinerja suatu metode klasifikasi. Confusion matrix merupakan alat yang paling populer dalam mengevaluasi performa klasifikasi. Pada tabel berikut ditampilkan confusion matrix untuk kelas biner, sesuai dengan karakteristik data ulasan yaitu pisitif dan negative Kelas Tabel 6. Confution Matrix Prediktif Positif Prediktif Negatif Kelas Aktual Positif Kelas Aktual Negatif TP FP FN TN True Positive (TP) dan True Negative (TN) merupakan jumlah kelas positif dan negatif yang diklasifikasikan dengan tepat, False Positive (FP) dan False Negative (FN) merupakan jumlah kelas positif dan negatif yang tidak diklasifikasikan dengan tepat. Berdasarkan confusion matrix tersebut dapat ditentukan kriteria performa seperti Accuracy, Precision, Recall, specificity, F- MEASURE, G-Mean dan yang lainnya. Akurasi (Accuracy) merupakan kriteria yang paling umum untuk mengukur kinerja klasifikasi, tetapi jika bekerja pada kelas tidak seimbang, kriteria ini kurang tepat karena kelas minoritas akan memiliki sumbangsih yang kecil pada kriteria Accuracy. Kriteria Penilaian yang disarankan adalah TP rate, PP value, F- MEASURE dan G-Mean (Prachuabsupakij and Doungpaisan, 2016). F-Measure digunakan untuk mengukur klasifikasi kelas minoritas pada kelas tidak seimbang, dan indeks G-mean digunakan untuk mengukur performa keseluruhan (overall classification performance). Pada penelitian ini, performa klasifikasi menggunakan Accuracy, G- Mean, dan F-Measure. Recall = TP rate = Precision = PP value = Specificity = TN rate = TP TP+FN TP (1) TP+FP TN (2) TN+FP (3) G Mean = TP rate TN rate (4) 14

7 Pada tabel 7 ditampilkan sampel acak hasil kalsifikasi sentimen ulasan produk menggunakan SVM. Sentimen aktual adalah sentimen positif atau negatif yang sesungguhnya. Tabel 7. Sampel acak klasifiasi ulasan produk No Input uasan Sentimen Ket produk Aktual Prediktif 1 sepatu bagus Positif Positif TP ukur ukur mesti pesan ukur ukur 2 kirim cepat Positif Positif TP barang sesuai 3 kirim cepat Positif Positif TP terima bungkus rapi bungkus kado barang bagus 4 anak pas pesan Positif Positif TP barang suka 5 sepatu keren Positif Negatif FN 6 sepatu keren Positif Negatif FN cocok anak 7 barang sesuai gambar sepatu bagus jahit rapi keren Positif Positif 8 ukuran tidak Negatif Negatif TN sesuai sepatu kecil ukur kecewa berat 9 kecewa beda warna Negatif Positif FP Dengan menggunakan skema validasi 5-fold cross validation, pada tabel 8 dan 9 ditampilkan jumlah data training yang dikategorikan ke dalam TP, TN, FP, dan FN untuk data ulasan_1 dan ulasan_2 Tabel 8. Hasil validasi 5-fold CV data training ulasan_1 Fold TP TN FP FN Fold Fold Fold Fold Fold Rata- Rata 556, 2 379, 8 71, 4 58, 2 Tabel 9. Hasil validasi 5-fold CV data testing ulasan_1 Fold TP TN FP FN Fold Fold Fold Fold Fold rata- Rata ,2 18,6 15,6 Selanjutnya hasil rata-rata data training ada tabel 8 dimasukkan pada tabel 10 untuk menentukan rata-rata keseluruhan antara untuk data ulasan_1. Pada tabel 10, rata-rata True Positive (TP) pada data latih (training) sebanyak 556, 20 data, TP pada uji (testing) sebanyak 138 data. Selanjutnya rata-rata TP untuk data ulasan_1 adalah sebesar 347,1 data, rata-rata TN untuk data ulasan_1 adalah 237 data. Tabel 10. Confusin matrix pengujian data ulasan_1 TP TN FP FN Training 556,2 379,8 71,4 58,2 Testing ,2 18,6 15,6 Ratarata 347, ,9 15

8 Pada tabel 11, rata-rata True Positive (TP) sebanyak 383,400 data, rata-rata True Negative (TN) sebanyak 118,000 data, ratarata False Positive (FP) sebanyak 39,000 data, dan rata-rata False Negative (FN) sebanyak 0,600 data. Tabel 11. Confusin matrix pengujian data ulasan_2 Training Testing Rata- Rata TP TN FP FN 613,60 189,40 61,80 0, ,20 16,20 0, , ,40 118,00 39,00 0, Pengujian Performa klasifikasi Pada tabel 12 ditampilkan performa klasifikasi data tidak seimbang dengan SMOTE. Kemudian hasil klasifikasi tersebut dibandingkan dengan ADA, RUS dan SMOTEBagging. Pada data ulasan_1, SMOTE lebih baik dibandingkan dengan metode lain dari sisi Accuracy dan F-Measure, sementara nilai G- Mean lebih baik pada metode ADA. Pada data ulasan_2, kinerja SMOTE lebih baik daripada ke tiga motode lain, baik accuracy, G-mean maupun F-Measure. Tabel 12. Performa klasifikasi ulasan_1 Ada RUS SMOT E Baggin g SMOT E Accurac y 86,33 % 86,65 % 87,01% 87,34 % G-Mean 87, 33% 87,03 % 77,58% 84,90% F- 86,65 87,57 85,01% 89,51 Measure % % % Performa 13. Klasifikasi ulasan_2 Ada RUS SMOTE bagging SMOTE Accuracy 92,20% 80,07% 89,47% 92,55% G-Mean 85,68% 84,21% 80,09% 86,37% F- Measure 94,79% 83,80% 93,08% 95,01% 5 KESIMPULAN Pada penelitiaan ini dilakukan analisis sentimen dan text mining pada ulasan produk. Data ulasan produk yang dikumpulkan kemudian dibagi menjadi tiga data yaitu ulasan_1, ulasan_2, Ketiga data ulasan tersebut memiliki tingkat ketidak seimbangan kelas yang berbeda yaitu 1, 36 dan 2, 44. Dengan menerapkan pengujian pada dua jenis data sentimen yan berbeda diperoleh hasil bahwa SMOTE dapat bekerja dengan baik pada data ulasan tidak seimbang. Performa SMOTE dibandingkan dengan metode ADA, RUS dan SMOTEBagging. Hasil klasifiasi sentimen menggunakan SMOTE lebih baik dari ketiga metode yang lain. REFERENSI [1]. Adriani, M., Asian, J., Nazief, B., Tahaghoghi, S.M., Williams, H.E., Stemming Indonesian: A confix-stripping approach. ACM Transactions on Asian Language Information Processing (TALIP) 6, [2]. Ali, A., Shamsuddin, S.M., Ralescu, A.L., Classification with class imbalance problem: a review. Int. J. Advance Soft Compu. Appl 7. 16

9 [3]. Amolik, A., Jivane, N., Bhandari, M., Venkatesan, M., Twitter sentiment analysis of movie reviews using machine learning techniques. international Journal of Engineering and Technology 7, 1 7. [4]. Ariska, Y.E., Maharani, W., Mubarok, M.S., n.d. PERINGKASAN REVIEW PRODUK BERBASIS FITUR MENGGUNAKAN SEMANTIC SIMILARITY SCORING DAN SENTENCE CLUSTERING 9. [5]. Fang, X., Zhan, J., Sentiment analysis using product review data. Journal of Big Data 2, 5. [6]. Gu, Q., Wang, X.-M., Wu, Z., Ning, B., Xin, C.-S., An improved SMOTE algorithm based on genetic algorithm for imbalanced data classification. J. Dig. Inf. Manag 14, [7]. Isah, H., Trundle, P., Neagu, D., Social media analysis for product safety using text mining and sentiment analysis, in: th UK Workshop on Computational Intelligence (UKCI). IEEE, pp [8]. Karlik, B., Yibre, A., Barış, K., Comprising Feature Selection and Classifier Methods with SMOTE for Prediction of Male Infertility. [9]. Kothandan, R., Handling class imbalance problem in mirna dataset associated with cancer. Bioinformation 11, [10]. Kumar, L., Bhatia, P.K., Text Mining: Concepts, Process and Applications. Journal of Global Research in Computer Science 4, [11]. Last, F., Douzas, G., Bacao, F., Oversampling for Imbalanced Learning Based on K-Means and SMOTE. arxiv preprint arxiv: [12]. Li, C., Liu, S., n.d. A comparative study of the class imbalance problem in Twitter spam detection. Concurrency Computat: Pract Exper n/a-n/a. [13]. M, C.C., Karaaslan, E., Colak, C., Arslan, A.K., Erdil, N., Handling imbalanced class problem for the prediction of atrial fibrillation in obese patient. Biomedical Research 28. [14]. Nagamma, P., Pruthvi, H.R., Nisha, K.K., Shwetha, N.H., An improved sentiment analysis of online movie reviews based on clustering for box-office prediction, in: Computing, Communication & Automation (ICCCA), 2015 International Conference On. IEEE, pp [15]. Prachuabsupakij, W., Doungpaisan, P., Matching preprocessing methods for improving the prediction of student s graduation, in: Computer and Communications (ICCC), nd IEEE International Conference On. IEEE, pp [16]. Pruengkarn, R., Wong, K.W., Fung, C.C., Multiclass Imbalanced Classification Using Fuzzy C-Mean and SMOTE with Fuzzy Support Vector Machine, in: Neural Information Processing, Lecture Notes in Computer Science. Presented at the International Conference on Neural Information 17

10 Processing, Springer, Cham, pp _7 [17]. Soni, R., Mathai, K.J., Effective sentiment analysis of a launched product using clustering and decision trees. International Journal of Innovative Research in Computer and Communication Engineering 4. [18]. Tala, F.Z., A study of stemming effects on information retrieval in Bahasa Indonesia. Institute for Logic, Language and Computation, Universiteit van Amsterdam, The Netherlands. [19]. Wu, Q., Ye, Y., Zhang, H., Ng, M.K., Ho, S.-S., ForesTexter: An efficient random forest algorithm for imbalanced text categorization. Knowledge-Based Systems 67,

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Yusra 1, Dhita Olivita 2, Yelfi Vitriani 3 1,2,3 Jurusan Teknik

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION Hamsir Saleh Hamsir.saleh@gmail.com Fakultas Ilmu Komputer Universitas Ichsan Gorontalo Abstrak Memprediksi kebangkrutan

Lebih terperinci

Bandung, Indonesia Bandung, Indonesia

Bandung, Indonesia Bandung, Indonesia ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6353 Analisis dan Implementasi Pengklasifikasian Pesan Singkat pada Penyaringan SMS Spam Menggunakan Algoritma Multinomial Naïve

Lebih terperinci

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA

PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA PERBANDINGAN ALGORITMA STEMMING PADATEKS BAHASA INDONESIA Sigit Prasetyo Karisma Utomo 1, Ema Utami 2, Andi Sunyoto 3 1,2,3 Magister Teknik Informatika STMIK AmikomYogyakarta e-mail: 1 aku@sigitt.com,

Lebih terperinci

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA Prawidya Destarianto 1, Wahyu Kurnia Dewanto 2, Hermawan Arief Putranto 3 1,2,3 Jurusan, Teknologi

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Achmad Ridok 1), Retnani Latifah 2) Filkom

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017 Analisis Perbandingan Metode Over-Sampling Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADSYN-kNN) untuk Data dengan Fitur Nominal-Multi Categories Sri Rahayu 1, Teguh Bharata Adji

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4725 Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel Handling Imbalanced Data

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Setiap siswa di dalam kelas memiliki karakteristik diri yang berbeda beda, seperti : jujur, empati, sopan, menghargai dan sebagainya. Karakteristik diri tersebut berperan

Lebih terperinci

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE Jurnal Informatika Polinema ISSN: 2407-070X IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE Faisal Rahutomo 1, Pramana Yoga Saputra 2, Miftahul Agtamas

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE

ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE SENTIMENT ANALYSIS ON THE ENGLISH BOOK REVIEWS USING INFORMATION GAIN AND SUPPORT VECTOR MACHINE

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET

IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER DALAM KLASIFIKASI USER BERDASARKAN TWEET TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang

Lebih terperinci

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Metode Klasifikasi Data Mining dan Teknik Sampling Smote... METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Hairani

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

Gambar 1.1 Proses Text Mining [7]

Gambar 1.1 Proses Text Mining [7] 1. BAB II LANDASAN TEORI 2.1 Text Mining Text mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat

Lebih terperinci

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama

Lebih terperinci

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala Metode Klasifikasi (SVM Light dan K-NNK NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech Jurusan Informatika FMIPA Universitas Syiah Kuala www.informatika.unsyiah.ac.id/tfa Alur dan Proses Cleaning Process Dokumen

Lebih terperinci

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com

Lebih terperinci

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan

Lebih terperinci

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE

ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE DRAFT JURNAL ANALISIS SENTIMEN PADA TWITTER TERHADAP JASA TRANSPORTASI ONLINE DI INDONESIA DENGAN METODE SUPPORT VECTOR MECHINE SENTIMENT ANALYSIS FOR TWITTER ABOUT ONLINE INDONESIAN TRANSPORTATION WITH

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal

Lebih terperinci

Klasifikasi Dokumen Tumbuhan Obat Menggunakan Metode Improved k-nearest Neighbor

Klasifikasi Dokumen Tumbuhan Obat Menggunakan Metode Improved k-nearest Neighbor Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 2, Februari 2018, hlm. 486-492 http://j-ptiik.ub.ac.id Klasifikasi Dokumen Tumbuhan Obat Menggunakan Metode Improved

Lebih terperinci

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine.

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine. ABSTRAK Klasifikasi dalam data mining adalah proses untuk menemukan model atau fungsi yang mendeskripsikan dan membedakan kelas-kelas data atau konsep. Salah satu permasalahan klasifikasi adalah distribusi

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED

ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED ISSN : 2355-9365 e-proceeding of Engineering : Vol.3, No.2 Agustus 2016 Page 3654 ANALISIS KLASIFIKASI SENTIMEN LEVEL ASPEK MENGGUNAKAN PENDEKATAN PEMBELAJARAN SUPERVISED ASPECT LEVEL SENTIMENT CLASSIFICATION

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Situs belanja online sering disebut juga dengan situs e-commerce yaitu suatu proses membeli dan menjual produk-produk secara elektronik oleh konsumen dan dari perusahaan

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

BAB I PENDAHULUAN.

BAB I PENDAHULUAN. BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini smartphone telah berevolusi menjadi komputer pribadi kecil dan portabel yang memungkinkan pengguna untuk melakukan penjelajahan internet, mengirim e-mail

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Penelitian terdahulu sangat penting bagi penulis untuk mengetahui referensi dan hubungan antara penelitian terdahulu dengan penelitian yang dilakukan saat ini, sehingga hal duplikasi

Lebih terperinci

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN: ANALISA MODEL SUPPORT VECTOR MACHINE TEXTMINING PADA KOMENTAR POSITIF DAN NEGATIF UNTUK REVIEW PERBANDINGAN WHATSAPP VS BBM Agus darmawan 1, Syamsiah 2 Program Studi Teknik Informatika, Universitas Indraprasta

Lebih terperinci

Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk Spam Filtering

Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk  Spam Filtering Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk E-mail Spam Filtering Proposal Tugas Akhir KBK: Rekayasa Perangkat Lunak dan Data (RPLD) Moh. Mahsus 113060088

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM ABSTRAK

PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM  ABSTRAK J~ICON, Vol. 3 No. 2, Oktober 2015, pp. 106 ~ 112 106 PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM E-MAIL Tince Etlin Tallo 1, Bertha S. Djahi 2, Yulianto T. Polly 3 1,2,3 Jurusan Ilmu

Lebih terperinci

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 12, Desember 2017, hlm. 1725-1732 http://j-ptiik.ub.ac.id Analisis Sentimen Tingkat Kepuasan Pengguna Penyedia Layanan

Lebih terperinci

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

LAPORAN TUGAS AKHIR. Disusun oleh: Franky LAPORAN TUGAS AKHIR Analisis Sentimen Menggunakan Metode Naive Bayes, Maximum Entropy, dan Support Vector Machine pada Dokumen Berbahasa Inggris dan Dokumen Berbahasa Indonesia Hasil Penerjemahan Otomatis

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kehadiran teknologi web yang interaktif telah merubah cara orang mengekspresikan pandangan dan opininya. Saat ini pengguna dapat menulis ulasan suatu produk pada situs

Lebih terperinci

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah Bab 1 PENDAHULUAN 1.1 Latar Belakang Masalah Semakin hari semakin banyak inovasi, perkembangan, dan temuan-temuan yang terkait dengan bidang Teknologi Informasi dan Komputer. Hal ini menyebabkan semakin

Lebih terperinci

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM Lusianto Marga Nugraha¹, Arie Ardiyanti Suryani², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Stemming

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

KOMPARASI FITUR SELEKSI PADA ALGORITMA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN REVIEW

KOMPARASI FITUR SELEKSI PADA ALGORITMA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN REVIEW INFORMATIKA, Vol.3 September 2016, pp. 191~199 ISSN: 2355-6579 E-ISSN: 2528-2247 191 KOMPARASI FITUR SELEKSI PADA ALGORITMA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN REVIEW ABSTRAK The main problem

Lebih terperinci

Jurnal Evolusi Volume 4 Nomor lppm3.bsi.ac.id/jurnal

Jurnal Evolusi Volume 4 Nomor lppm3.bsi.ac.id/jurnal Penerapan Algoritma Genetika Untuk Seleksi Fitur Pada Analisis Sentimen Review Jasa Maskapai Penerbangan Menggunakan Naive Bayes Risa Wati Program Studi Manajemen Informatika, AMIK BSI Tasikmalaya risawati06@gmail.com

Lebih terperinci

PERBANDINGAN KINERJA ALGORITME C4.5 DAN NAÏVE BAYES MENGKLASIFIKASI PENYAKIT DIABETES

PERBANDINGAN KINERJA ALGORITME C4.5 DAN NAÏVE BAYES MENGKLASIFIKASI PENYAKIT DIABETES PERBANDINGAN KINERJA ALGORITME C4.5 DAN NAÏVE BAYES MENGKLASIFIKASI PENYAKIT DIABETES Hendra Marcos 1, Hengky Setiawan Utomo 2 1,2 Program Studi Teknik Informatika, STMIK Amikom Purwokerto Jl. Pol. Soemarto

Lebih terperinci

IMPLEMENTASI TEKNIK SELEKSI FITUR INFORMATION GAIN PADA ALGORITMA KLASIFIKASI MACHINE LEARNING UNTUK PREDIKSI PERFORMA AKADEMIK SISWA

IMPLEMENTASI TEKNIK SELEKSI FITUR INFORMATION GAIN PADA ALGORITMA KLASIFIKASI MACHINE LEARNING UNTUK PREDIKSI PERFORMA AKADEMIK SISWA IMPLEMENTASI TEKNIK SELEKSI FITUR INFORMATION GAIN PADA ALGORITMA KLASIFIKASI MACHINE LEARNING UNTUK PREDIKSI PERFORMA AKADEMIK SISWA Betha Nurina Sari 1) 1) Informatika, Fakultas Ilmu Komputer, Universitas

Lebih terperinci

FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP)

FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP) FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP) Ratna Pertiwi¹, Deni Saepudin², Intan Nurma Yulita³ ¹Teknik Informatika,, Universitas Telkom Abstrak Berkembangnya

Lebih terperinci

Journal Speed Sentra Penelitian Engineering dan Edukasi Volume 8 No

Journal Speed Sentra Penelitian Engineering dan Edukasi Volume 8 No Komparasi Metode K-Nearest Neighbors dan Support Vector Machine Pada Sentiment Analysis Review Kamera Rizki Aulianita Program Studi Sistem Informasi, STMIK Nusa Mandiri rizki.rzk@nusamandiri.ac.id Abstract

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi internet memunculkan berbagai metode komunikasi yang mudah, murah, dan cepat. Salah satu media yang paling populer dan sangat cepat berkembang

Lebih terperinci

KOMPARASI FITUR SELEKSI PADA ALGORITMA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN REVIEW

KOMPARASI FITUR SELEKSI PADA ALGORITMA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN REVIEW INFORMATIKA, Vol.3 September 2016, pp. 191~199 ISSN: 2355-6579 E-ISSN: 2528-2247 191 KOMPARASI FITUR SELEKSI PADA ALGORITMA SUPPORT VECTOR MACHINE UNTUK ANALISIS SENTIMEN REVIEW Yoseph Tajul Arifin STMIK

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, 233-240 233 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Prediksi Ketepatan Waktu Lulus Mahasiswa dengan k- Nearest Neighbor dan Naïve Bayes

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI Aulia Essra (1), Rahmadani (2), Safriadi (3) Magister Teknik Informatika, Universitas Sumatera Utara Jl. Universitas No.24A

Lebih terperinci

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor PENGENALAN KADAR TOTAL PADAT TERLARUT PADA BUAH BELIMBING BERDASAR CITRA RED-GREEN-BLUE MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS (PCA) SEBAGAI EKSTRAKSI CIRI DAN KLASIFIKASI K-NEAREST NEIGHBORHOOD (KNN)

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil Penelitian 4.1.1 Support Vector Machines (SVM) Setelah melalui proses training dan testing dengan metode Support Vector Machines (SVM), diperoleh hasil yang tertera

Lebih terperinci

Komparasi Algoritma Support Vector Machine, Naïve Bayes Dan C4.5 Untuk Klasifikasi SMS

Komparasi Algoritma Support Vector Machine, Naïve Bayes Dan C4.5 Untuk Klasifikasi SMS Vol.2 No.2, November 2017, pp. 7~13 ISSN: 2527-449X E-ISSN: 2549-7421 7 Komparasi Algoritma Support Machine, Naïve Dan C4.5 Untuk Klasifikasi SMS Retno Sari STMIK Nusa Mandiri e-mail: bee.retno@gmail.com

Lebih terperinci

ANALISIS SENTIMEN PADA REVIEW RESTORAN DENGAN TEKS BAHASA INDONESIA MENGUNAKAN ALGORITMA NAIVE BAYES

ANALISIS SENTIMEN PADA REVIEW RESTORAN DENGAN TEKS BAHASA INDONESIA MENGUNAKAN ALGORITMA NAIVE BAYES ANALISIS SENTIMEN PADA REVIEW RESTORAN DENGAN TEKS BAHASA INDONESIA MENGUNAKAN ALGORITMA NAIVE BAYES Dinda Ayu Muthia Program Studi Manajemen Informatika Akademi Manajemen Informatika dan Komputer Bina

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

Analisis Sentimen Menggunakan Lexicalized-Hidden Markov Model(L-HMM)

Analisis Sentimen Menggunakan Lexicalized-Hidden Markov Model(L-HMM) Analisis Sentimen Menggunakan Lexicalized-Hidden Markov Model(L-HMM) Virani Kartika Satrioputri 1, Warih Maharani 2, Jondri 3 Abstrak Saat ini semakin banyak produsen yang menawarkan produknya melalui

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini, microblogging menjadi sangat popular untuk alat komunikasi antara pengguna internet. Setiap hari jutaan pesan muncul di website penyedia microblogging diantaranya

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan

Lebih terperinci

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED Studi Kasus Perilaku Seksual Remaja di Indonesia Hasil SDKI 2012 Yogo Aryo Jatmiko 1, Septiadi Padmadisastra 2, Anna Chadidjah 3 Prodi

Lebih terperinci

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan 1 BAB I PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan media sosial menawarkan pengguna kesempatan untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan tidak lagi memiliki

Lebih terperinci

Optimasi Naïve Bayes Dengan Pemilihan Fitur Dan Pembobotan Gain Ratio

Optimasi Naïve Bayes Dengan Pemilihan Fitur Dan Pembobotan Gain Ratio Optimasi Naïve Bayes Dengan Pemilihan Fitur Dan Pembobotan Gain Ratio I. Gusti. A. Socrates 1, Afrizal L. Akbar 2, M. Sonhaji Akbar 3 Teknik Informatika, Institut Teknologi Sepuluh Nopember, Surabaya,

Lebih terperinci

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Analisa Masalah Pemilihan dosen pembimbing Tugas Akhir pada jurusan Teknik Informatika Universitas Muhammadiyah Malang dilakukan mahasiswa secara mandiri, hal

Lebih terperinci

ANALISIS SENTIMEN PADA DATA ULASAN PRODUK TOKO ONLINE DENGAN METODE MAXIMUM ENTROPY

ANALISIS SENTIMEN PADA DATA ULASAN PRODUK TOKO ONLINE DENGAN METODE MAXIMUM ENTROPY ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4632 ANALISIS SENTIMEN PADA DATA ULASAN PRODUK TOKO ONLINE DENGAN METODE MAXIMUM ENTROPY SENTIMENT ANALYSIS ON ONLINE STORE

Lebih terperinci

ANALISIS SENTIMEN DATA KRITIK DAN SARAN PELATIHAN APLIKASI TEKNOLOGI INFORMASI (PATI) MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

ANALISIS SENTIMEN DATA KRITIK DAN SARAN PELATIHAN APLIKASI TEKNOLOGI INFORMASI (PATI) MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE ANALISIS SENTIMEN DATA KRITIK DAN SARAN PELATIHAN APLIKASI TEKNOLOGI INFORMASI (PATI) MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE LAPORAN TUGAS AKHIR Diajukan untuk Memenuhi Persyaratan Guna Meraih Gelar

Lebih terperinci

IDENTIFIKASI PARAFRASA BAHASA INDONESIA MENGGUNAKAN NAÏVE BAYES

IDENTIFIKASI PARAFRASA BAHASA INDONESIA MENGGUNAKAN NAÏVE BAYES ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4978 IDENTIFIKASI PARAFRASA BAHASA INDONESIA MENGGUNAKAN NAÏVE BAYES Bayu Indrawarman Julianto 1, Adiwijaya 3, Mohamad Syahrul

Lebih terperinci

Jurnal Evolusi Volume 4 Nomor lppm3.bsi.ac.id/jurnal

Jurnal Evolusi Volume 4 Nomor lppm3.bsi.ac.id/jurnal Penerapan Algoritma Genetika Untuk Seleksi Fitur Pada Analisis Sentimen Review Jasa Maskapai Penerbangan Menggunakan Naive Bayes Risa Wati Program Studi Manajemen Informatika, AMIK BSI Tasikmalaya risawati06@gmail.com

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Seiring berkembangnya teknologi informasi, kebutuhan akan informasi yang digunakan untuk mendukung business intelligent suatu perusahaan juga meningkat. Informasi penting

Lebih terperinci

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh :

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh : ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI Oleh : Frista Yulianora 1401128832 Muchammad Hasbi Latif 1401136065 Rika Jubel Febriana

Lebih terperinci

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR Erik Hardiyanto 1), Faisal Rahutomo 1) 1 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu

Lebih terperinci

MULTINOMIAL NAÏVE BAYES CLASSIFIER UNTUK MENENTUKAN REVIEW POSITIF ATAU NEGATIF PELANGGAN WEBSITE PENJUALAN

MULTINOMIAL NAÏVE BAYES CLASSIFIER UNTUK MENENTUKAN REVIEW POSITIF ATAU NEGATIF PELANGGAN WEBSITE PENJUALAN MULTINOMIAL NAÏVE BAYES CLASSIFIER UNTUK MENENTUKAN REVIEW POSITIF ATAU NEGATIF PELANGGAN WEBSITE PENJUALAN Devi Dwi Purwanto dan Joan Santoso Sistem Informasi Sekolah Tinggi Teknik Surabaya devi@stts.edu

Lebih terperinci

Uji Perbandingan Akurasi Analisis Sentimen Pariwisata menggunakan Algoritma Support Vektor Machine dan Naive Bayes

Uji Perbandingan Akurasi Analisis Sentimen Pariwisata menggunakan Algoritma Support Vektor Machine dan Naive Bayes Uji Perbandingan Akurasi Analisis Sentimen Pariwisata menggunakan Algoritma Support Vektor Machine dan Naive Bayes Tesis Diajukan kepada Fakultas Teknologi Informasi Untuk Memperoleh Gelar Master of Computer

Lebih terperinci