PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM ABSTRAK
|
|
- Ratna Hadiman
- 6 tahun lalu
- Tontonan:
Transkripsi
1 J~ICON, Vol. 3 No. 2, Oktober 2015, pp. 106 ~ PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM Tince Etlin Tallo 1, Bertha S. Djahi 2, Yulianto T. Polly 3 1,2,3 Jurusan Ilmu Komputer, Fakultas Sains dan Teknik, Universitas Nusa Cendana ABSTRAK Spam adalah yang tidak diinginkan yang dikirim secara otomatis kepada ribuan penerima oleh pihak-pihak tertentu yang dapat berisi promosi produk atau jasa, pornografi, virus, dan kontenkonten yang tidak penting. Dalam penelitian ini diusulkan penggunaan multinomial naïve bayes untuk pengklasifikasian . Fokus penelitian ini terdapat pada penggunaan mutual information untuk mengurangi dimensi fitur dari . Hasil pengujian menunjukkan bahwa penggunaan mutual information mampu memperbaiki performansi dari multinomial naïve bayes dari fitur dengan akurasi % menjadi fitur dengan akurasi %. Kata Kunci : Klasifikasi, Spam , Naïve Bayes, Mutual Information ABSTRACT Spam s are unsolicited s that are sent to recipients automatically by certain parties that include the promotion of products or services, pornography items, viruses and various unimportant contents. In this study we proposed the use of multinomial naïve bayes for spam classification. This study focuses on the use of mutual information to reduce feature dimension of the . The experiment results showed that mutual information able to improve the performance of multinomial naïve bayes classifier with (number of features) and % (accuracy) to 6000 (number of features) and % (accuracy). Keyword: Classification, Spam , Naïve Bayes, Mutual Information. I. PENDAHULUAN Spam merupakan yang tidak diinginkan yang dikirim secara otomatis. Spam e- mail biasanya dikirimkan kepada ribuan penerima (recipient) oleh pihak-pihak tertentu yang dapat berisi promosi produk atau jasa, hal-hal yang berbau pornografi, virus, dan konten-konten yang tidak penting. Hal ini menyebabkan semakin padatnya queue atau antrian dari mail server yang digunakan, banyak waktu yang diperlukan untuk menghapus spam dari inbox, terbuangnya bandwith serta dapat menyebabkan penerima dibawah umur mengakses situs-situs yang tidak seharusnya. Oleh karena fasilitas yang murah dan kemudahan untuk mengirimkan pesan kepada sejumlah penerima, maka penyebaran spam menjadi tidak terkontrol. Untuk mengatasi masalah ini diperlukan suatu filter, salah satunya adalah klasifikasi, yang dapat memisahkan spam dan bukan spam . Naive bayes merupakan metode statistik yang sederhana dan memiliki akurasi yang baik dalam proses pengklasifikasian. Naïve bayes disebut juga multinomial naïve bayes merupakan model penyederhanaan dari algoritma bayes yang cocok dalam pengklasifikasian teks atau dokumen. Dalam klasifikasi menggunakan naïve bayes, nilai kategori dari suatu dokumen akan ditentukan berdasarkan fitur yang muncul dalam dokumen yang akan diklasifikasikan. Sebelum masuk dalam tahap pengklasifikasian akan dilakukan tahap pre-processing terhadap dokumen yang terdapat dalam dataset. Tahap pre-processing dilakukan untuk mengidentifikasi kata unik dalam seluruh dokumen yang dipilih seperti lemmatisasi, eliminasi stopword dan punctuation untuk memilih fitur atau kata kunci sebagai vocabulary. Proses ini dinamakan feature selection yang dilakukan untuk membantu mengeliminasi kata-kata yang dianggap tidak penting atau tidak menggambarkan isi dokumen berdasarkan frekuensi kemunculan kata tersebut, mengurangi ISSN
2 107 ISSN noise dan untuk mengurangi dimensi dari suatu kumpulan teks (reduksi dimensionalitas). Reduksi dimensionalitas dapat memberikan model yang lebih mudah dimengerti karena melibatkan lebih sedikit atribut, waktu dan memory sehingga dapat mengurangi dimensi dari dataset. Di dalam feature selection terdapat metode mutual information yang akan digunakan dalam penelitian ini. Dalam beberapa penelitian menunjukkan bahwa mutual information digunakan untuk mengukur berapa banyak informasi (presence/absence) sebuah fitur berkontribusi dalam sebuah pengklasifikasian. Oleh karena itu dilakukan penelitian tentang klasifikasi spam menggunakan metode multinomial naïve bayes yang diharapkan dapat menjadi alat bantu (filter) dalam mengklasifikasikan spam sehingga dapat membantu user dalam mengatasi masalah yang berkaitan dengan spam . II. MATERI DAN METODE 2.1 Definisi Klasifikasi Teks Klasifikasi atau kategorisasi teks adalah proses penempatan suatu dokumen ke suatu kategori atau class sesuai dengan karakteristik dari dokumen tersebut. Dalam text mining, klasifikasi mengacu kepada aktifitas menganalisis atau mempelajari himpunan dokumen teks pre-classified untuk memperoleh suatu model atau fungsi yang dapat digunakan untuk mengelompokkan dokumen teks lain yang belum diketahui class-nya ke dalam satu atau lebih class pre-defined tersebut. Proses klasifikasi teks dapat dibagi ke dalam dua fase, yaitu fase information retrieval (IR) yakni untuk mendapatkan data numerik dari dokumen teks dan fase klasifikasi utama yakni dimana suatu algoritma memroses data numerik di atas untuk memutuskan ke kategori mana teks baru (bukan contoh) ditempatkan [1]. Gambaran umum klasifikasi teks dapat dilihat pada Gambar Corpus Gambar 1. Gambaran umum klasifikasi teks (Mahinovs, Tiwari 2007) Corpus didefinisikan sebagai kumpulan sistematis teks alami termasuk bahasa lisan maupun tertulis dimana struktur dan isi dari corpus mengikuti prinsip-prinsip linguistik tertentu [3]. Corpus yang digunakan dalam penelitian ini adalah corpus Lingspam yang terdiri dari 2893 pesan yang terdiri dari 2412 Ham (bukan spam) messages dan 481 spam messages. 2.3 Klasifikasi menggunakan Naïve Bayes Algoritma ini memanfaatkan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes. Dalam naïve bayes, kemungkinan dokumen d berada di class c dihitung sebagai berikut [2] : P c d P c P(t k c) 1 k n d Keterangan: P c d = prior probability J~ICON, Vol. 3 No. 2, Oktober 2015 : 106 ~112
3 J-ICON ISSN P(t k c =conditional probability Tujuan utama dalam klasifikasi teks adalah menemukan best class untuk sebuah dokumen. Best class dalam naïve bayes adalah yang paling mungkin atau maximum a posteriori (MAP) class c map : c map = argmax c C P c d = argmax c C P(c) P(t k c) 1 k n d Pada Persamaan diatas, banyak conditional probability yang dikalikan, satu untuk masing-masing posisi 1 k n d. Hal ini dapat mengakibatkan masalah underflow atau masalah yang muncul pada dokumen yang memiliki jumlah kata yang sangat besar. Hasil perkalian dari nilai-nilai conditional probability dari seluruh kata yang berjumlah sangat besar akan membuat variabel score bernilai sangat kecil. Nilai score yang sangat kecil dapat menimbulkan kesalahan saat dilakukan proses perbandingan. Oleh karena itu, lebih baik untuk melakukan perhitungan dengan menambahkan logaritma probabilitas daripada mengalikan probabilitas. Class dengan nilai probabilitas tertinggi masih yang paling mungkin. Oleh karena itu maksimalisasi yang sebenarnya dilakukan dalam kebanyakan implementasi dari naïve bayes adalah: c map = arg max c C [log P(c) + log P(t k c)] Keterangan: 1 k n d P = N c N N c = dokumen yang berada di class c N = jumlah dokumen Diperkirakan conditional probability P(t c) sebagai frekuensi relatif dari fitur t dalam dokumendokumen di class c dapat dihitung dengan persamaan: P(t c) = T ct + 1 T ct + 1 t V = T ct + 1 ( T ct ) + B t V Keterangan: B = V adalah jumlah fitur dalam vocabulary 2.4 Feature Selection menggunakan Mutual Information Di dalam proses klasifikasi menggunakan multinomial naïve bayes, akan dilakukan terlebih dahulu pre-processing (tokenisasi) dan feature selection menggunakan mutual information. Feature selection adalah suatu kegiatan yang umumnya dilakukan dalam preprocessing dan bertujuan untuk memilih fitur yang berpengaruh dan mengesampingkan fitur yang tidak berpengaruh dalam suatu kegiatan pemodelan atau analisa data [2]. Mutual information mengukur seberapa banyak informasi presence/absence dari sebuah fitur yang memberikan kontribusi untuk membuat keputusan klasifikasi yang benar di class tertentu. Secara umum persamaan mutual information dapat dinyatakan sebagai berikut [2] : NN 11 NN 01 NN 10 NN 00 I U; C = N 11 N log 2 + N 01 N 1. N.1 N log 2 + N 10 N 0. N.1 N log 2 + N 00 N 1. N.0 N log 2 N 0. N.0 dimana Ns adalah jumlah dokumen yang mempunyai nilai e t dan e c yang ditunjukkan oleh dua subscript. Sebagai contoh, N 10 adalah jumlah dokumen yang mengandung t (e t = 1) dan tidak termasuk dalam c (e c = 0). N 1. = N 10 + N 11 adalah jumlah dokumen yang Penggunaan Metode Multinomial Naïve Bayes Pada Klasifikasi Spam (Tince E. Tallo)
4 AKTUAL 109 ISSN mengandung t (e t = 1) dan kita menghitung dokumen independen dari keanggotaan class (e c {0, 1}). Jumlah total dokumen adalah N = N 00 + N 01 + N 10 + N Kriteria Evaluasi Untuk permasalahan dalam binary classification, kriteria evaluasi yang biasa digunakan adalah precision, recall dan accuracy [4] dan juga menggunakan F1-Measure. CLASSIFIER bukan spam spam bukan spam a b spam c d Rumus precision adalah: Precision = d b+d 100% Rumus recall adalah: Recall = d c+d 100% Rumus Accuracy adalah: Accuracy = a+d total 100% Rumus menghitung F1-measure adalah: F 1 = 2 Precision Recall Precision +Recall III. HASIL DAN PEMBAHASAN 3.1 Pengujian Pengujian dilakukan untuk mengevaluasi hasil klasifikasi spam menggunakan naïve bayes dan membandingkan model yang dibangun hanya menggunakan metode naïve bayes dengan model yang menggunakan mutual information sebagai metode feature selection. Pengujian ini dilakukan untuk mengetahui pengaruh dari penggunaan mutual information yang dapat mereduksi fitur sehingga lebih efisien dalam hal penggunaan memory dan waktu klasifikasi. 3.2 Hasil Pengujian 1 Gambar 2 merupakan hasil pengujian terhadap model klasifikasi yang dibangun menggunakan metode naïve bayes (tanpa mutual information). Dari Gambar 5.1 dapat dilihat jumlah true positive sebanyak 47, true negative sebanyak 240, sedangkan false positive dan false negative berjumlah 1. Untuk parameter seperti F1 measure bernilai 0.979, accuracy %, precision 0.979%, dan recall 0.979%. J~ICON, Vol. 3 No. 2, Oktober 2015 : 106 ~112
5 J-ICON ISSN Hasil Pengujian 2 Gambar 2. Hasil pengujian dengan naïve bayes Tabel 1 merupakan hasil pengujian 2 (eksperimen 1), yang dilakukan dengan jumlah fitur yang berbeda-beda serta parameter yang digunakan seperti pada hasil pengujian. Hasil pengujian menunjukkan bahwa nilai dari parameter precision, recall dan accuracy serta nilai true positive, true negative, false positive dan false negative cenderung identik untuk jumlah fitur , namun parameter-parameter tersebut memiliki nilai yang berbeda untuk jumlah fitur yang lebih kecil dari Untuk mengetahui jumlah fitur yang paling baik maka dilakukan pengujian kembali namun difokuskan pada jumlah fitur yang lebih kecil dari misalnya 5000, 6000, 7000, 8000, Hasil pengujian tersebut tampak pada Tabel 2 (eksperimen 2). Tabel 1. Hasil pengujian 2 eksperimen 1 No Jumlah Fitur Precision Recall F1 Measure Accuracy (%) (TP) (TN) (FP) (FN) Tabel 1. Hasil pengujian 2 eksperimen 2 No Jumlah Fitur Precision Recall F1 Measure Accuracy (%) (TP) (TN) (FP) (FN) Penggunaan Metode Multinomial Naïve Bayes Pada Klasifikasi Spam (Tince E. Tallo)
6 111 ISSN Analisis Hasil Pengujian Berdasarkan hasil pengujian (Gambar 3) yang dilakukan maka dapat diketahui jumlah fitur yang paling baik dalam pengklasifikasian ini adalah fitur karena jumlah fitur yg lebih kecil (5.000 fitur) memiliki hasil yang kurang baik sedangkan jumlah fitur yang lebih besar ( ) memiliki hasil klasifikasi yang hampir sama dengan fitur Gambar 3. Grafik hasil pengujian F1 Measure Accuracy Di dalam hasil pengujian menggunakan fitur ini temukan kasus dua file false positive (5-1218msg1.txt dan 3-442msg1.txt) dan satu file false negative (spmsg125.txt). Untuk kasus false positive (5-1218msg1.txt), fitur-fitur di dalam dokumen tersebut cenderung lebih banyak berada dalam class spam. Hal ini mengakibatkan nilai conditional probability mendominasi nilai keputusan classifier walaupun nilai prior probability-nya lebih rendah dari class bukan spam. Sebaliknya untuk kasus false negative (spmsga125.txt), fitur-fitur di dalam dokumen tersebut cenderung lebih banyak berada dalam class bukan spam. Hal ini mengakibatkan nilai prior probability mendominasi nilai keputusan classifier. IV. KESIMPULAN DAN SARAN 4.1 Kesimpulan Berdasarkan hasil pengujian maka dapat disimpulkan: 1. Multinomial naïve bayes mampu mengklasifikasikan spam dengan akurasi % (tanpa mutual information). 2. Penggunaan mutual information untuk mengurangi dimensi fitur mampu memperbaiki kinerja dari naïve bayes classifier dengan akurasi % dan jumlah fitur terbaik dalam pengklasifikasian adalah jika dibandingkan dengan pemakaian seluruh fitur ( fitur) yang memiliki akurasi yang hampir sama yaitu %. 3. Penggunaan jumlah fitur yang jauh lebih kecil daripada penggunaan seluruh fitur menghasilkan akurasi yang hampir sama dengan menggunakan waktu dan memory yang lebih sedikit. 4.2 Saran Diperlukan adanya penelitian lanjutan pada naïve bayes classifier khususnya dalam hal menangani dataset yang memiliki jumlah data yang tidak seimbang di dalam class (unbalanced data) serta penggunaan dataset berbahasa indonesia agar lebih mudah digunakan oleh pembaca. J~ICON, Vol. 3 No. 2, Oktober 2015 : 106 ~112
7 J-ICON ISSN DAFTAR PUSTAKA [1] Mahinovs, Aigars., Tiwari, Ashutosh., Text classification method review, diakses tanggal 15 september 2013Giarratano J, Riley G., 2005, Expert Sistem: Principle and Programming 4 th Edition, PWS Publishing Company, USA. [2] Manning, Christopher., Raghavan, Prabhakar., dan Schutze, Hinrich., An introduction to information retrieval, diakses tanggal 25 Agustus 2013 [3] Nesselhauf, Nadja., Corpus Linguistics : A Practical Introduction, tical%20introduction.pdf, diakses tanggal 30 November 2013 [4] Sheu, Jyh-jian., An Efficient Two-Phase Spam Filtering Method Based On s Categorization, diakses tanggal 7 Oktober 2013 Penggunaan Metode Multinomial Naïve Bayes Pada Klasifikasi Spam (Tince E. Tallo)
KLASIFIKASI PADA TEXT MINING
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa
Lebih terperinciKLASIFIKASI PADA TEXT MINING
Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision
Lebih terperinci1. Pendahuluan 1.1 Latar Belakang
1. Pendahuluan 1.1 Latar Belakang Teknologi semakin berkembang seiring dengan berjalannya waktu. Disadari atau tidak, sebagian besar kehidupan ini dibantu oleh teknologi dan banyak sekali manfaat yang
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review
Lebih terperinciKLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION
KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
Lebih terperinciBAB III METODOLOGI PENELITIAN. Dataset
BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar
Lebih terperinciPENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI
PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon
Lebih terperinciImplementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen
Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen Elisabeth Adelia Widjojo, Antonius Rachmat C, R. Gunawan Santosa Program Studi Teknik Informatika, Fakultas Teknologi
Lebih terperinciGambar 1.1 Proses Text Mining [7]
1. BAB II LANDASAN TEORI 2.1 Text Mining Text mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN
BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil Penelitian 4.1.1 Support Vector Machines (SVM) Setelah melalui proses training dan testing dengan metode Support Vector Machines (SVM), diperoleh hasil yang tertera
Lebih terperinciBAB III LANDASAN TEORI. Deteksi emosi termasuk salah satu persoalan utama dalam affective computing
BAB III LANDASAN TEORI Permasalahan yang diselesaikan dalam tesis ini adalah deteksi emosi. Deteksi emosi termasuk salah satu persoalan utama dalam affective computing (Calvo & D'Mello, 2010). Bidang penelitian
Lebih terperinciJURNAL TEKNIK ITS Vol. 6, No. 1, (2017) ISSN: ( Print) A-75
JURNAL TEKNIK ITS Vol. 6, No. 1, (2017) ISSN: 2337-3539 (2301-9271 Print) A-75 Pendeteksian Malware pada Lingkungan Aplikasi Web dengan Kategorisasi Dokumen Fransiskus Gusti Ngurah Dwika Setiawan, Royyana
Lebih terperinciKlasifikasi Topik pada Lirik Lagu dengan Metode Multinomial Naïve Bayes
OPEN ACCESS ISSN 2460-3295 socj.telkomuniversity.ac.id/indosc Ind. Symposium on Computing Sept 2016. pp. 139-148 doi:10.21108/indosc.2016.131 Klasifikasi Topik pada Lirik Lagu dengan Metode Multinomial
Lebih terperinciBandung, Indonesia Bandung, Indonesia
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6353 Analisis dan Implementasi Pengklasifikasian Pesan Singkat pada Penyaringan SMS Spam Menggunakan Algoritma Multinomial Naïve
Lebih terperinciProsiding Statistika ISSN:
Prosiding Statistika ISSN: 2460-6456 Klasifikasi Text Mining untuk Terjemahan Ayat-Ayat Al-Qur an menggunakan Metode Klasifikasi Naive Bayes Text Mining Classification for Translation of Al-Qur'an Verses
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN
26 BAB III ANALISIS DAN PERANCANGAN Analisis dan perancangan berfungsi untuk mempermudah, memahami dan menyusun perancangan pada bab selanjutnya, selain itu juga berfungsi untuk memberikan gambaran dan
Lebih terperinciBAB III ANALISA DAN PERANCANGAN SISTEM
3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal
Lebih terperinciBAB II TINJAUAN PUSTAKA
digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan
Lebih terperinciSpam Filtering Dengan Metode Pos Tagger Dan Klasifikasi Naïve Bayes
Jurnal Ilmiah Teknologi dan Informasia ASIA (JITIKA) Vol.10, No.1, Februari 2016 ISSN: 0852-730X Filtering Dengan Metode Pos Tagger Dan Klasifikasi Naïve Bayes Wirawan Nathaniel Chandra 1, Gede Indrawan
Lebih terperinciINDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id
Lebih terperincinegative, false positive, dan false negative seperti yang dapat dilihat pada Tabel 1.
negative, false positive, dan false negative seperti yang dapat dilihat pada Tabel 1. Tabel 1 Tabel kontingensi kelas hasil prediksi dan kelas sebenarnya Kelas Sebenarnya Spam Kelas Prediksi Ham Spam TP
Lebih terperinciBAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
Lebih terperinciANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI
ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI Aulia Essra (1), Rahmadani (2), Safriadi (3) Magister Teknik Informatika, Universitas Sumatera Utara Jl. Universitas No.24A
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Selain sebagai media komunikasi, Twitter memberikan akses bagi pihak ketiga yang ingin mengembangkan aplikasi yang memanfaatkan layanannya melalui Twitter API. Salah
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium
Lebih terperinciNur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK
Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas
Lebih terperinciBAB 3 ANALISIS MASALAH DAN PERANCANGAN
BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk
Lebih terperinciBAB I PENDAHULUAN I-1
BAB I PENDAHULUAN Pada bab pendahuluan ini akan dijelaskan mengenai dasar-dasar dalam pembuatan laporan. Dasar-dasar tersebut terdiri dari latar belakang masalah, rumusan masalah, maksud dan tujuan dilakukan
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah. Informasi merupakan kebutuhan yang sangat penting dalam era
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Informasi merupakan kebutuhan yang sangat penting dalam era globalisasi sekarang ini. Kebutuhan informasi yang cepat dan praktis menjadi tuntutan bagi setiap
Lebih terperinciSMS Filtering Menggunakan Naive Bayes Classifier dan FP-Growth Algorithm Frequent Itemset
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6124 SMS Filtering Menggunakan Naive Bayes Classifier dan FP-Growth Algorithm Frequent Itemset Dea Delvia Arifin 1, Shaufiah,
Lebih terperinciAkurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa
Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :
Lebih terperinciPengukuran Kinerja Spam Filter Menggunakan Bayes Classifier. Bayes Classifier PENDAHULUAN JULIO ADISANTOSO *, WILDAN RAHMAN
Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 2 Nomor 1 halaman 1-8 ISSN: 2089-6026 Pengukuran Kinerja Spam Filter Menggunakan Bayes Classifier Bayes Classifier JULIO ADISANTOSO
Lebih terperinciStemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic
Lebih terperinciBAB V EKSPERIMEN TEXT CLASSIFICATION
BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI Pada bab ini dijelaskan landasan teori dan metode yang digunakan pada tugas akhir ini dalam pengklasifikasian dokumen teks. Pembahasan dimulai dengan penjelasan mengenai klasifikasi
Lebih terperinciFEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP)
FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP) Ratna Pertiwi¹, Deni Saepudin², Intan Nurma Yulita³ ¹Teknik Informatika,, Universitas Telkom Abstrak Berkembangnya
Lebih terperinciHASIL DAN PEMBAHASAN. menggunakan formula (4) dan (5) untuk setiap kelasnya berdasarkan tabel confusion matrix.
yang tidak berarti sebagai pembeda antar dokumen. c. Pembobotan indeks yaitu pembobotan secara lokal dan global. Pembobotan lokal dilakukan dengan cara menghitung frekuensi kemunculan kata dan total seluruh
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Lebih terperinciIDENTIFIKASI PARAFRASA BAHASA INDONESIA MENGGUNAKAN NAÏVE BAYES
ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4978 IDENTIFIKASI PARAFRASA BAHASA INDONESIA MENGGUNAKAN NAÏVE BAYES Bayu Indrawarman Julianto 1, Adiwijaya 3, Mohamad Syahrul
Lebih terperinciJurnal Politeknik Caltex Riau
1 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id IMPLEMENTASI TEXT MINING DALAM KLASIFIKASI JUDUL BUKU PERPUSTAKAAN MENGGUNAKAN METODE NAIVE BAYES Siti Amelia Apriyanti 1), Kartina Diah Kesuma Wardhani
Lebih terperinciKLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK
Lukman Syafie / JUPITER Volume XV No.2 (2016) 109 KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK Lukman Syafie Staf Pengajar Teknik Informatika, Fakultas Ilmu Komputer
Lebih terperinciPenerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes
Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode
Lebih terperinciKlasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram
Jurnal Ilmiah Teknologi dan Informasia ASIA (JITIKA) Vol.10, No.1, Februari 2016 ISSN: 0852-730X Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram Denny Nathaniel
Lebih terperinciANALISIS METODE NAIVE BAYESAN PADA APLIKASI SPAM FILTERING BERBASIS JAVA DESKTOP UNTUK MENGKLASIFIKASIKAN SUREL
ANALISIS METODE NAIVE BAYESAN PADA APLIKASI SPAM FILTERING BERBASIS JAVA DESKTOP UNTUK MENGKLASIFIKASIKAN SUREL Subandi 1, Ahmad Luthfi 2, Zanial Mazalisa 3 Dosen Universitas Bina Darma 1, Mahasiswa Universitas
Lebih terperinciPEMILIHAN FITUR OPTIMAL UNTUK TUGAS AKHIR MAHASISWA DENGAN METODE SUPPORT VECTOR MACHINE
Vol 2, No 3 Juni 2012 ISSN 2088-2130 PEMILIHAN FITUR OPTIMAL UNTUK TUGAS AKHIR MAHASISWA DENGAN METODE SUPPORT VECTOR MACHINE Devie Rosa Anamisa 1), Eka Mala Sari Rochman 2) 1,2 Teknik Informatika, Fakultas
Lebih terperinciKLASIFIKASI DAN ANALISIS SENTIMEN DATA SMS CENTER BUPATI PAMEKASAN MENGGUNAKAN NAÏVE BAYES DENGAN MAD SMOOTHING
ISSN 1858-4667 JURNAL LINK VOL. 25/No. 2/September 2016 KLASIFIKASI DAN ANALISIS SENTIMEN DATA SMS CENTER BUPATI PAMEKASAN MENGGUNAKAN NAÏVE BAYES DENGAN MAD SMOOTHING Badar Said Program Studi Teknik Informatika,
Lebih terperinciSPAM FILTER MENGGUNAKAN MODEL KLASIFIKASI MULTIVARIATE BERNOULLI DAN MULTINOMIAL NAIVE BAYES DENIS FADILLAH
SPAM FILTER MENGGUNAKAN MODEL KLASIFIKASI MULTIVARIATE BERNOULLI DAN MULTINOMIAL NAIVE BAYES DENIS FADILLAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciPERBANDINGAN KINERJA ALGORITMA ID3 DAN C4.5 DALAM KLASIFIKASI SPAM-MAIL
PERBANDINGAN KINERJA ALGORITMA DAN DALAM KLASIFIKASI SPAM-MAIL Sofi Defiyanti Jurusan Sistem Informasi Universitas Gunadarma D. L. Crispina Pardede Sistem Komputer Universitas Gunadarma pardede@staff.gunadarma.ac.id
Lebih terperinciBAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine
BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan
Lebih terperinciPENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE
PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung
Lebih terperinciDIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP
1 DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP Achmad Ramadhan Safutra 1, Dwi Wahyu Prabowo 1 1 Jurusan Sistem Informasi, Fakultas Ilmu Komputer Universitas Darwan
Lebih terperinciImplementasi Algoritma Naive Bayes Classifier dalam Pengklasifikasian Teks Otomatis Pengaduan dan Pelaporan Masyarakat melalui Layanan Call Center 110
19 Implementasi Algoritma Naive Bayes Classifier dalam Pengklasifikasian Teks Otomatis Pengaduan dan Pelaporan Masyarakat melalui Layanan Call Center 110 Fitri Handayani dan Feddy Setio Pribadi Jurusan
Lebih terperinciAnalisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes
Jurnal... Vol. XX, No. X, Bulan 20XX, XX-XX 1 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes Abraham Koroh 1, Kartina Diah
Lebih terperinciKLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR
KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: KHOZINATUL
Lebih terperinciBAB III ANALISA DAN PERANCANGAN SISTEM. Pada bab ini akan dibahas mengenai analisa dan perancangan dari sistem.
17 BAB III ANALISA DAN PERANCANGAN SISTEM Pada bab ini akan dibahas mengenai analisa dan perancangan dari sistem. Analisa system dilakukan untuk menemukan solusi dari permasalahan yang telah diajukan sebelumnya.
Lebih terperinciOnline News Classification Using Multinomial Naive Bayes
Online News Classification Using Multinomial Naive Bayes Amelia Rahman Informatika, Fakultas MIPA Universitas Sebelas Maret Jalan Ir. Sutami 36A Surakarta amelia.rahman@student.uns.ac.id Wiranto Informatika,
Lebih terperinciBAB I PENDAHULUAN. perkembangan teknologi informasi yang memungkinkan data dalam jumlah besar
1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan data mining yang pesat tidak dapat lepas dari perkembangan teknologi informasi yang memungkinkan data dalam jumlah besar terakumulasi. Perkembangan internet
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait Penelitian terkait dengan topik analisis sentimen cukup banyak, berikut beberapa penelitian yang tekait dengan analisa sentimen yang menggunakan seleksi
Lebih terperinciOleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak
TEKNIK DATA MINING MENGGUNAKAN METODE BAYES CLASSIFIER UNTUK OPTIMALISASI PENCARIAN PADA APLIKASI PERPUSTAKAAN (STUDI KASUS : PERPUSTAKAAN UNIVERSITAS PASUNDAN BANDUNG) Oleh : Selvia Lorena Br Ginting,
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini, microblogging menjadi sangat popular untuk alat komunikasi antara pengguna internet. Setiap hari jutaan pesan muncul di website penyedia microblogging diantaranya
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan
Lebih terperinciPENERAPAN DATA MINING UNTUK MENENTUKAN POTENSI HUJAN HARIAN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES
PENERAPAN DATA MINING UNTUK MENENTUKAN POTENSI HUJAN HARIAN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES Ahmad Subhan 1, Ahmad Zainul Fanani 2 1,2 Teknik Informatika, Ilmu Komputer, Universitas Dian Nuswantoro
Lebih terperinciPEMBANGUNAN SPAM FILTERING SYSTEM DENGAN METODE NAIVE BAYESIAN
Makalah Nomor: KNSI-72 PEMBANGUNAN SPAM E-MAIL FILTERING SYSTEM DENGAN METODE NAIVE BAYESIAN Indrastanti R. Widiasari.1, Teguh Indra Bayu 2 1, 2 Fakultas Teknologi Informasi, Universitas Kristen Satya
Lebih terperinciBAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy).
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Pada sekarang ini ketersediaan informasi berbentuk dokumen teks sebagian besar sudah berbentuk elektronik (softcopy). Kemungkinan penyimpanan media teks ke
Lebih terperinciPERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak
ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama
Lebih terperinciSISTEM KLASIFIKASI PENYEBARAN PENYAKIT MATA DI JAWA BARAT DENGAN ALGORITMA ITERATIVE DICHOTOMISER 3 DAN NAÏVE BAYES CLASSIFIER
SISTEM KLASIFIKASI PENYEBARAN PENYAKIT MATA DI JAWA BARAT DENGAN ALGORITMA ITERATIVE DICHOTOMISER 3 DAN NAÏVE BAYES CLASSIFIER Wina Witanti 1*, Dian Nursantika 2, Zillan Taufiq Budiman 3 1,2,3 Program
Lebih terperinciBAB I. Pendahuluan. 1. Latar Belakang Masalah
BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan
Lebih terperinciAplikasi Filtering of Spam Menggunakan Naïve Bayes
Vol.2 No.1, Mei 2017, pp. 53~60 ISSN: 2527-449X E-ISSN: 2549-7421 53 Aplikasi Filtering of Email Menggunakan Naïve Bayes Ratih Yulia Hayuningtyas STMIK Nusa Mandiri Jakarta Ratih.winziy@gmail.com Abstrak
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang Masalah
BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Basis data saat ini sudah berkembang menjadi sangat besar secara cepat ke dalam ukuran terabyte. Di dalam tumpukan data tersebut mungkin terdapat informasiinformasi
Lebih terperinciOPTIMASI NAÏVE BAYES DENGAN PEMILIHAN FITUR DAN PEMBOBOTAN GAIN RATIO
OPTIMASI NAÏVE BAYES DENGAN PEMILIHAN FITUR DAN PEMBOBOTAN GAIN RATIO I. Gusti. A. Socrates ), Afrizal L. Akbar 2), dan M. Sonhaji Akbar 3), 2, 3) Teknik Informatika, Institut Teknologi Sepuluh Nopember
Lebih terperinciPRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)
PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Setiap matakuliah memiliki silabus perkuliahan yang berisi materi-materi mengenai matakuliah tersebut. Silabus disusun berdasarkan buku-buku referensi utama
Lebih terperinciOnline News Classification Using Naive Bayes Classifier with Mutual Information for Feature Selection
Online News Classification Using Naive Bayes Classifier with Mutual Information for Feature Selection Shafrian Adhi Karunia shafrian@student.uns.ac.id Ristu Saptono ristu.saptono@staff.uns.ac.id Rini Anggrainingsih
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.
Lebih terperinciIntegrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction
Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko
Lebih terperinciKata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier.
PENGGUNAAN METODE NAÏVE BAYES CLASSIFIER PADA APLIKASI PERPUSTAKAAN Selvia Lorena Br Ginting,S.Si., MT 1, Reggy Pasya Trinanda 2 1,2 Jurusan Teknik Komputer Unikom, Bandung 1 selvialorena@yahoo.com, 2
Lebih terperinciImplementasi Pengembangan Smart Helpdesk di UPT TIK UNS Menggunakan Algoritma Naive Bayes Classifier
Implementasi Pengembangan Smart Helpdesk di UPT TIK UNS Menggunakan Algoritma Naive Bayes Classifier Wachid Daga Suryono 1, Ristu Saptono 2, Wiranto 3 Program Studi Informatika, Fakultas Matematika dan
Lebih terperinciPerbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor
Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Yusra 1, Dhita Olivita 2, Yelfi Vitriani 3 1,2,3 Jurusan Teknik
Lebih terperinciKomparasi Algoritma Support Vector Machine, Naïve Bayes Dan C4.5 Untuk Klasifikasi SMS
Vol.2 No.2, November 2017, pp. 7~13 ISSN: 2527-449X E-ISSN: 2549-7421 7 Komparasi Algoritma Support Machine, Naïve Dan C4.5 Untuk Klasifikasi SMS Retno Sari STMIK Nusa Mandiri e-mail: bee.retno@gmail.com
Lebih terperinciOptimasi Naïve Bayes Dengan Pemilihan Fitur Dan Pembobotan Gain Ratio
Optimasi Naïve Bayes Dengan Pemilihan Fitur Dan Pembobotan Gain Ratio I. Gusti. A. Socrates 1, Afrizal L. Akbar 2, M. Sonhaji Akbar 3 Teknik Informatika, Institut Teknologi Sepuluh Nopember, Surabaya,
Lebih terperinciPENENTUAN KUALITAS IKAN BANDENG MENGGUNAKAN ALGORITMA NAIVE BAYES BERDASARKAN TEKSTUR PADA CITRA ABSTRAK
PENENTUAN KUALITAS IKAN BANDENG MENGGUNAKAN ALGORITMA NAIVE BAYES BERDASARKAN TEKSTUR PADA CITRA Rahmanika Ratna Sari 1, Hanny Haryanto 2 1,2 Teknik Informatika, Fakultas Ilmu Komputer, Universitas Dian
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN Bab ini berisikan tentang alasan peneliti mengambil permasalahan ini. Pada bab ini poin-poin yang akan dipaparkan antara lain Latar Belakang, Perumusan Masalah, Batasan Masalah, Tujuan
Lebih terperinci1. Pendahuluan 1.1 Latar Belakang
1. Pendahuluan 1.1 Latar Belakang Perkembangan teknologi sekarang ini semakin pesat. Kebutuhan akan informasi dan komunikasi bertambah. Telah ditemukan berbagai perangkat teknologi yang memudahkan manusia
Lebih terperinciBAB I PENDAHULUAN. Electronic mail ( ) merupakan media komunikasi di internet seperti
1 BAB I PENDAHULUAN 1.1 Latar Belakang Electronic mail (email) merupakan media komunikasi di internet seperti untuk berdiskusi (maillist), transfer informasi berupa file (mail attachment) bahkan dapat
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan
Lebih terperinciBAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah
BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu
Lebih terperinciBAB I PENDAHULUAN. Jumlah spam di dunia semakin meningkat secara eksponensial.
BAB I PENDAHULUAN 1.1 Latar Belakang Jumlah email spam di dunia semakin meningkat secara eksponensial. Dilaporkan bahwa pada tahun 1978 sebuah email spam dikirimkan ke 600 alamat email. Sedangkan pada
Lebih terperinciINVERSE CLASS FREQUENCY DAN NAÏVE BAYES PADA KLASIFIKASI DUAL STAGE PADA DOKUMEN BERBAHASA ARAB
INVERSE CLASS FREQUENCY DAN NAÏVE BAYES PADA KLASIFIKASI DUAL STAGE PADA DOKUMEN BERBAHASA ARAB Dika R. Yunianto dikarizky66@gmail.com Septyawan R. Wardhana rossywardhana@gmail.com Rizka W. Sholikah rizkaws@gmail.com
Lebih terperinciKlasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN
Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Achmad Ridok 1), Retnani Latifah 2) Filkom
Lebih terperinciMAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA
MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA Aida Indriani ) ) Teknik Informatika STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso 8, Tarakan 77 Email
Lebih terperinciBAB 3 METODE PENELITIAN
BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan
Lebih terperinciProsiding SENTIA 2015 Politeknik Negeri Malang Volume 7 ISSN:
KLASIFIKASI TUGAS AKHIR UNTUK MENENTUKAN DOSEN PEMBIMBING MENGGUNAKAN NAÏVE BAYES CLASSIFIER (NBC) Putri Elfa Mas`udia 1 Politeknik Negeri Malang E-mail : putri.elfa@polinema.ac.id Abstrak Pemilihan dosen
Lebih terperinciKlasifikasi Posting Twitter Kemacetan Lalu Lintas Kota Bandung Menggunakan Naive Bayesian Classification
IJCCS, Vol.7, No.1, January 2013, pp. 13~22 ISSN: 1978-1520 13 Klasifikasi Posting Twitter Kemacetan Lalu Lintas Kota Bandung Menggunakan Naive Bayesian Classification Sandi Fajar Rodiyansyah* 1, Edi Winarko
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Kehadiran teknologi web yang interaktif telah merubah cara orang mengekspresikan pandangan dan opininya. Saat ini pengguna dapat menulis ulasan suatu produk pada situs
Lebih terperinci