DETEKSI WEB BERKONTEN PORNO DENGAN METODE BAYESIAN FILTERING DAN PRINCIPAL COMPONENT ANALYSIS

dokumen-dokumen yang mirip
DETEKSI WEB BERKONTEN PORNO DENGAN METODE BAYESIAN FILTERING DAN PRINCIPAL COMPONENT ANALYSIS

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK

IMPLEMENTASI METODE TOPSIS PADA SISTEM PENDUKUNG KEPUTUSAN SELEKSI CALON TENAGA KERJA DI PT. ASRY AMANAH TIMUR

PENGEMBANGAN APLIKASI ESTIMASI UKURAN PERANGKAT LUNAK DENGAN PENDEKATAN FUNCTION POINT ANALYSIS

ii

DETEKSI HAMA DAN PENYAKIT TANAMAN PADI MEMANFAATKAN INPUT TEKSTUAL DENGAN METODE COSINE SIMILARITY SKRIPSI

SKRIPSI. Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata Satu Program Studi Informatika

PERBANDINGAN EFEKTIFITAS METODE USER-BASED COLLABORATIVE FILTERING DENGAN METODE USER-ITEM BASED COLLABORATIVE FILTERING

PEMODELAN PENJADWALAN MULTILEVEL FEEDBACK QUEUE MENGGUNAKAN DYNAMIC TIME QUANTUM PADA KASUS PEMESANAN MAKANAN DI RESTORAN

SKRIPSI. Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu. Program Studi Informatika. Disusun oleh : FAIRLY OKTA MAL

SISTEM REKOMENDASI MAKANAN PENDAMPING AIR SUSU IBU (MPASI) DENGAN METODE NAÏVE BAYES DAN ATURAN MPASI

PENGEMBANGAN APLIKASI DETEKSI HAMA DAN PENYAKIT TANAMAN PADI DI INDONESIA DENGAN METODE ASSOCIATION RULE DAN COSINE SIMILARITY

IMPLEMENTASI ALGORITMA PALGUNADI UNTUK MENYELESAIKAN SINGLE DAN MULTI PRODUCT VEHICLE ROUTING PROBLEM

Penentuan Model Terbaik pada Metode Naïve Bayes Classifier dalam Menentukan Status Gizi Balita

PENGARUH DUMMY VARIABLE PADA METODE NAÏVE BAYES DALAM KASUS KLASIFIKASI PENYAKIT KANDUNGAN

DIAGNOSA PENYAKIT PARU EFUSI PLEURA DENGAN PENDEKATAN POSSIBILISTIC FUZZY LEARNING VECTOR QUANTIZATION SKRIPSI

PENERAPAN METODE ASSOCIATION RULES DAN COSINE SIMILARITY UNTUK PENGEMBANGAN FITUR DETEKSI DINI PENYAKIT

SISTEM VALIDASI DOKUMEN TUGAS AKHIR UNIVERSITAS SEBELAS MARET DENGAN METODE FORWARD CHAINING

IMPLEMENTASI ALGORITMA PALGUNADI DALAM OPTIMALISASI VEHICLE ROUTING PROBLEM DELIVERY AND PICK-UP (VRPDP)

SHABRINA ROSE HAPSARI M SURAKARTA

CD PEMBELAJARAN TEMATIK UNTUK SEKOLAH DASAR KELAS 1 SEMESTER 1 BERTEMA KELUARGA BERBASIS ADOBE FLASH TUGAS AKHIR

PENGARUH PERBEDAAN STRATEGI METODE SELEKSI DALAM ALGORITMA GENETIKA UNTUK KOMPRESI CITRA FRAKTAL SKRIPSI

DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM)

LAPORAN TUGAS AKHIR PEMBUATAN APLIKASI PERPUSTAKAAN BERBASIS WEB PADA INSTANSI PEMERINTAH BADAN PUSAT STATISTIK KABUPATEN KARANGANYAR

PENDEKATAN BARU PENYELESAIAN KASUS PENJADWALAN UJIAN AKHIR SEMESTER SEKOLAH MENENGAH ATAS (STUDI KASUS SMA NEGERI 3 SURAKARTA)

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

CLUSTERING DOKUMEN MENGGUNAKAN ALGORITMA SELF-ORGANIZING MAP (SOM) (STUDI KASUS : DOKUMEN SKRIPSI DI FAKULTAS PERTANIAN UNS)

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN CONFIDENCE PADA SISTEM REKOMENDASI DENGAN METODE ITEM BASED COLLABORATIVE FILTERING

RIZAL KUSUMAJATI NUGROHO

PEMETAAN HASIL CLUSTERING PRODUKTIVITAS PADI DAN PALAWIJA DI PULAU JAWA MENGGUNAKAN ALGORITMA K-MEANS

PENGGABUNGAN ALGORITMA GENETIKA DENGAN TABU SEARCH UNTUK PENGEMBANGAN METODE PENJADWALAN MATA KULIAH DI UNIVERSITAS SEBELAS MARET SURAKARTA SKRIPSI

KLASIFIKASI TEKS MENGGUNAKAN ALGORITMA NAIVE BAYES UPDATEABLE PADA SOAL UJIAN SBMPTN HALAMAN JUDUL

ANALISIS SPAM FILTERING PADA MAIL SERVER DENGAN METODE BAYESIAN CHI-SQUARE DAN NAIVE BAYES CLASSIFIER SKRIPSI

Skripsi. Disusun Oleh : Arief Adi Nugroho M

PEMBUATAN SISTEM INFORMASI BERBASIS WEB LOKAL BANK TABUNGAN NEGARA SURAKARTA TUGAS AKHIR

Aplikasi Dashboard sebagai Modul Executive Information System untuk Analisis Data Eksport Furniture di Indonesia SKRIPSI

ASSOCIATION RULE MINING DATA PEMINJAMAN PERPUSTAKAAN MENGGUNAKAN KOMBINASI APRIORI DAN JACCARD SIMILARITY

PENILAIAN UJIAN BERTIPE URAIAN (ESSAY) MENGGUNAKAN METODE KEMIRIPAN TEKS (TEXT SIMILARITY) SKRIPSI

SKRIPSI Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu Jurusan Informatika. Disusun Oleh: WINA ISTI RETNANI NIM.

OPTIMASI PRODUKSI MENGGUNAKAN ALGORITMA FUZZY LINEAR PROGRAMMING (STUDI KASUS: PRODUKSI TAS UKM CANTIK SOUVENIR) SKRIPSI

APLIKASI SISTEM INVENTORI BERBASIS WEB STUDI KASUS PRODUSEN PRODUK CV. SUPERNOVA TUGAS AKHIR

LAPORAN TUGAS AKHIR APLIKASI KATALOG BUTIK BERBASIS MULTIMEDIA. Diajukan Untuk Menyusun Tugas Akhir dalam Program Diploma III Ilmu Komputer

PEMBANGUNAN SISTEM INFORMASI KEPEGAWAIAN UNIVERSITAS SEBELAS MARET SURAKARTA SUB PENILAIAN ANGKA KREDIT DOSEN FUNGSIONAL TUGAS AKHIR

PEMBANGUNAN MODEL E-MARKETING BERSAMA TINGKAT PROVINSI DENGAN MEMANFAATKAN WEB SERVICE SKRIPSI

DAFTAR ISI. BAB I PENDAHULUAN 1.1 Latar Belakang Tujuan Penelitian Manfaat Penelitian... 4

MEMBANGUN APLIKASI TOKO HEWAN ONLINE DENGAN FRAMEWORK PHONEGAP TUGAS AKHIR

ANALISIS SPEKTRUM ENERGI DAN FUNGSI GELOMBANG

PEMBUATAN WEBSITE SISTEM AFFILIASI DUTA. Oleh : BENY ARIF LAILAN M

TUGAS AKHIR SISTEM INFORMASI TUGAS AKHIR DIII TEKNIK INFORMATIKA FMIPA UNS

INTRUSION DETECTION SYSTEM (IDS) MENGGUNAKAN JARINGAN SYARAF TIRUAN ENSEMBLE

SISTEM INFORMASI PENJADWALAN SMK NEGERI 1 KEMUSU BOYOLALI TUGAS AKHIR

PENGARUH PROSES PELAKSANAAN SELEKSI DAN PENEMPATAN KARYAWAN TERHADAP KINERJA KARYAWAN DI PERUSAHAAN DAERAH AIR MINUM KABUPATEN KUDUS

IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR

SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Jurusan Informatika. Disusun Oleh: AISHA ALFIANI MAHARDHIKA

PERANCANGAN DAN PEMBUATAN APLIKASI KHAZANAH INTELEKTUAL BERBASIS WEB DAN ANDROID. Disusun oleh : JUPRI SANTOSO M

SIMULASI PENYEBARAN PENYAKIT MENULAR HIV/AIDS DI PROVINSI JAWA TENGAH MENGGUNAKAN MODEL EPIDEMI SIR (SUSCEPTIBLE, INFECTED, REMOVED)

SISTEM REKOMENDASI PEMINJAMAN VCD DENGAN METODE ITEM BASED COLLABORATIVE FILTERING

MODIFIKASI LEAST SIGNIFICANT BIT UNTUK MENINGKATKAN KETAHANAN PESAN TERHADAP CROPPING DAN NOISE SKRIPSI

APLIKASI PENDATAAN TESIS DAN DISERTASI PADA PROGRAM PASCASARJANA UNIVERSITAS SEBELAS MARET SURAKARTA TUGAS AKHIR

RANCANG BANGUN GAME 3 DIMENSI TOWER DEFENSE DENGAN MENGGUNAKAN GAME ENGINE UNITY TUGAS AKHIR

SISTEM INFORMASI PENERIMAAN SISWA BARU SMK NEGERI 1 KEMUSU BOYOLALI TUGAS AKHIR

PEMBUATAN APLIKASI MONITORING PERKULIAHAN DI DIPLOMA III TEKNIK INFORMATIKA FMIPA UNIVERSITAS SEBELAS MARET SURAKARTA

LAPORAN SKRIPSI DATA MINING PENENTUAN LAGU DANGDUT TERLARIS MENGGUNAKAN ALGORITMA NAIVE BAYES. Oleh : VINA KHILMIYATI

APLIKASI PENGARSIPAN DATA MAHASISWA PENERIMA DANA KASIH DI UNIVERSITAS SEBELAS MARET

PEMBUATAN USER INTERFACE UNTUK MANAJEMEN HOTSPOT MIKROTIK YANG TERINTEGRASI DENGAN BILLING HOTEL MENGGUNAKAN API MIKROTIK

PENGEMBANGAN APLIKASI SKRIPSI (TUGAS AKHIR) BERBASIS WEB MENGGUNAKAN METODE SCRUM

PEMBANGUNAN SISTEM INFORMASI EVALUASI PEMBELAJARAN MENGAJAR SMK NEGERI 1 SUKOHARJO TUGAS AKHIR

PEMBANGUNAN APLIKASI REMOTE SERVER DENGAN IMPLEMENTASI PROTOKOL SECURE SHELL MENGGUNAKAN JAVA DAN SISTEM OPERASI LINUX DEBIAN 6 TUGAS AKHIR

PEMBUATAN SISTEM INFORMASI ADMINISTRASI RAWAT INAP PASIEN RUMAH SAKIT BERBASIS WEB

PENGUKURAN KINERJA METODE NAIVE BAYES PADA SISTEM DETEKSI KERUSAKAN MOTOR

PEMANFAATAN WEB SERVICE MOODLE BERBASIS REST- JSON UNTUK MEMBANGUN MOODLE ONLINE LEARNING EXTENSION BERBASIS ANDROID

OPTIMASI FUZZY TSUKAMOTO DUA TAHAP MENGGUNAKAN ALGORITMA GENETIKA UNTUK SELEKSI CALON KARYAWAN (STUDI KASUS: Perusahaan Bio-2000)

PENDETEKSIAN KRISIS KEUANGAN DI INDONESIA BERDASARKAN INDIKATOR HARGA SAHAM MENGGUNAKAN GABUNGAN MODEL VOLATILITAS DAN MARKOV SWITCHING TIGA STATE

MODEL EPIDEMI STOKASTIK SUSCEPTIBLE INFECTED SUSCEPTIBLE (SIS)

SISTEM INFORMASI KONFEKSI R. S JIMBUNG BERBASIS WEB DI TANON SRAGEN. Tugas Akhir. Ahli Madya pada Program Studi Diploma III Teknik Informatika

OPTIMALISASI PORTOFOLIO OBLIGASI BANK DENGAN METODE BAYESIAN MARKOV CHAIN MONTE CARLO MELALUI MODEL GAUSSIAN MIXTURE

PRA-PEMPROSESAN DATA LUARAN GCM CSIRO-Mk3 DENGAN METODE TRANSFORMASI WAVELET DISKRIT

KEANEKARAGAMAN MAKROFAUNA TANAH PADA LAHAN TANAMAN PADI DENGAN SISTEM ROTASI DAN MONOKULTUR DI DESA BANYUDONO BOYOLALI. Skripsi

PENGUNAAN ALAT BANTU PEMBELAJARAN UNTUK MENINGKATKAN HASIL BELAJAR BERMAIN BOLAVOLI PADA SISWA KELAS XI PM SMK MURNI 2 SURAKARTA

PENCARIAN DOKUMEN MENGGUNAKAN METODE SINGLE PASS CLUSTERING (STUDI KASUS : ABSTRAKSI TA TEKNIK INFORMATIKA UNIV. MUHAMMADIYAH MALANG) TUGAS AKHIR

SEGMENTASI KANDIDAT PARASIT MALARIA DARI CITRA MIKROSKOPIS APUSAN TEBAL DARAH MENGGUNAKAN ACTIVE CONTOUR WITHOUT EDGE

ANALISIS REAKSI PASAR TERHADAP PENGUMUMAN PERGANTIAN CHIEF EXECUTIVE OFFICER (CEO) DILIHAT DARI ABNORMAL RETURN

PEMBUATAN PROGRAM APLIKASI ADMINISTRASI NILAI BERBASIS JAVA STUDI KASUS DI SD KRISTEN BANJARSARI

RATA-RATA KUADRAT SESATAN PENDUGA REGRESI DENGAN KOMBINASI LINIER DUA VARIABEL BANTU PADA SAMPEL ACAK SEDERHANA

SISTEM KEMAHASISWAAN DAN KELULUSAN FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET

PEMBANGUNAN SISTEM INFORMASI KEPEGAWAIAN SUB EKIVALENSI WAKTU MENGAJAR PENUH (EWMP) DOSEN UNIVERSITAS SEBELAS MARET

PEMBUATAN SISTEM INFORMASI PENERAPAN GENERATOR CSS3 BERBASIS FRAMEWORK CODEIGNITER

RETNO DWI LESTARI JARMIATI NIM:

oleh LILIS SETYORINI NIM. M SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

oleh DYAH WARDIYANI M SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

PENDETEKSIAN KRISIS KEUANGAN DI INDONESIA MENGGUNAKAN GABUNGAN MODEL VOLATILITAS DAN MARKOV SWITCHING BERDASARKAN INDIKATOR HARGA MINYAK

MODEL PERSEDIAAN TERINTEGRASI PEMASOK-PENGECER DENGAN BARANG CACAT, CRASHING COST DAN INVESTASI FUNGSI BERPANGKAT, DAN KENDALA TINGKAT LAYANAN

SISTEM INFORMASI PENJUALAN PAKAIAN BERBASIS WEB DI TOKO AVISTA FASHION

MODEL EPIDEMI DISCRETE TIME MARKOV CHAINS SUSCEPTIBLE EXPOSED INFECTED RECOVERED (DTMC SEIR)

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

PEMERINGKATAN PENERIMA BEASISWA BANTUAN BELAJAR MAHASISWA DI FAKULTAS MIPA UNS MENGGUNAKAN FUZZY SIMPLE ADDITIVE WEIGHTING

EVALUASI SISTEM PENGENDALIAN INTERN PENJUALAN TUNAI PADA USAHA BATIK GUNAWAN SETIAWAN SURAKARTA

ASSOCIATION RULE UNTUK MENENTUKAN POLA PASIEN RAWAT INAP MENGGUNAKAN ALGORITMA FP- GROWTH (STUDI KASUS RSUD SUKOHARJO)

TUGAS AKHIR PEMBUATAN E-LEARNING PEMBELAJARAN SDIT NURUL ISTIQLAL SEBAGAI PENDAMPING DALAM PROSES BELAJAR MENGAJAR

Transkripsi:

DETEKSI WEB BERKONTEN PORNO DENGAN METODE BAYESIAN FILTERING DAN PRINCIPAL COMPONENT ANALYSIS SKRIPSI Diajukan untuk Memenuhi Sebagian Persyaratan Mendapatkan Gelar Strata Satu Program Studi Informatika Disusun oleh : AFIF RIZKA WANDALA NIM. M0509004 PROGRAM STUDI INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2015

DETEKSI WEB BERKONTEN PORNO DENGAN METODE BAYESIAN FILTERING DAN PRINCIPAL COMPONENT ANALYSIS SKRIPSI Diajukan untuk Memenuhi Sebagian Persyaratan Mendapatkan Gelar Strata Satu Program Studi Informatika Disusun oleh : AFIF RIZKA WANDALA NIM. M0509004 PROGRAM STUDI INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2015 i

ii

iii

DETEKSI WEB BERKONTEN PORNO DENGAN METODE BAYESIAN FILTERING DAN PRINCIPAL COMPONENT ANALYSIS AFIF RIZKA WANDALA Program Studi Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Sebelas Maret ABSTRAK Saat ini konten porno banyak bertebaran di sebuah website baik dalam bentuk konten utama maupun iklan. Salah satu cara untuk mencegah konten yang tidak diinginkan tersebut adalah dengan pendeteksian konten. Pendeteksian konten dilakukan dengan proses text mining. Setiap website diprediksi dengan mempertimbangkan karakteristik text yang ada didalamnya. Metode yang digunakan untuk mempredeksi web porno dalam penelitian ini adalah bayesian filtering, Bayesian filtering berrfungsi memperhitungkan probabilitas kemiripan suatu website dengan membandingkan munculnya tiap keyword pada data latih. Namun, banyaknya keyword atau variable mempengaruhi efisiensi dan keakuratan deteksi. Untuk mengatasi hal tersebut, peneilitan ini menggunakan Principal component analysis untuk mengurangi dan mencari variable yang memiliki pengaruh penting terhadap deteksi. Dari penelitian ini diperoleh tingkat akurasi tertinggi deteksi web berkonten porno dengan metode bayesian filtering sebesar 89.22%, hasil deteksi tersebut menggunakan 51 variable hasil ekstraksi Principal component analysis. Kata kunci : Bayesian Filtering, Text mining, Deteksi, PCA, Porno iv

PORN WEBSITE DETECTION USING BAYESIAN FILTERING AND PRINCIPAL COMPONENT ANALYSIS METHOD AFIF RIZKA WANDALA Department of Informatics, Faculty of Mathematics and Natural Science Sebelas Maret University ABSTRACT Now days many pornographic content on a website is not only in the form of main content but also in advertisement. One way to prevent it is using content detection. The detection of content can be done with text mining process. Each website is predicted inside by the characteristics of the text. This research using Bayesian filtering to predicting of pornographic web. The function of Bayesian filtering is to calculate the similarity s of probability in a website by comparing the appearance of each keyword in the training data. However, the number of keywords or variables influence the efficiency and accuracy of detection. To prefent it this research using Principal component analysis to reduce and looking for the variables have an important influence on detection. From this research, the highest level of accuracy of detection of pornographic web with Bayesian filtering method amounted to 89.22%, the detection results using 51 variables from extraction result of Principal component analysis. Keyword : Bayesian Filtering, Detection, PCA, Porn, Text mining. v

MOTTO La tahzan Allohu ma ana Sebaik-baik manusia adalah yang paling bermanfaat bagi orang lain. -(HR. Ahmad) sesungguhnya bersama dengan kesulitan, ada kemudahan.. bersama dengan kesulitan, ada kemudahan.. (Al-Insyirah : 6-7) With great power comes great responsibility -Spiderman vi

PERSEMBAHAN Karya ini Penulis persembahkan kepada : Bapak dan Ibu yang jasanya tidak akan pernah terbalaskan sedikitpun Kakak dan adik saya yang telah memberi support yang tiada hentinya vii

KATA PENGANTAR Segala puji dan syukur penulis ucapkan kepada Allah SWT, yang hanya karena rahmat dan karunia-nya, penulis dapat menyelesaikan penelitian dan pembuatan laporan penelitian ini dengan judul DETEKSI WEB BERKONTEN PORNO DENGAN METODE BAYESIAN FILTERING DAN PRINCIPAL COMPONENT ANALYSIS, yang merupakan salah satu syarat mendapatkan gelar strata satu Informatika Universitas Sebelas Maret Surakarta. Skripsi ini tidak akan selesai tanpa adanya bantuan dari banyak pihak. Untuk itu penulis ingin menyampaikan ucapan terima kasih kepada : 1. Allah SWT atas limpahan segala rahmat dan karunianya sehingga karya tulis ini dapat terselesaikan. 2. Bapak Palgunadi selaku dosen pembimbing yang telah memberikan bimbingan, masukan, serta pengarahan. 3. Bapak Abdul Aziz selaku dosen pembimbing yang telah memberikan bimbingan, masukan, serta pengarahan. 4. Bapak Afrizal dan Bapak Bambang Harjito selaku dosen penguji yang telah memberikan penilaian dan masukan untuk tugas akhir ini. 5. Bapak, Ibu, dan keluarga yang selalu memberikan dukungan. 6. Teman-teman dan adik-adik semua yang memberi bantuan serta nasehat. 7. Keluarga besar S1 Informatika UNS, khususnya angkatan 2009 atas kiriman semangat dan motivasi skripsi. Semoga penelitian yang telah dilakukan penulis dapat bermanfaat. Surakarta, 29 September 2015 Penulis viii

DAFTAR ISI HALAMAN JUDUL... i HALAMAN PERSETUJUAN... ii HALAMAN PERSETUJUAN... iii ABSTRAK... iv ABSTRACT... v MOTTO... vi PERSEMBAHAN... vii KATA PENGANTAR... viii DAFTAR ISI... ix DAFTAR TABEL... xi DAFTAR GAMBAR... xii DAFTAR LAMPIRAN... xiii BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah... 3 1.3 Batasan Masalah... 3 1.4 Tujuan Penelitian... 3 1.5 Manfaat Penelitian... 3 1.6 Sistematika Penulisan... 4 BAB II TINJAUAN PUSTAKA... 5 2.1 Dasar Teori... 5 2.1.1 Text mining... 5 2.1.2 Web Crawling... 6 2.1.3 Text Preprocessing... 6 2.1.4 Web Mining... 8 2.1.5 Information Gain... 9 2.1.6 Bayesian Filtering... 10 2.1.7 Multikolinieritas... 12 2.2 Penelitian terkait... 15 2.3 Rencana Penelitian... 17 ix

BAB III METODOLOGI... 18 3.1 Pengumpulan Data... 18 3.2 Implementasi... 19 3.2.1 Preprocessing... 19 3.2.2 Reducing Variable... 20 3.2.3 Feature Selection... 21 3.2.4 Bayesian Filtering... 23 3.3 Pengujian... 24 3.3.1 Kombinasi data dan variabel... 24 3.3.2 Correctness... 24 BAB IV HASIL DAN PEMBAHASAN... 25 4.1 Hasil pengumpulan data dan Crawling... 25 4.2 Preprocessing... 25 4.3 Variable extraction... 26 4.3.1 Analisis PCA data training 100 porn :400 safe... 26 4.3.2 Analisis PCA data training 250 porn : 250 safe... 28 4.3.3 Analisis PCA data training 400 porn : 100 safe... 30 4.4 Hasil Pengujian deteksi dengan Bayesian filtering... 32 BAB V PENUTUP... 34 5.1 Kesimpulan... 34 5.2 Saran... 34 DAFTAR PUSTAKA... 35 x

DAFTAR TABEL Tabel 2.1 Penelitian Terkait... 15 Tabel 3.1. Contoh nilai covarians variabel PCA... 22 Tabel 4.1 Total keyword... 25 Tabel 4.2 Keyword hasil estraksi PCA data 100:400... 27 Tabel 4.3 Keyword hasil estraksi PCA data 250 porn : 250 safe... 28 Tabel 4.4 Keyword hasil estraksi PCA data 400 porn : 100 safe... 30 Tabel 4.5 Perbandingan akurasi non PCA... 32 Tabel 4.6 Perbandingan akurasi ekstraksi PCA... 33 xi

DAFTAR GAMBAR Gambar 2.1 Proses text mining... 6 Gambar 2.2 Contoh tokenizing... 7 Gambar 2.4 Contoh stemming... 8 Gambar 3.1 Alur metodologi penelitian... 18 Gambar 3.2 Grafik nilai eigen PCA... 21 Gambar 4.1 Grafik nilai eigen PCA 100 web porno: 400 web safe... 26 Gambar 4.2 Grafik nilai eigen PCA 250 web porno: 250 web safe... 28 Gambar 4.3 Grafik nilai eigen PCA 400 web porno: 100 web safe... 30 xii

DAFTAR LAMPIRAN Lampiran 1. Nilai gain 1000 keyword 100 porn : 400 safe... 37 Lampiran 2. Nilai gain 1000 keyword 250 porn : 250 safe... 45 Lampiran 3. Nilai gain 1000 keyword 400 porn : 100 safe... 54 xiii