BAB I PENDAHULUAN. perkembangan teknologi informasi yang memungkinkan data dalam jumlah besar

dokumen-dokumen yang mirip
BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah. Informasi merupakan kebutuhan yang sangat penting dalam era

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN. Electronic mail ( ) merupakan media komunikasi di internet seperti

PEMBANGUNAN SPAM FILTERING SYSTEM DENGAN METODE NAIVE BAYESIAN

BAB III ANALISIS DAN PERANCANGAN

BAB III ANALISA DAN PERANCANGAN SISTEM. Pada bab ini akan dibahas mengenai analisa dan perancangan dari sistem.

BAB I PENDAHULUAN. dipakai masyarakat umum adalah electronic mail ( ). Pada akhir tahun 1990,

APLIKASI SPAM FILTER PADA MICROSOFT OUTLOOK DENGAN METODE BAYESIAN

BAB I PENDAHULUAN I-1

BAB I PERSYARATAN PRODUK

BAB IV HASIL DAN PEMBAHASAN

1. Pendahuluan 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

BAB 3 ANALISIS DAN PERANCANGAN PROGRAM. sequential (waterfall). Metode ini terdiri dari empat tahapan yaitu, analisis, perancangan,

BAB I PENDAHULUAN I - 1

BAB 1 PENDAHULUAN. teknologi informasi yang memungkinkan data dalam jumlah besar terakumulasi. Hampir

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang

PROPOSAL TUGAS BESAR KECERDASAN BUATAN MENDETEKSI SPAMMING

BAB I PENDAHULUAN. Seiring dengan semakin bertambahnya jumlah kendaraan di kota-kota

1. BAB I PENDAHULUAN 1.1. Latar Belakang

Pembangunan Aplikasi Pemfilteran Spam Dengan Menggunakan Metode Pembeda Markov

BAB I PENDAHULUAN. usaha jasa perjalanan wisata di Bali. Perusahaan ini melayani pelanggan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. dilakukan secara sadar dengan cara menganalisa kemungkinan - kemungkinan

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN. beserta perangkat kerasnya. Secara langsung ataupun tidak, teknologi informasi telah

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

ANALISIS METODE NAIVE BAYESAN PADA APLIKASI SPAM FILTERING BERBASIS JAVA DESKTOP UNTUK MENGKLASIFIKASIKAN SUREL

BAB I PENDAHULUAN. 1.1 Latar Belakang

CONTOH KASUS DATA MINING

BAB 1 PENDAHULUAN. Perkembangan telekomunikasi dan informasi yang sangat pesat sekarang ini

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

BAB I Pendahuluan. 1 Launching Business on the Web, David Cook and Deborah Sellers, QUE, 1995, hal 12.

BAB I PENDAHULUAN. alternatif oleh masyarakat pada umumnya, menjadi sesuatu yang positif dalam

BAB IV HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN. perusahaan. Tentunya untuk mengikuti perubahan perubahan yang terjadi

PENDAHULUAN. 1.1 Latar Belakang

UPAYA MEMINIMALISASI PADA LAYANAN LAPAN BANDUNG

BAB IV HASIL DAN UJI COBA

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. atau biasa dikenal sebagai virus. Virus computer merupakan program komputer yang

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

@UKDW BAB 1 PENDAHULUAN

BAB I PENDAHULUAN. Perkembangan teknologi perangkat lunak pada masa sekarang ini sangatlah

BAB 2 LANDASAN TEORI. statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. yakni teknik mesin, teknik elektro dan teknik informatika. Namun bagi para calon

BAB I PENDAHULUAN. perusahaan. Tentunya untuk mengikuti perubahan perubahan yang terjadi

KEAMANAN . Subianto AMIK JTC SEMARANG

BAB IV HASIL DAN UJICOBA

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. tersebut kadang kala di rasa belum cukup untuk memenuhi keingintahuan. Oleh

BAB I PENDAHULUAN. Gambar 1.1. Grafik jumlah pengguna internet di Indonesia tahun versi APJII

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN. Hal itu bisa dirasakan dengan semakin banyaknya ditemukan sistem yang berbasiskan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Toko central menjual berbagai macam aksesoris hp untuk masyarakat yang

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Genap 2010/2011

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Poliklinik di Universitas Putra Bangsa Surabaya (UPB) sebagai institusi

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Organisasi industri merupakan salah satu mata rantai dari sistem

BAB 1 PENDAHULUAN. keras (hardware) maupun perangkat lunak (software) sudah semakin pesat dan

BAB I PENDAHULUAN. dilakukan secara sadar dengan cara menganalisa kemungkinan - kemungkinan

BAB I PENDAHULUAN. digunakan untuk mengamankan data ada bermacam-macam. Setiap metode

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. untuk berbuat lebih banyak dalam teknologi dan membuka diri terhadap

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. sebagai Information Sources atau Second Opinion yang dapat digunakan sebagai

BAB 1 PENDAHULUAN Latar Belakang. Pertumbuhan pasar swalayan dewasa ini telah meningkat dengan pesat di

BAB I PENDAHULUAN. Jaringan komputer adalah sebuah sistem yang terdiri atas komputerkomputer

BAB 1 PENDAHULUAN. dari pendayagunaan teknologi khususnya teknologi informasi. Penjualan elektronik atau yang akrab di sebut e-commerce ( electronic

ABSTRAK. Kata kunci : metode FAST, listrik, elektronik, transaksi, Sinar Makmur.

I.1 Latar Belakang Masalah Seiring berjalannya waktu dan perkembangan teknologi media penyimpanan elektronik, setiap organisasi dapat menyimpan

BAB I PENDAHULUAN. dunia teknologi informasi. Saat ini dikenal adanya social network dimana chatting

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011

BAB I PENDAHULUAN. yang disediakan untuk memenuhi permintaan dari pelanggan. Barang ini

BAB I PENDAHULUAN. Dengan kemajuan teknologi sangat modern sekarang ini yang semakin

BAB I PENDAHULUAN.

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. kegiatan operasional perusahaan, mengandung nilai yang benar, akurat, cepat dan

BAB I PENDAHULUAN I.1.

BAB I PENDAHULUAN. semakin meningkat. Oleh sebab itu peran informasi sangat penting dan sangat

BAB IV HASIL DAN UJI COBA

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. melakukan pemungutan suara menggunakan kertas suara. Sebagai contoh adalah

BAB 1 PENDAHULUAN UKDW

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa


PENGKLASIFIKASIAN UNTUK MENDETEKSI SPAM MENGGUNAKAN ALGORITMA NAIVE BAYESIAN ABSTRAK

Transkripsi:

1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan data mining yang pesat tidak dapat lepas dari perkembangan teknologi informasi yang memungkinkan data dalam jumlah besar terakumulasi. Perkembangan internet juga punya andil cukup besar dalam akumulasi data. Tetapi pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering disebut sebagai rich of data but poor of information karena data yang terkumpul itu tidak dapat digunakan untuk aplikasi yang berguna. Tidak jarang kumpulan data itu dibiarkan begitu saja seakan-akan kuburan data (data tombs). Investasi yang besar di bidang IT untuk mengumpulkan data berskala besar ini perlu dijustifikasi dengan didapatnya nilai tambah dari kumpulan data ini. Ternyata penerapan pada data berskala besar memberikan tantangantantangan baru yang akhirnya memunculkan metodologi baru yang disebut data mining. Bermula dari penerapan di dunia bisnis, sekarang ini data mining juga diterapkan pada bidang-bidang lain yang memerlukan analisa data berskala besar seperti bioinformasi, pertahanan negara dan telekomunikasi. Salah satu produk di bidang telekomunikasi adalah Electronic mail (email) yang merupakan media komunikasi di internet yang jangkauannya sangat luas. Mengingat fasilitas email yang murah dan kemudahan untuk mengirimkan ke

2 berapapun jumlah penerimanya maka beberapa pihak tertentu memanfaatkannya dengan mengirimkan email berisi promosi produk atau jasa, pornografi, virus, dan content-content yang tidak penting ke ribuan pengguna email. Email-email inilah yang biasanya disebut dengan spam mail. Dampak buruk yang paling utama dari adanya spam mail adalah terbuangnya waktu dengan percuma untuk menghapus spam mail dari inbox satu persatu. Meskipun berbagai perangkat lunak email filtering banyak tersedia, namun masalah spam mail juga semakin berkembang. Berkaitan dengan hal ini penulis ingin mencoba menganalisa penerapan data mining dalam kasus email filtering yaitu memilah antar spam mail dan legitimate mail. Data mining memiliki beberapa kategori diantaranya klasifikasi, asosiasi, clustering, dan masih banyak lagi. Metoda yang paling banyak digunakan untuk email filtering ini adalah naive bayesian yang merupakan salah satu konsep data mining dalam kategori klasifikasi. Kelebihan naive bayesian filtering diantaranya adalah tingkat akurasi yang tinggi dan error rate yang minimum. Berikut tabel perbandingan berbagai macam metode anti spam filter : Tabel 1.1 Perbandingan performansi metode-metode anti spam filter Metode Kelebihan Kekurangan Keywords Filtering Mudah, karena filter Dapat menimbulkan false hanya dilatih untuk menscan positives atau false negatives kata-kata tertentu karena kata-kata tertentu dapat yang sering digunakan pada spam-mail digunakan baik pada spammail maupun ham-mail Black and White Sangat efektif, terutama Filter dapat dikalahkan jika Listing jika diimplementasikan spammers memakai alamat pada level server palsu

3 Tabel 1.1 Perbandingan performansi metode-metode anti spam filter (Lanjutan) Signature based False positives dapat filtering dihindari Challenge-response Dapat memblok spam filtering dengan sangat akurat Rule based filtering Mudah diinstal pada level server, simple karena hanya menggunakan rule tertentu Bayesian filtering Memblok spam dengan (Paul Graham) efektif karena menghitung probabilitas dari setiap message Metode SpamBayes Memiliki kategori unsure message, untuk mengurangi false positives Filter dapat dikalahkan dengan menambahkan sembarang karakter pada copy spam mail, sehingga copy spam mail terlihat seperti memiliki signature yang berbeda Mekanismenya menyulitkan orang untuk mengirim e-mail pada kita, dapat mem-blok legitimate e-mail Rule ini harus di-update terus menerus seiring dengan perubahan karakteristik spammail yang dilakukan oleh spammers Masih terdapat kemungkinan terjadinya false positives Unsure mail harus di-training lebih lanjut untuk dapat dikategorikan sebagai hammail atau spam-mail 1.2 RUMUSAN MASALAH Permasalahan dalam Spam Fiter adalah : Bagaimana menerapkan Naive Bayesian untuk digunakan sebagai spam filter.

4 Bagaimana menentukan batas penentu sebuah email dikatakan sebuah email spam. 1.3 RUANG LINGKUP Ruang lingkup pembuatan program ini, menggunakan Visual Studio 2008 dan Microsoft Outlook 2003. 1.4 TUJUAN PEMBAHASAN Tujuan yang ingin dicapai dari tugas akhir ini adalah : Membuat aplikasi untuk kasus pemilahan spam mail dengan menerapkan metode Naive Bayesian. 1.5 METODE PENYELESAIAN MASALAH Metode yang akan digunakan untuk menyelesaikan tugas akhir ini adalah : 1. Studi Literatur Mempelajari literatur-literatur tentang email, konsep dan penerapan data mining dalam kasus pemilahan spam mail, juga bahasa pemrograman Visual Studio 2008. 2. Perencanaan dan Pembuatan Perangkat Lunak Modul pembuatan sistem tokenizing. Modul pembuatan sistem combining and scoring. Penggabungan modul-modul yang ada menjadi satu sistem untuk menangani sistem pengkategorian spam.

5 3. Pengujian dan Analisa Perangkat Lunak 1. Pengujian program 2. Analisa hasil output dari program 4. Pengambilan Kesimpulan Pengambilan kesimpulan dengan membandingkan hasil output program dengan kenyataan di lapangan. 1.6 SISTEMATIKA PENULISAN Laporan tugas akhir ini disusun dengan sistematika penulisan sebagai berikut : BAB I : PENDAHULUAN Bab ini berisi latar belakang masalah, perumusan masalah, ruang lingkup, tujuan tugas akhir, metodologi penyelesaian masalah dan sistematika penulisan. BAB II : LANDASAN TEORI Bab ini berisi teori-teori penunjang pembuatan tugas akhir. BAB III : ANALISA DAN PERANCANGAN SISTEM Bab ini berisi penjelasan tentang analisa dan perancangan program. BAB IV : IMPLEMENTASI DAN PENGUJIAN SISTEM Bab ini berisi tentang implementasi dan pengujian sistem yang dibuat dengan Microsoft Visual Studio 2008. BAB V : PENUTUP Bab ini berisi kesimpulan dan saran mengenai program yang telah dibuat.