PERANCANGAN EMAIL CLIENT DENGAN PENGKLASIFIKASIAN EMAIL MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI MOSES CHRISTIAN 081402050 PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013
PERANCANGAN EMAIL CLIENT DENGAN PENGKLASIFIKASIAN EMAIL MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Teknologi Informasi MOSES CHRISTIAN 081402050 PROGRAM STUDI TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013
PERSETUJUAN Judul : PERANCANGAN EMAIL CLIENT DENGAN PENGKLASIFIKASIAN EMAIL MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL Kategori : SKRIPSI Nama : MOSES CHRISTIAN Nomor Induk Mahasiswa : 081402050 Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI Departemen Fakultas : TEKNOLOGI INFORMASI : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA Komisi Pembimbing : Diluluskan di Medan, Pembimbing 2 Pembimbing 1 M. Umar S Tjkroaminoto, ST M.Fadly Syahputra Bsc, M.Sc.IT NIP.196206242006041015 NIP. 198301292009121003 Diketahui/Disetujui oleh Program Studi S1 Teknologi Informasi Ketua, Prof. Dr. Opim Salim Sitompul NIP. 196108171987011001
PERNYATAAN PERANCANGAN EMAIL CLIENT DENGAN PENGKLASIFIKASIAN EMAIL MENGGUNAKAN ALGORITMA VECTOR SPACE MODEL SKRIPSI Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing masing disebutkan sumbernya. Medan, MOSES CHRISTIAN 081402050
PENGHARGAAN Puji dan syukur hanya bagi Tuhan Yang Maha Esa yang mengizinkan penulis dapat menyelesaikan skripsi ini. Sebab kasihnya yang besar dan kesetiaannya yang tak pernah padam. Ucapan terima kasih penulis sampaikan kepada Bapak M. Fadly Putra,B.Sc.M.Sc.IT dan Bapak M. Umar S Tjokroaminoto, ST selaku pembimbing pada penyelesaian skripsi ini yang telah memberikan panduan dan penuh kepercayaan kepada penulis untuk menyempurnakan kajian ini. Ucapan terima kasih juga penulis sampaikan kepada Bapak Baihaqi Siregar, Ssi.,MT. dan Bapak Romi Fadillah Rahmat, B.Comp.Sc,M.Sc selaku dosen penguji. Panduan ringkas, padat, dan profesional telah diberikan kepada penulis agar dapat menyelesaikan tugas ini. Ucapan terima kasih juga ditujukan kepada Ketua dan Sekretaris Program Studi Teknologi Informasi, Prof. Dr. Opim Salim Sitompul, M.Sc dan Drs. Sawaluddin, M.IT, Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Sumatera Utara, semua dosen dan pegawai pada Program Studi Teknologi Informasi. Tidak terlupakan penulis mengucapkan terima kasih kepada Ayahanda Drs. Persadaan Ginting, Ibunda Dra. Krisnpenti Sembiring, adik-adik tercinta Dody dan Dea yang selalu memberikan cinta kasihnya dan dukungannya baik material dan spiritual dan yang berjasa memberikan dorongan kepada penulis selama menyelesaikan skripsi ini. Sahabat-sahabat saya Ilham Akbar, Shugy Sitepu, Pangeran David, Andryan, Harigo yang selalu memberi semangat dan terima kasih untuk doa-doa kalian. Semoga Tuhan Yang Maha Esa memberikan karunia kepada semua pihak yang telah memberikan bantuan, perhatian dan dukungan kepada penulis dalam menyelesaikan skripsi ini.
ABSTRAK Pada zaman teknologi sekarang ini, email banyak digunakan untuk mengirim informasi keseluruh dunia ini. Selama ini pengklasifikasian pada email masih dilakukan secara manual dan kurang objektif. Maka dalam penelitian ini, penulis menerapkan Metode Vector Space Model (VSM) untuk membuat suatu pengklasifikasian email secara otomatis dan lebih objektif. Dengan metode ini pengklasifikasian email dapat dilakukan secara otomatis berdasarkan address, subject, dan body dari sebuah email sehingga memudahkan pengguna email dalam pengorganisasian setiap email yang masuk kedalam inbox pengguna fasilitas email. Sehingga aplikasi ini nantinya akan memberi kemudahan bagi user pengguna email dalam mengklasifikasikan email sesuai dengan kata kunci dan jenis field yang ada. Kata kunci : Email, Pengklasifikasian, Text Mining, Vector Space Model.
DESIGN EMAIL CLIENT CLASSIFICATION USING VECTOR SPACE MODEL ALGORITHM ABSTRACT On today's age of technology, widely used email to send information throughout the world. During the classification of the email is still done manually and less objective. So in this study, the authors apply the method of Vector Space Model (VSM) to make an automatic email classification and more objective. With this method of email classification can be done automatically based on address, subject, and body of an email that allows users to email in the organization of every incoming email into a user's inbox email facility. So this application will provide convenience for the user email users in the email classify according to keyword and type of existing fields. Keywords: Clasification, Text Mining, Vector Space Model, Email
DAFTAR ISI Halaman Persetujuan Pernyataan Penghargaan Abstrak Abstract Daftar Isi Daftar Tabel Daftar Gambar ii iii iv v vi vii ix x Bab 1 Pendahuluan 1.1 Latar Belakang 1 1.2 Rumusan Masalah 3 1.3 Batasan Masalah 3 1.4 Tujuan Penelitian 3 1.5 Manfaat Penelitian 4 1.6 Metode Penelitian 4 1.7 Sistematika Penulisan 5 Bab 2 Landasan Teori 2.1 Email 7 2.1.1 Latar Belakang Email 8 2.1.2 Sejarah Penggunaan Email 9 2.1.3 Mail Client 10 2.1.4 Sistem Penerimaan Email 11 2.2 Klasifikasi 15 2.3 Text Mining 16 2.4 Ekstrasi Dokumen 17 2.5 Model Ruang Vector 20 2.6 Ukuran Kemiripan 20 2.7 Pemrograman Visual Basic 24 2.8 Penelitian Sebelumnya 25
Bab 3 Analisis dan Perancangan 3.1 Analisis Aplikasi 26 3.1.1 Analisis Data 26 3.1.2 Spesifikasi Aplikasi 26 3.1.3 Spesifikasi Pengguna 27 3.1.4 Lingkungan Operasi 27 3.1.5 Deskripsi Aplikasi 27 3.2 Perancangan Aplikasi 30 3.2.1 Ekstraksi Dokumen 30 3.2.2.1 Case Folding 30 3.2.1.2 Tokenizing 30 3.2.2 Analisa 31 3.2.2.1 Algoritma TF/IDF (Term frequency Inversed Document Frequency) 32 3.2.2.2 Cosine Similarity 34 3.2.3 Use Case Diagram 36 3.2.4 Activity Diagram 41 3.3 Perancangan Antar Muka 45 3.3.1 Menu Utama 45 3.3.2 Menu Email 46 3.3.3 Menu Sub Email 47 3.3.4 Menu Klasifikasi 47 Bab 4 Implementasi dan Pengujian 49 4.1 Implementasi 49 4.2 Pengujian 49 4.2.1 Tabel Pada Access 50 4.2.2 Tampilan Awal Sistem 51 Bab 5 Kesimpulan dan Saran 62 5.1 Kesimpulan 62 5.2 Saran 62 Daftar Pustaka 63 LAMPIRAN A: Listing Program 65
DAFTAR TABEL Halaman Tabel 2.1 Kelebihan dan Kekurangan Surat, Telepon, dan Email 9 Tabel 2.2 Perbedaan POP dan Web Based Email 12 Tabel 2.3 Penelitian Sebelumnya 25 Tabel 3.1 Tabel Dokumentasi Naratif Usecase Klasifikasi Email 37 Tabel 3.2 Tabel Dokumentasi Naratif Usecase View List Email 38 Tabel 3.3 Tabel Dokumentasi Naratif Usecase Klasifikasi 39 Tabel 3.4 Tabel Dokumentasi Naratif Usecase Send Email 40 Tabel 4.1 Tabel Download 50 Tabel 4.2 Tabel Classified 51 Tabel 4.3 Tabel Perhitungan TF/IDF 58 Tabel 4.4 Tabel Perhitungan Vector Space Model 59
DAFTAR GAMBAR Halaman Gambar 2.1 Cara Kerja Email 7 Gambar 2.2 Sistem Penerimaan Email 11 Gambar 2.3 Contoh Web Based Email dan Email Client 12 Gambar 2.4 Email Server 13 Gambar 2.5 SMTP Server 14 Gambar 2.6 Proses Pre-Processing Text 17 Gambar 2.7 Proses Case Folding dan Tokenizing 18 Gambar 2.8 Proses Filtering 18 Gambar 2.9 Proses Stemming 19 Gambar 2.10 Contoh Model Ruang Vector dengan dua dokumen D1 dan D2, serta Query Q1 21 Gambar 2.11 Contoh matriks term-document untuk database dengan dokumen dan t term 21 Gambar 2.12 Contoh Perhitungan bobot tf-idf 23 Gambar 3.1 Proses Processing 28 Gambar 3.2 Diagram Alir Analisa Konten 29 Gambar 3.3 Proses Case-folding dan Tokenizing 31 Gambar 3.4 Diagram Alir Pembobotan tf-idf 32 Gambar 3.5 Diagram Alir Pembobotan tf-idf 33 Gambar 3.6 Analisa tf/idf 34 Gambar 3.7 Vector Space Model 35 Gambar 3.8 Usecase Diagram Aplikasi klasifikasi Email 36 Gambar 3.9 Activity Diagram Menu Utama 41 Gambar 3.10 Activity Diagram Menu Pilihan Email 42 Gambar 3.11 Activity Diagram Menu Menu Filter 43 Gambar 3.12 Activity Diagram Menu Submenu Send Email 44 Gambar 3.16 Rancangan Antar muka menu utama 45 Gambar 3.17 Rancangan Antar muka menu email 46 Gambar 3.18 Rancangan Antar muka send email 47 Gambar 3.19 Rancangan Antar muka menu filter 48 Gambar 4.1 Tampilan Awal Sistem 52 Gambar 4.2 Tampilan Sub Menu Email 52 Gambar 4.3 Login_ Form 53 Gambar 4.4 Tampilan Form not accepted 54 Gambar 4.5 Tampilan Complete Input 54 Gambar 4.6 Tampilan Welcome 54 Gambar 4.7 Tampilan Send Email 55 Gambar 4.8 Tampilan Submenu classification 56 Gambar 4.9 Tampilan Filtering_Form 56 Gambar 4.10 Tampilan Filtering_Form berdasarkan field 57 Gambar 4.11 Tampilan Klasifikasi Berdasarkan Key dan Jenis Field 57 Gambar 4.12 Content_Form 61