PENCARIAN DOKUMEN MENGGUNAKAN METODE SINGLE PASS CLUSTERING (STUDI KASUS : ABSTRAKSI TA TEKNIK INFORMATIKA UNIV. MUHAMMADIYAH MALANG) TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: Widya Sukaningtyas 07560318 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2013
LEMBAR PENGESAHAN PENCARIAN DOKUMEN MENGGUNAKAN METODE SINGLE PASS CLUSTERING (STUDI KASUS : ABSTRAKSI TA TEKNIK INFORMATIKA UNIVERSITAS MUHAMMADIYAH MALANG) TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Disusun Oleh Widya Sukaningtyas 07560318 Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji Menyetujui, Penguji I Penguji II Lailatul Husniah, S.S.T Wahyu Andhyka Kusuma, S.Kom NIDN. 0730108401 NIDN. 0720068701 Mengetahui, Ketua Jurusan Teknik Informatika Eko Budi Cahyono, S.Kom, M.T NIP : 108.9504.0330
KATA PENGANTAR Dengan memanjatkan puji syukur kehadirat Allah SWT. Atas segala limpahan rahmat dan hidayah-nya sehingga peneliti dapat menyelesaikan Tugas Akhir yang berjudul : PENCARIAN DOKUMEN MENGGUNAKAN METODE SINGLE PASS CLUSTERING STUDI KASUS TUGAS AKHIR ABSTRAK TEKNIK INFORMATIKA UNIVERSITAS MUHAMMADIYAH MALANG Di dalam tulisan ini disajikan pokok-pokok bahasan yang meliputi : 1. Perancangan dan implementasi pembuatan sistem pencarian dan klasterisasi dokumen dengan mengimplementasikan metode Single Passs Clustering. 2. Melakukan pengujian dari berbagai sudut pandang dan kemampuan pencarian berdasarkan klasterisasinya. 3. Pengamatan hasil pencarian dan klasterisasi dokumen dari beberapa sudut pandang dengan tujuan untuk ditarik sebuah kesimpulan dari keseluruhan kegiatan. Peneliti menyadari sepenuhnya bahwa dalam penulisan Tugas Akhir ini masih banyak kekurangan dan keterbatasan. Oleh karena itu peneliti mengharapkan saran yang membangun agar tulisan ini bermanfaat bagi perkembangan ilmu pengetahuan kedepan. Malang, 17 Juni 2013 Penulis Widya Sukaningtyas
DAFTAR ISI LEMBAR PERSETUJUAN... i LEMBAR PENGESAHAN... ii LEMBAR PERNYATAAN... iii ABSTRAK... iv ABSTRACT... v LEMBAR PERSEMBAHAN... vi KATA PENGANTAR... vii DAFTAR ISI... viii DAFTAR GAMBAR... xi DAFTAR TABEL... xiii BAB I : PENDAHULUAN 1.1 Latar Belakang... 1 1.2 Rumusan Masalah... 2 1.3 Tujuan Penelitian... 2 1.4 Batasan Masalah... 2 1.5 Metodologi... 3 1.5.1 Studi Pustaka dan Pengumpulan Dokumen... 3 1.5.2 Desain Sistem... 3 1.5.3 Implementasi... 3 1.5.4 Deployment dan Uji Coba... 4 1.5.5 Pembuatan Laporan... 4 1.6 Sistematika Penulisan... 4 BAB II : LANDASAN TEORI 2.1 Information Retrieval (IR)... 6 2.2 Text Mining... 6 2.2.1 Preprocessing... 7 2.2.2 Ekstraksi Dokumen... 8 2.3 Klastering.... 13 2.3.1 Pengertian Klastering... 13 2.3.2 Algoritma Single Pass Clustering... 13
BAB III : ANALISA DAN PERANCANGAN SISTEM 3.1 Analisa Masalah... 15 3.2 Gambaran Umum Sistem... 15 3.2.1 Tahap Preprocessing... 17 3.2.2 Tahap Proses Case Folding... 17 3.2.3 Tahap Proses Tokenizing... 18 3.2.4 Tahap Proses Filtering... 18 3.2.5 Tahap Proses Stemming... 19 3.2.7 Tahap Proses Klastering... 22 3.2.8 Functional Requirements... 24 3.2.9 Non-Functional Requirements... 24 3.3 Arsitektur Sistem... 25 3.4 Perancangan Sistem... 25 3.4.1 Flowchart Sistem... 25 3.4.2 Use Case Diagram... 27 3.4.3 Class Diagram... 28 3.4.4 Activity Diagram... 30 3.4.5 Squence Diagram... 32 3.5 E-R Diagram Sistem... 34 BAB IV : IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Perangkat Lunak... 37 4.1.1 Menu User... 38 4.1.2 Menu Admin... 40 4.1.3 Menu Klaster... 46 4.1.4 Menu Searching... 51 4.2 Pengujian Perangkat Lunak... 54 4.2.1 Pengujian Fitur Perangkat Lunak... 55 4.2.2 Pengujian Fungsi Stemming Terhadap Kata... 57 4.2.3 Pengujian Klaster Data... 58 4.2.4 Pengujian Menggunakan Confusion Matrix... 59 BAB V : PENUTUP 5.1 Kesimpulan... 63
5.2 Saran... 63 DAFTAR PUSTAKA... 65 BIOGRAFI PENULIS... 66
DAFTAR GAMBAR Gambar 3.1 Flowchart Pre-Processing dan Text mining... 16 Gambar 3.2 Tahapan Case Folding... 17 Gambar 3.3 Tahapan Tokenizing... 18 Gambar 3.4 Gambar Filtering... 19 Gambar 3.5 Gambar Stemming... 19 Gambar 3.6 Gambar Proses Algoritma Nazief & Adriani... 20 Gambar 3.7 Flowchart Algorima Single Pass Clustering... 23 Gambar 3.8 Arsitektur Sistem Klastering Dokumen... 25 Gambar 3.9 Flowchart Sistem Klastering... 26 Gambar 3.10 Use Case Diagram Sistem... 27 Gambar 3.11 Class Diagram Sistem... 28 Gambar 3.12 Activity Diagram lihat klaster... 30 Gambar 3.13 Activity Diagram Cari Dokumen... 31 Gambar 3.14 Sequence Diagram Lihat Klaster Dokumen... 32 Gambar 3.15 Sequence Diagram Cari Dokumen... 33 Gambar 3.16 ER-Diagram Sistem... 34 Gambar 3.17 Desain Interface Halaman Utama... 36 Gambar 3.18 Desain Interface Hasil Pencarian... 36 Gambar 4.1 Tampilan Halaman Home... 38 Gambar 4.2 Tampilan Halaman Hasil Pencarian... 39 Gambar 4.3 Menu Lihat Data Abstraksi... 39 Gambar 4.4 Tampilan halaman login... 40 Gambar 4.5 Halaman home admin... 41 Gambar 4.6 Halaman Tambah Dokumen... 42 Gambar 4.7 Halaman admin lihat data abstraksi... 42 Gambar 4.8 Konfirmasi Dokumen Belum Terklaster... 46 Gambar 4.9 Tampilan form klaster... 46 Gambar 4.10 Tampilan jumlah klaster... 49 Gambar 4.11 Tampilan isi klaster... 50 Gambar 4.12 Tampilan menu labeling... 50
Gambar 4.13 Tampilan Hasil Searching Dokumen... 51 Gambar 4.14 Tampilan Detail Hasil Searching Dokumen... 51 Gambar 4.15 Tampilan Anggota Klaster... 52 Gambar 4.16 List Kedekatan Dokumen yang dicari... 53
DAFTAR TABEL Tabel 2.1 Kombinasi Awalan Akhiran Yang Tidak Diijinkan... 11 Tabel 2.2 Cara Menentukan Tipe Awalan Untuk awalan te-... 11 Tabel 2.3 Jenis Awalan Berdasarkan Tipe Awalannya... 12 Tabel 4.1 Implementasi Kelas Filtering... 45 Tabel 4.2 Implementasi Kelas Stemming... 45 Tabel 4.3 Implementasi klaster Utama... 48 Tabel 4.4 Implementasi Searching Dokumen... 53 Tabel 4.5 Pengujian Fitur Perangkat Lunak... 55 Tabel 4.6 Hasil Klaster Data... 59 Tabel 4.7 Hasil Pengujian Confusion Matrix..... 59
DAFTAR PUSTAKA [1] Ridho Barakkah, Ali. "CLUSTERING". Jurusan Teknologi Informasi Politeknik Elektronika Negeri Surabaya. Workshop Data Mining, 18-20 Juli 2006 [2] Agus Zainal Arifin, Ari Novan Setiono." Klasifikasi Dokumen Berita Kejadian Berbahasa Indonesia dengan Algoritma Single Pass Clustering Institus Teknologi Sepuluh Nopember Surabaya. [3] Solihin, Firdaus. STEMMING. Universitas Trunojoyo Madura. 2008. [4] Ron Papka, James Allan On-line Event Detection Using Single Pass Clustering. Department of Computer Science.University of Massachusetts.2010 [5] Solichin, Achmad. "PEMROGRAMAN WEB DENGAN PHP DAN MYSQL". Universitas Budi Luhur Jakarta. 2005. [6] Shan-Mu Lin. Personalized Optimal Search in Local Query Expansion. National Yunlin University of Technology and Science, Douliou, Taiwan, 2010.