CLUSTERING DOKUMEN TEKS BERDASARKAN FINGERPRINT BIWORD WINNOWING DENGAN MENGGUNAKAN METODE K-MEANS

dokumen-dokumen yang mirip
SISTEM PENDUKUNG KEPUTUSAN UNTUK MENETUKAN TERAPI HERBAL PADA PENYAKIT DALAM DENGAN METODE AHP (ANALITYC HIERARCHY PROCESS) TUGAS AKHIR

SISTEM PENDUKUNG KEPUTUSAN PEMILIHAN MOBIL BARU MENGGUNAKAN METODE SIMPLE ADDITIVE WEIGHTING (SAW) TUGAS AKHIR

PERAMALAN HARGA EMAS MENGGUNAKAN AUTOMATIC CLUSTERING DAN CHEN S METHOD DALAM LOGIKA FUZZY TUGAS AKHIR

SISTEM INFORMASI GEOGRAFIS PEMILIHAN KELURAHAN TERBAIK UNTUK LOKASI TPSS DI KOTA PEKANBARU MENGGUNAKAN METODE AHP TUGAS AKHIR

IMPLEMENTASI TEKNOLOGI WEB SERVICE PADA. ORIENTED ARCHITECTURE (SOA) (Studi kasus : PT. Smeva Holiday) TUGAS AKHIR

SISTEM PENDUKUNG KEPUTUSAN (SPK) UNTUK MENETUKAN TEMPAT PEMBUANGAN SEMENTARA (TPS) SAMPAH MENGGUNAKAN METODE BROWN GIBSON

SISTEM PENDUKUNG KEPUTUSAN REKOMENDASI PEMILIHAN HOTEL DENGAN MULTI ATTRIBUTE DECISION MAKING (MADM) TUGAS AKHIR

RANCANG BANGUN APLIKASI DOKUMEN CLUSTERING DENGAN METODE K-MEANS BERDASARKAN WINNOWING FINGERPRINT SIMILARITY TUGAS AKHIR

PENERAPAN METODE ANALYTIC HIERARCHY PROCESS DAN TEOREMA BAYES DALAM SISTEM PENDUKUNG KEPUTUSAN PENENTUAN LOKASI LAHAN KRITIS

IMPLEMENTASI COMPUTER AIDED LEARNING 3D SISTEM PEREDARAN DARAH MANUSIA DENGAN MEMANFAATKAN TEKNOLOGI AUGMENTED REALITY TUGAS AKHIR

BAB III METODOLOGI PENELITIAN

SISTEM PAKAR UNTUK MENDIAGNOSA GANGGUAN ANXIETAS DENGAN MENGGUNAKAN TEOREMA BAYES TUGAS AKHIR

MENENTUKAN HARGA KEBUTUHAN POKOK YANG HILANG MENGGUNAKAN FUNGSI ANALISIS DATA (FDA) DI KOTA PEKANBARU TUGAS AKHIR

SISTEM REKOMENDASI PEMINJAMAN BUKU PADA PERPUSTAKAAN UIN SUSKA RIAU DENGAN METODE USER-BASED COLABORATIF FILTERING TUGAS AKHIR

SISTEM PAKAR MENCARI KERUSAKAN MESIN DAN CVT(CONTINOUSLY VARIABLE TRANSMISSION) MOTOR MATIC MENGGUNAKAN METODE DEMPSTER-SHAFER TUGAS AKHIR

TUGAS AKHIR JUMADI AWIS Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Pada Jurusan Teknik Informatika.

TUGAS AKHIR ARNI YUNITA

PENYELESAIAN SISTEM PERSAMAAN LINEAR FUZZY KOMPLEKS MENGGUNAKAN METODE DEKOMPOSISI DOOLITTLE TUGAS AKHIR

ANALISIS MODEL MSLIR PENYEBARAN PENYAKIT TUBERKULOSIS DENGAN POPULASI TERBUKA TUGAS AKHIR

TUGAS AKHIR. Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Pada Jurusan Teknik Informatika. Oleh :

PENGGUNAAN METODE AGGLOMERATIVE HIERARCHICAL CLUSTERING DAN RELASI LOGIKA FUZZY

PERBANDINGAN SIFAT FISIK HUJAN DENGAN MENGGUNAKAN FUNGSI ANALISIS DATA (FDA) TUGAS AKHIR

ANALISA QUALITY OF SERVICE (QOS) JARINGAN INTERNET KAMPUS (STUDI KASUS: UIN SUSKA RIAU) TUGAS AKHIR

IMPLEMENTASI SERVICE ORIENTED ARCHITECTURE (SOA) UNTUK MENAMPILKAN KEGIATAN MUBALLIGH KOTA PEKANBARU (Studi kasus: DDI dan IKMI kota Pekanbaru)

IMPLEMENTASI API (APPLICATION PROGRAMMING INTERFACE) ECHO NEST TERHADAP MUSIC INFORMATION RETRIEVAL TUGAS AKHIR

IMPLEMENTASI PEMROGRAMAN PARALEL DALAM DETEKSI TEPI MENGGUNAKAN METODE OPERATOR SOBEL TUGAS AKHIR

TUGAS AKHIR. Oleh MUHAMMAD AMIN Diajukan Sebagai Salah Satu Syarat Untuk memperoleh Gelar Sarjana Teknik PadaJurusan Teknik Informatika

NILAI TOTAL TAK TERATUR TITIK PADA GRAF HASIL KALI COMB DAN DENGAN m BILANGAN GENAP TUGAS AKHIR

ANALISA INVESTASI PAYMENT ONLINE SYSTEM (POS) UNTUK PEMBAYARAN PAJAK BUMI DAN BANGUNAN MENGGUNAKAN METODE RANTI'S GENERIC IS/IT BUSINESS VALUE

SISTEM PERPUSTAKAAN MENGGUNAKAN RADIO FREQUENCY IDENTIFICATION (RFID) DENGAN PENDEKATAN SMART CITY TUGAS AKHIR

SISTEM INFORMASI KEPEGAWAIAN TUGAS AKHIR

RANCANG BANGUN APLIKASI PERINGKAS TEKS OTOMATIS ARTIKEL BERBAHASA INDONESIA MENGGUNAKAN METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY

LAPORAN TUGAS AKHIR. Disusun oleh : DARWIN HARAHAP

TUGAS AKHIR. Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Pada Jurusan Teknik Informatika

APLIKASI PEMBAGIAN HARTA WARIS BERBASIS ANDROID TUGAS AKHIR. Oleh : ILHAM SATRIA

PENYELESAIAN PERSAMAAN LAPLACE MENGGUNAKAN METODE RANTAI MARKOV TUGAS AKHIR N U R I Z A

RANCANG BANGUN SISTEM INFORMASI VERIFIKASI PNS (Studi Kasus : Badan Kepegawaian Daerah Tembilahan) TUGAS AKHIR FAUZI RAHMAN

PERANCANGAN ALAT UKUR ANTROPOMETRI (STUDI KASUS: LABORATORIUM APK TEKNIK INDUSTRI UIN SUSKA RIAU) LAPORAN TUGAS AKHIR

SISTEM PENDUKUNG KEPUTUSAN SELEKSI PEGAWAI DENGAN MENGGUNAKAN METODE MULTIFACTOR EVALUATION PROCESS (MFEP) STUDI KASUS : RS SYAFIRA PEKANBARU

PERENCANAAN INFRASTRUKTUR JARINGAN PITA LEBAR MENGGUNAKAN TEKNOLOGI WIRELESS MESH NETWORKUNTUK DISTRIBUSIDATA DAN SISTEM DI UIN SUSKA SUKAJADI

SOURCE DETECTION PADA KASUS PLAGIARISME DOKUMEN MENGGUNAKAN METODE BIWORD WINNOWING DAN RETRIEVAL BERBASIS OKAPI BM25 TUGAS AKHIR

SISTEM PAKAR MENDIAGNOSA PENYAKIT PADA AYAM DENGAN MENGGUNAKAN METODE TEOREMA BAYES TUGAS AKHIR

SISTEM INFORMASI PENJUALAN MEBEL BERBASIS E-COMMERCE TUGAS AKHIR

ESTIMASI PARAMETER DISTRIBUSI WEIBULL DUA PARAMETER DENGAN MENGGUNAKAN METODE PELUANG MOMENT BERBOBOT TUGAS AKHIR

BAB IV ANALISA DAN PERANCANGAN

PERBEDAAN PENERIMAAN DIRI PADA PASANGAN INFERTILITAS DITINJAU DARI JENIS KELAMIN SKRIPSI OLEH: MUHAMAD HARIADI

PENERAPAN TEORI PERMAINAN DALAM STRATEGI PEMASARAN PRODUK TUGAS AKHIR

APLIKASI ALGORITMA FLOYD WARSHALL UNTUK MENENTUKAN LINTASAN TERPENDEK TUGAS AKHIR

MUSIK DENGAN MENGGUNAKAN MEL FREQUENCY CEPSTRAL COEFFICIENT (MFCC) DAN SELF ORGANIZING MAPS (SOM) TUGAS AKHIR

PENGEMBANGAN APLIKASI E-LEARNING BERBASIS WEB PADA SMK YAPIM TARUNA SIAK HULU, KABUPATEN KAMPAR TUGAS AKHIR

PERANCANGAN ALAT PEMOTONG ADONAN KERUPUK MERAH YANG ERGONOMIS TUGAS AKHIR

STRATEGI BANK BRI SYARIAH DALAM MENANGANI PEMBIAYAAN KREDIT PEMILIKAN RUMAH (KPR) BERMASALAH (Study Kasus Pada Bank BRI Syariah Cabang Pekanbaru)

ANALISA RESULT RICH SNIPPETS GOOGLE PADA WEB E-COMMERCE BERBASIS SEMANTIC MARK-UP TUGAS AKHIR

SKRIPSI. Diajukan Sebagai Salah Satu Syarat Guna Mendapat Gelar Sarjana Ekonomi Syariah (SE.Sy) OLEH: NURHAYATI NIM

MENENTUKAN LINTASAN TERCEPAT FUZZY DENGAN ALGORITMA DIJKSTRA DAN ALGORITMA FLOYD MENGGUNAKAN METODE RANGKING FUZZY TUGAS AKHIR

IDENTIFIKASI PERANAN ICT DALAM PROSES PENCAPAIAN KESUKSESAN STRATEGI MENGGUNAKAN MODEL KNOWLEDGE MANAGEMENT METRICS (STUDI KASUS : UIN SUSKA RIAU)

PELAKSANAAN DIAGNOSIS KESULITAN BELAJAR SISWA DI SEKOLAH MENENGAH ATAS NEGERI 12 PEKANBARU

IMPLEMENTASI METODE WAVELET HAAR DAN PROBABILISTIC NEURAL NETWORK (PNN) UNTUK PENGENALAN CITRA DAGING BABI DAN DAGING SAPI TUGAS AKHIR

KEBERADAAN BADAN PEMBERDAYAAN MASYARAKAT DAN PEMERINTAH DESA DALAM MENINGKATKAN KELEMBAGAAN DESA DI KABUPATEN INDRAGIRI HILIR SKRIPSI

ANALISIS PENERAPAN SISTEM INFORMASI ADMINISTRASI KEPENDUDUKAN (SIAK) (Studi Kasus: Dinas Kependudukan dan Pencatatan Sipil Kota Pekanbaru) TUGAS AKHIR

OPTIMASI KUAT TEKAN PAVING BLOCK DENGAN METODE DESAIN EKSPERIMEN FAKTORIAL (Studi Kasus : CV. Riau Jaya Paving) TUGAS AKHIR

ANALISIS PENERAPAN REKAYASA NILAI PADA PROYEK PEMBANGUNAN PERUMAHAN ZAVIRA REGENCY (STUDI KASUS PT. TITO RUMPUN SEHATI) TUGAS AKHIR

PENGALAMAN KEGAGALAN PADA LAKI-LAKI DAN PEREMPUAN SKRIPSI OLEH : MUHAMMAD NUR SYAMSU

APLIKASII PREDIKSI KEBANGKRUTAN DENGAN IMPLEMENTASI JARINGAN SARAF TIRUAN RECURRENT MODEL ELMAN TUGAS AKHIR

STRATEGI PEMASARAN PRODUK TABUNGAN ib TUNAS HASANAH PADA PT. BANK BNI SYARIAH KANTOR CABANG PEKANBARU

Pengenalan Jenis Batu Mulia Menggunakan Wavelet Haar dan Jarak Euclidean

PERBEDAAN GAYA HIDUP HEDONIS MAHASISWA PSIKOLOGI YANG TINGGAL DI KOS DAN TINGGAL DI RUMAH ORANGTUA SKRIPSI

SIMULASI PEMROGRAMAN PARALEL PADA MEDAN ELEKTROMAGNETIK BERDIMENSI SATU DENGAN MENGGUNAKAN METODE FINITE DIFFERENCE TIME DOMAIN (FDTD) TUGAS AKHIR

ANALISIS KEPUASAN PERUSAHAAN TERHADAP KUALITAS PELAYANAN SECURITY PT. CAKRA GARDA NUSANTARA DI PT. RIFANSI DWI PUTRA TUGAS AKHIR

HUBUNGAN ANTARA PENGALAMAN SPIRITUAL DAN KESEJAHTERAAN PSIKOLOGIS DENGAN KONTROL DIRI PADA NARAPIDANA LAPAS KLAS II A KOTA PEKANBARU SKRIPSI

MODEL PROPAGASI UNTUK KANAL RADIO BERGERAK PADA FREKUENSI 900 MHZ DI KOTA PEKANBARU TUGAS AKHIR

PENGUKURAN DAN ANALISA KUALITAS DAYA SINYAL 3G MENGGUNAKAN HANDSET BERBASIS ANDROID STUDY KASUS DI PANAM PEKANBARU TUGAS AKHIR.

SIMULASI PERHITUNGAN RISE TIME BUDGET DAN POWER LINK BUDGET PADA SISTEM KOMUKASI SERAT OPTIK TUGAS AKHIR

IDENTIFIKASI WATERMARK UANG KERTAS RUPIAH MENGGUNAKAN METODE KERNEL PRINCIPAL COMPONENT ANALYSIS (KPCA) TUGAS AKHIR

ADE WILYANI NIM :

SKRIPSI. Diajukan Untuk Melengkapi Sebagian Syarat Guna Memperoleh Gelar Sarjana Ekonomi Syariah (S.E.Sy) Oleh: NORAZRINA NIM.

PELAKSANAAN PENDIDIKAN AKHLAK PADA ANAK USIA PRA SEKOLAH DALAM KELUARGA DI DESA PULAU PERMAI KECAMATAN TAMBANG KABUPATEN KAMPAR

INVERS MATRIKS BLOK DAN APLIKASINYA PADA MATRIKS DIAGONAL DAN SEGITIGA TUGAS AKHIR

SKRIPSI. Diajukan Sebagai Syarat Untuk Memperoleh Gelar Sarjana Syari ah (S.Sy)

IDENTIFIKASI JUMLAH KETURUNAN YANG MENGIDAP HEMOFILIA DENGAN MENGGUNAKAN METODE ALGORITMA GENETIKA TUGAS AKHIR. Oleh RUSYDI GUNAWAN

ANALISIS GRAF PIRAMIDA, GRAF BERLIAN, DAN GRAF BINTANG SEBAGAI GRAF PERFECT

USULAN PERANCANGAN TATA LETAK PABRIK KELAPA SAWIT DENGAN METODE SYSTEMATIC LAYOUT PLANNING (STUDI KASUS: PT. Kencana Andalan Nusantara) TUGAS AKHIR

ANALISA MARKETING MIX PENJUALAN ROTI PRIMA SARI DI DAERAH PEMASARAN KOTA KERINCI. (Studi kasus pada Cv. Prima sari pekanbaru) TUGAS AKHIR

PELAKSANAAN PERJANJIAN KEAGENAN ASURANSI JIWA PADA PT PRUDENTIAL LIFE ASSURANCE CABANG PEKANBARU SKRIPSI. Diajukan Untuk Melengkapi Sebagai Syarat

PENERAPAN SERVICE ORIENTED ARCHITECTURE (SOA) PADA WEB IKLAN TUGAS AKHIR

TUGAS AKHIR PENGARUH INTERFERENSI UPLINK PADA KONFIGURASI 2-TIERS TERHADAP KAPASITAS SEL HSPA MICROCELL

SKRIPSI. Diajukan untuk Melengkapi Tugas-tugas dan Memenuhi Salah Satu Syarat Guna Memperoleh Gelar Sarjana pada Fakultas Dakwah dan Ilmu Komunikasi

UPAYA PETANI KELAPA SAWIT DALAM MEMENUHI KEBUTUHAN HIDUP PADA MASA REPLANTING DITINJAU

APLIKASI PEMBELAJARAN KEBUDAYAAN JAWA BERBASIS MOBILE ANDROID

PENYELESAIAN SISTEM PERSAMAAN LINIER KOMPLEKS MENGGUNAKAN METODE ITERASI GAUSS-SEIDEL TUGAS AKHIR

PENERIMAAN DIRI REMAJA YANG MEMILIKI IBU TIRI SKRIPSI. Diajukan guna memenuhi persyaratan Untuk mendapatkan gelar Sarjana Psikologi

USULAN PERBAIKAN SISTEM KESELAMATAN DAN KESEHATAN KERJA (K3) PEMANENAN KELAPA SAWIT MENGGUNAKAN METODE SYSTEMATIC CAUSE ANALYSIS TECHNIQUE

PENGARUH PENGALAMAN, ORIENTASI ETIKA, KOMITMEN PROFESIONAL DAN KOMITMEN ORGANISASI TERHADAP SENSITIVITAS ETIKA AUDITOR

ANALISIS AKUNTANSI PERTANGGUNGJAWABAN SEBAGAI ALAT PENGENDALIAN BIAYA PADAPT. HARAPAN INDAH SENTOSA PEKANBARU SKRIPSI

ANALISIS DAMPAK LINGKUNGAN TERHADAP PENAMBANGAN EMAS DI KABUPATEN KUANTAN SINGINGI DALAM PERSPEKTIF EKONOMI ISLAM ( STUDI KASUS DESA LOGAS KECAMATAN

TUGAS AKHIR. Diajukan Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Teknik pada Jurusan Teknik Elektro. Oleh:

PERJANJIAN PENGIKATAN JUAL BELI HAK ATAS TANAH BERDASARKAN AKTA NOTARIS DI KECAMATAN KANDIS SKRIPSI

PENGARUH PENILAIAN PRESTASI KERJA DAN KOMPETENSI KARYAWAN TERHADAP PROMOSI JABATAN PADA PT. SUKA FAJAR Ltd BANGKINANG SKRIPSI OLEH

TUGAS AKHIR SITEM PENEMPATAN KARYAWAN PADA PD. BPR SARIMADU BANGKINANG. Diajukan sebagai salah satu untuk memperoleh gelar akademik Ahli Madya

STUDI PERFORMANSIPENGENDALISLIDING MODEDAN PID PADAPENGENDALIANKECEPATAN MOTOR DC TUGAS AKHIR

Transkripsi:

CLUSTERING DOKUMEN TEKS BERDASARKAN FINGERPRINT BIWORD WINNOWING DENGAN MENGGUNAKAN METODE K-MEANS TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Pada Jurusan Teknik Informatika Oleh YULISKA 10951007997 FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU PEKANBARU 2014

CLUSTERING DOKUMEN TEKS BERDASARKAN FINGERPRINT BIWORD WINNOWING DENGAN MENGGUNAKAN METODE K-MEANS YULISKA 10951007997 Tanggal Sidang : 26 Juni 2014 Periode Wisuda : Jurusan Teknik Informatika Fakultas Sains Dan Teknologi Univesitas Islam Negeri Sultan Syarif Kasim Riau ABSTRAK Kebutuhan akan informasi yang semakin meningkat menyebabkan informasi yang berbentuk dokumen teks mengalami penumpukan, sehingga proses pencarian menjadi sulit. Untuk itu, dilakukan suatu teknik clustering agar dokumen-dokumen yang memiliki tingkat kesamaan tinggi dapat berada pada satu kluster/kelompok yang sama, sehingga proses pencarian menjadi lebih mudah. Salah satu metode yang sering digunakan dalam kasus clustering adalah K-Means. Penelitian ini mencoba melakukan clustering terhadap dokumen teks dengan menggunakan metode K-Means berdasarkan fingerprint biword winnowing sebagai feature atau ciri dokumen teks, dimana biword winnowing adalah algoritma yang biasa dipakai untuk mendeteksi kesamaan isi suatu dokumen teks. Proses clustering diawali dengan mengekstrak fingerprint dari masingmasing dokumen yang ada pada koleksi dokumen dengan menggunakan algoritma biword winnowing. Kemudian dilakukan proses pembentukan dimensi dokumen yang merepresentasikan frekuensi kemunculan fingerprint dari masing-masing dokumen tersebut, dan dilanjutkan dengan proses clustering dokumen menggunakan metode K-Means. Selanjutnya, untuk mengetahui kualitas hasil pengelompokan dilakukan pengujian dengan menggunakan parameter precision. Dari keseluruhan hasil pengujian, kualitas hasil pengelompokan terhadap koleksi dokumen uji oleh aplikasi clustering dokumen teks ini dinilai baik dengan nilai precision 60%-88.33%. Kata Kunci : Biword Winnowing, Clustering, Fingerprint, K-Means, Precision. vii

KATA PENGANTAR Segala puji bagi Allah, Pencipta mausia dan alam semesta karena senantiasa melimpahkan rahmat dan karunianya yang tidak akan sanggup untuk penulis hitung, sehingga penulis dapat menyelesaikan laporan tugas akhir perkuliahan ini dengan baik. Shalawat dan salam rindu yang terdalam semoga senantiasa tercurah dan tersampaikan kepada Nabi Muhammad, keluarganya, para sahabatnya dan para pengikutnya yang setia hingga akhir zaman. Tugas akhir dengan judul Clustering dokumen teks berdasarkan fingerprint biword winnowing dengan menggunakan metode K-Means ini penulis susun dengan maksud untuk memenuhi tugas akhir perkuliahan yang dibebankan kepada penulis di samping untuk menambah dan memperdalam kemampuan penulis dalam memahami materi perkuliahan. Dalam kesempatan ini penulis juga ingin mengucapkan terima kasih kepada seluruh pihak yang telah membantu penulis dalam menyelesaikan laporan tugas akhir ini. Untuk itu penulis mengucapkan terima kasih yang tak terhingga kepada : 1. Allah SWT yang selalu melimpahkan rahmat dan nikmat-nya kepada penulis hingga terselesaikannya Tugas Akhir ini. 2. Bapak Prof. DR. H. Munzir Hitami, MA, selaku Rektor Universitas Islam Negeri Sultan Syarif Kasim Riau. 3. Ibu Dra. Hj.Yenita Morena, M.Si, selaku Dekan Fakultas Sains dan Teknologi, Universitas Islam Negeri Sultan Syarif Kasim Riau 4. Ibu Maylisda dan Ayah Zakaria tercinta, yang telah mendo akan dan memberikan dukungan yang sangat luar biasa kepada penulis dalam menyelesaikan tugas akhir ini. Semoga beliau selalu dalam lindungan Allah SWT serta segala ketulusan dan pengorbanan beliau diridhoi oleh Allah SWT. Amin. 5. Ibu Elin Haerani, S.T, M.Kom, selaku Ketua Jurusan Teknik Informatika. ix

6. Bapak Novriyanto, S.T, M.Sc, selaku Pembimbing Akademis Penulis. Terima kasih untuk segala bimbingan dan masukan yang telah diberikan kepada penulis. 7. Bapak Surya Agustian, S.T, M.Kom, selaku Pembimbing tugas akhir Penulis yang selalu sabar dan meluangkan waktu untuk membimbing, memberikan saran dan kritik dalam penyusunan tugas akhir ini. 8. Bapak Jasril, S.Si, M.Sc, selaku Penguji I tugas akhir. Terima kasih untuk segala masukan yang telah diberikan kepada penulis demi kesempurnaan laporan tugas akhir ini. 9. Ibu Elvia Budianita, S.T, M.Cs, Selaku Penguji II tugas akhir. Terima kasih untuk segala masukan yang telah diberikan kepada penulis demi kesempurnaan laporan tugas akhir ini. 10. Bapak Muhammad Affandes, S.T, M.T, selaku Koordinator Tugas akhir Jurusan Teknik Informatika. 11. Adik-adikku Rully Dwi Andika dan Febila Anzari yang telah memberikan dorongan dan semangat dalam menyelesaikan tugas akhir ini. 12. Seluruh keluarga besar Penulis, yang selalu memberikan semangat untuk menyelesaikan tugas akhir ini. 13. Seluruh dosen dan staf Fakultas Sains dan Teknologi khususnya pada Jurusan Teknik Informatika. Terima kasih atas ilmu yang telah diberikan. 14. Teman-teman seperjuangan penulis di UIN Suska Riau, teman-teman TIF 2009, Khususnya TIF C. Semoga yang telah lulus mendapat apa yang dicitacitakan dan yang belum lulus diberi kemudahan oleh Allah untuk menyusul teman-teman yang telah lulus. Amin. 15. Seluruh sahabat penulis, terima kasih untuk segala dukungannya. 16. Seluruh pihak yang belum penulis cantumkan, terima kasih atas dukungannya kepada penulis. Selanjutnya, penulis menyadari bahwa dalam penulisan laporan tugas akhir ini masih terdapat kekurangan. Oleh karena itu, penulis mengharapkan kritik dan saran yang membangun demi terciptanya laporan yang lebih baik di masa yang akan datang melalui email penulis yuliska_mz@yahoo.com atau hatake.bee@gmail.com. Penulis berharap laporan ini dapat bermanfaat bagi para x

pembaca, baik dari pihak UIN SUSKA RIAU maupun dari kalangan akademis serta masyarakat umum. Pekanbaru, Juni 2014 Penulis xi

DAFTAR ISI HALAMAN JUDUL LAPORAN... LEMBAR PERSETUJUAN... LEMBAR PENGESAHAN... LEMBAR HAK ATAS KEKAYAAN INTELEKTUAL... LEMBAR PERNYATAAN... LEMBAR PERSEMBAHAN... ABSTRAK... ABSTRACT... KATA PENGANTAR... DAFTAR ISI... DAFTAR GAMBAR... DAFTAR TABEL... DAFTAR LAMPIRAN... DAFTAR RUMUS... DAFTAR SIMBOL... BAB I PENDAHULUAN... 1.1 Latar Belakang... 1.2 Rumusan Masalah... 1.3 Batasan Masalah.... 1.4 Tujuan Penelitian... 1.5 Sistematika Penulisan... BAB II LANDASAN TEORI... 2.1 Text Mining... 2.1.1 Text Preprocessing... 2.1.2 Text Transformation... 2.1.2.1 Algoritma Winnowing... 2.1.2.2 Algoritma Biword Winnowing... 2.1.2.3 Stemming... 2.1.3 Feature Selection... Halaman i ii iii iv v vi vii viii ix xii xvi xviii xx xxi xxii I-1 I-1 I-2 I-2 I-3 I-3 II-1 II-1 II-1 II-2 II-2 II-5 II-11 II-12 xii

2.1.3.1 Document Representation... 2.1.3.2 Fungsi Jarak Dan Similaritas Antar Dokumen... 2.1.4 Data Mining... 2.1.4.1 Clustering Dokumen Dan Metodenya... 2.1.4.2 Hierarchical Aglomerative Clustering... 2.1.4.3 Divisive Clustering... 2.1.4.4 K-Means... 2.1.5 Evaluation... BAB III METODOLOGI PENELITIAN... 3.1 Identifikasi Masalah... 3.2 Pengumpulan Data... 3.3 Analisa Aplikasi... 3.4 Perancangan Aplikasi... 3.5 Implementasi... 3.5 Pengujian... 3.6 Kesimpulan dan Saran... BAB IV ANALISA DAN PERANCANGAN... 4.1 Analisa Kebutuhan Data... 4.2 Penyelesaian Masalah... 4.2.1 Text Preprocessing... 4.2.2 Text Transformation... 4.2.2.1 Proses Tokenizing... 4.2.2.2 Proses Enkripsi MD5... 4.2.2.3 Proses Hashing... 4.2.2.4 Pembentukan Window... 4.2.2.5 Pembentukan Fingerprint... 4.2.3 Feature Selection... 4.2.3.1 Penggabungan Dan Pengurutan Fingerprint... 4.2.3.2 Pembentukan Dimensi... 4.2.3.3 Reduksi Dimensi... 4.2.4 Data Mining... II-12 II-14 II-15 II-15 II-16 II-19 II-19 II-20 III-1 III-2 III-2 III-3 III-4 III-5 III-6 III-6 IV-1 IV-1 IV-2 IV-2 IV-4 IV-4 IV-6 IV-9 IV-12 IV-15 IV-16 IV-16 IV-17 IV-18 IV-20 xiii

4.2.4.1 Pembentukan Centroid... 4.2.4.2 Perhitungan Similarity... 4.2.4.3 Pengelompokkan... 4.2.4.4 Pembentukan Centroid Baru... 4.3 Perancangan Aplikasi... 4.3.1 Perancangan Struktur Menu... 4.3.2 Perancangan Pseudo Code... 4.3.2.1 Pseudo Code Text Preprocesing Dan Text Transformation... 4.3.2.2 Pseudo Code Feature Selection... 4.3.2.3 Pseudo Code Data Mining... 4.3.3 Perancangan Interface... 4.3.3.1 Rancangan Menu Halaman Utama (Home)... 4.3.3.2 Rancangan Menu Form Kluster... 4.3.3.3 Rancangan Menu Text Preprocessing... 4.3.3.4 Rancangan Menu Text Transformation... 4.3.3.5 Rancangan Menu Feature Selection... 4.3.3.6 Rancangan Menu Data Mining... 4.3.3.6 Rancangan Menu Help... BAB V IMPLEMENTASI DAN PENGUJIAN... 5.1 Tahapan Implementasi... 5.1.1 Batasan Implementasi... 5.1.2 Lingkungan Implementasi... 5.1.3 Implementasi Interface Aplikasi... 5.2 Pengujian Aplikasi... 5.2.1 Rencana Pengujian... 5.2.1.1 Pengujian Hasil Pengelompokan Dengan Pembentukan Centroid Cara I... 5.2.1.2 Pengujian Hasil Pengelompokan Dengan Pembentukan Centroid Cara I... 5.2.4 Kesimpulan Pengujian... BAB VI PENUTUP... IV-20 IV-22 IV-23 IV-24 IV-25 IV-25 IV-26 IV-26 IV-27 IV-28 IV-29 IV-30 IV-30 IV-31 IV-32 IV-32 IV-33 IV-34 V-1 V-1 V-1 V-1 V-2 V-10 V-10 V-12 V-21 V-30 VI-1 xiv

6.1 Kesimpulan... 6.2 Saran... DAFTAR PUSTAKA LAMPIRAN DAFTAR RIWAYAT HIDUP VI-1 VI-1 xv