PENGELOMPOKAN DOKUMEN BAHASA INDONESIA DENGAN TEKNIK REDUKSI DIMENSI NONNEGATIVE MATRIX FACTORIZATION DAN RANDOM PROJECTION SKRIPSI

dokumen-dokumen yang mirip
UNIVERSITAS INDONESIA KLASIFIKASI TOPIK MENGGUNAKAN METODE NAÏVE BAYES DAN MAXIMUM ENTROPY PADA ARTIKEL MEDIA MASSA DAN ABSTRAK TULISAN SKRIPSI

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen

PENENTUAN OUTLIER PADA ALGORITMA PROPAGASI BALIK MENGGUNAKAN PERHITUNGAN JARAK MAHALANOBIS DAN JARAK FUZZY TESIS

UNIVERSITAS INDONESIA BLANKON: SEBUAH STUDI KASUS PENGEMBANGAN PERANGKAT LUNAK BEBAS

UNIVERSITAS INDONESIA ANALISIS DAN PERANCANGAN STRATEGI PADA PERTANDINGAN SEPAK BOLA ANTAR ROBOT SKRIPSI

ANALISIS PERBANDINGAN PEMBACAAN KWH METER ANALOG DENGAN KWH METER DIGITAL PADA KETIDAKSEIMBANGAN BEBAN SKRIPSI

PERBANDINGAN KINERJA PENDEKATAN VIRTUALISASI KARYA AKHIR

Universitas Indonesia Fakultas Ilmu Komputer Depok Juli 2008

UNIVERSITAS INDONESIA ANALISIS DAY OF THE WEEK EFFECT TERHADAP IMBAL HASIL IHSG SERTA KAITANNYA DENGAN RESIKO PASAR MODAL PERIODE

Novi Indriyani

UNIVERSITAS INDONESIA

UNIVERSITAS INDONESIA TRANSFER ARSIP DINAMIS INAKTIF : STUDI KASUS DI PUSTAKA BOGOR SKRIPSI HUTAMI DEWI

PENGEMBANGAN SISTEM PEROLEHAN INFORMASI UNTUK DOKUMEN LEGAL INDONESIA SKRIPSI

ANALISIS KANDUNGAN FENOL TOTAL JAHE (Zingiber officinale Roscoe) SECARA IN VITRO SKRIPSI

TESIS. Diajukan sebagai salah satu syarat untuk memperoleh gelar Magister Ilmu Hukum

IMPLIKASI PENERIMAAN SIPRUS DALAM KEANGGOTAAN UNI EROPA TERHADAP PENERIMAAN TURKI DALAM KEANGGOTAAN UNI EROPA TESIS

UNIVERSITAS INDONESIA

UNIVERSITAS INDONESIA ANALISIS HUBUNGAN PERDAGANGAN INTERNASIONAL DAN FDI TERHADAP PERTUMBUHAN EKONOMI INDONESIA SKRIPSI

FEAR OF FLOATING: STUDI EMPIRIS SISTEM NILAI TUKAR SECARA DE FACTO DI INDONESIA DALAM PERIODE

UNIVERSITAS INDONESIA KELENGKAPAN IMUNISASI DASAR ANAK BALITA DAN FAKTOR-FAKTOR YANG BERHUBUNGAN DI RUMAH SAKIT MARY CILEUNGSI HIJAU BOGOR, MARET 2008

UNIVERSITAS INDONESIA STATUS GIZI IBU MENYUSUI DAN FAKTOR FAKTOR YANG BERHUBUNGAN DI JAKARTA BARAT TAHUN 2009 SKRIPSI DESSY SEPTIANINGSIH Y

Pembebanan Overhead Cost di UI Pada Masa UI-BHMN dan Kemungkinan Penerapan Model Activity Based Costing

UNIVERSITAS INDONESIA

UNIVERSITAS INDONESIA

PARTISIPASI MASYARAKAT DALAM PROGRAM TANGGUNG JAWAB SOSIAL PERUSAHAAN PT PERTAMINA GEOTHERMAL ENERGY

POSISI SISWA SEBAGAI SUBJEK DALAM SISTEM PENDIDIKAN NASIONAL: TELAAH KRITIS DALAM KERANGKA FILSAFAT PENDIDIKAN PAULO FREIRE SKRIPSI ANDI SETYAWAN

PERILAKU KUAT TEKAN DAN KUAT LENTUR PADA PERVIOUS CONCRETE SKRIPSI

PROGRAM SARJANA STRATA 1 PROGRAM STUDI SISTEM INFORMASI FAKULTAS TEKNIK DAN ILMU KOMPUTER UNIVERSITAS BAKRIE JAKARTA

UNIVERSITAS INDONESIA

PERANCANGAN SHELL AND TUBE HEAT EXCHANGER TIPE FIXED HEAD DENGAN MENGGUNAKAN DESAIN 3D TEMPLATE SKRIPSI

ANALISIS PERBANDINGAN KINERJA BANK KONVENSIONAL DAN BANK SYARIAH DENGAN MENGGUNAKAN METODE RASIO KEUANGAN PERIODE SKRIPSI

UNIVERSITAS INDONESIA

UNIVERSITAS INDONESIA

ANALISIS TERHADAP JUAL BELI TANAH YANG PERPINDAHAN HAKNYA TIDAK DISERTAI PROSES BALIK NAMA (Studi Kasus Putusan Nomor 388/PDT.G/2002/ PN JKT.

UNIVERSITAS INDONESIA

UNIVERSITAS INDONESIA

UNIVERSITAS INDONESIA

UNIVERSITAS INONESIA EVALUASI FAKTOR REDUKSI GEMPA PADA SISTEM GANDA RANGKA RUANG SKRIPSI AUDI VAN SHAF ( X)

UNIVERSITAS INDONESIA JUDUL KA KARYA AKHIR NAMA MAHASISWA NPM

UNIVERSITAS INDONESIA ANALISIS POSISI PENDANAAN DANA PENSIUN TERHADAP KENAIKAN MANFAAT PENSIUN (STUDI KASUS DANA PENSIUN PLN TAHUN 2008) SKRIPSI

UNIVERSITAS INDONESIA

UNIVERSITAS INDONESIA PENCARIAN POLA SEKUENSIAL MENGGUNAKAN ALGORITMA APRIORI ALL SKRIPSI FANDI

UNIVERSITAS INDONESIA

PEMBERDAYAAN LEMBAGA SWADAYA MASYARAKAT (LSM) DALAM UPAYA PENCEGAHAN PENYALAHGUNAAN NARKOBA T E S I S

UNIVERSITAS INDONESIA MENCARI HUBUNGAN ANTARA KUAT TEKAN DENGAN FAKTOR AIR SEMEN DARI CAMPURAN BETON MENGGUNAKAN MATERIAL LOKAL SKRIPSI

UNIVERSITAS INDONESIA

PENAMBAHAN BAHAN KIMIA FENILBUTAZON PADA JAMU TRADISIONAL REMATIK

UNIVERSITAS INDONESIA PERBANDINGAN PREVALENSI MIKROFILARIA ANTARA PEMERIKSAAN MIKROSKOPIK DENGAN BRUGIA RAPID SKRIPSI

ASPEK HUKUM PERJANJIAN PENAMBAHAN FASILITAS KREDIT (REFINANCING) SEBAGAI ADDENDUM PERJANJIAN KREDIT MODAL KERJA SKRIPSI

UNIVERSITAS DIPONEGORO YOUTH CENTER KUDUS DENGAN PENEKANAN DESAIN ARSITEKTUR ORGANIK TUGAS AKHIR PERIODE JANUARI JULI 2015

ANALISIS FAKTOR-FAKTOR YANG MEMENGARUHI ARUS KAS MASA MENDATANG

UNIVERSITAS INDONESIA STUDI PENGARUH PENAMBAHAN KARBON PADA PROSES REDUKSI LANGSUNG BATU BESI SKRIPSI

TESIS. Oleh : NOVIE SOEGIHARTI NPM

ANALISIS HUKUM TERHADAP PENERAPAN SURAT KUASA DALAM PRAKTEK JUAL BELI TANAH DAN PENDAFTARAN PEMELIHARAAN DATA TESIS

PENGARUH SOSIALISASI KELUARGA TERHADAP PERILAKU PROSOSIAL ANAK USIA REMAJA AWAL (Studi Pada Murid-Murid SLTP Negeri X di Jakarta) SKRIPSI

ANALISIS KUALITAS LAYANAN PERPAJAKAN PAJAK KENDARAAN BERMOTOR (STUDI KASUS SAMSAT KOTA BEKASI) SKRIPSI

DESAIN PELATIHAN KETAHANAN NASIONAL UNTUK PIMPINAN ORGANISASI KEMASYARAKATAN PEMUDA (OKP) TESIS

ANALISIS KOMPETENSI PEGAWAI DALAM PENERAPAN TEKNOLOGI INFORMASI DI MAHKAMAH KONSTITUSI TESIS

UNIVERSITAS INDONESIA EFEK KITOSAN TERHADAP VIABILITAS KULTUR GALUR SEL HSC-4 DAN A549 SECARA IN VITRO SKRIPSI

UNIVERSITAS INDONESIA

AKTIVITAS SPESIFIK KATALASE JARINGAN JANTUNG TIKUS YANG DIINDUKSI HIPOKSIA HIPOBARIK AKUT BERULANG SKRIPSI

PENERAPAN CONTROLLED FOREIGN CORPORATION (CFC) RULES DI INDONESIA : SUATU TINJAUAN UNTUK MENCEGAH PENGHINDARAN PAJAK (ANTI-TAX AVOIDANCE) SKRIPSI

UNIVERSITAS INDONESIA KAJI ULANG SISTEM DRAINASE FAKULTAS TEKNIK UNIVERSITAS INDONESIA DENGAN MENGGUNAKAN METODE PELACAKAN SALURAN (CHANNEL ROUTING)

EFEKTIVITAS PENERAPAN SISTEM INFORMASI MANAJEMEN PADA DIREKTORAT BADAN PENGKAJIAN DAN PENGEMBANGAN KEBIJAKAN (BPPK) DEPARTEMEN LUAR NEGERI SKRIPSI

ANALISIS FAKTOR PENYEBAB KECELAKAAN LALU LINTAS PADA PENGENDARA SEPEDA MOTOR DI WILAYAH DEPOK SKRIPSI

PENERAPAN PRINSIP KEHATI HATIAN (PRUDENTIAL BANKING) DALAM RANGKA PEMBERIAN KREDIT DENGAN JAMINAN DEPOSITO SECARA GADAI DI BANK X TESIS

EVALUASI IMPLEMENTASI STANDAR AKUNTANSI PEMERINTAHAN PADA SEKRETARIAT JENDERAL DEPARTEMEN HUKUM DAN HAM RI

UNIVERSITAS INDONESIA

HUBUNGAN ANTARA KEPUASAN KERJA DENGAN KINERJA KARYAWAN PADA PT ASURANSI JIWASRAYA (PERSERO) KANTOR CABANG JAKARTA TIMUR SKRIPSI WIDIANA SASTI KIRANA

UNIVERSITAS INDONESIA PENGEMBANGAN SISTEM INFORMASI REKAPITULASI DOKUMEN PERUNDANG-UNDANGAN DI INDONESIA SKRIPSI RIZAL MULYADI

TESIS MERRY MAGDALENA UNIVERSITAS INDONESIA FAKULTAS EKONOMI PROGRAM STUDI MAGISTER MANAJEMEN JAKARTA DESEMBER 2008

UNIVERSITAS INDONESIA DISTRIBUSI FREKUENSI CELAH BIBIR DAN LANGITAN DI RUMAH SAKIT ANAK DAN BUNDA HARAPAN KITA JAKARTA TAHUN 1998 DAN 2000

ANALISIS PENGUKURAN DAN PENGELOLAAN ECONOMIC EXPOSURE PADA PT. ABC TESIS. Diajukan sebagai salah satu syarat untuk memperoleh gelar S2

UNIVERSITAS INDONESIA

PENGUJIAN ALAT PENDINGIN ADSORPSI DUA ADSORBER DENGAN MENGGUNAKAN METHANOL 250 ml SEBAGAI REFRIGERAN TUGAS AKHIR ANDI TAUFAN FAKULTAS TEKNIK

MUSEUM BAHARI TANJUNG MAS SEMARANG DENGAN DESAIN UNDERWATER

UJI AKTIVITAS ANTIDIABETES EKSTRAK DAN FRAKSI DARI EKSTRAK n-heksana BUAH KETAPANG DAN PENAPISAN FITOKIMIA DARI FRAKSI TERAKTIF SKRIPSI

Peran Work Engagement Dalam Produktivitas Student Brand Manager Red Bull Indonesia. Tugas Akhir

UNIVERSITAS INDONESIA. Analisa Sistem Penilaian Kinerja di PT Epson Indonesia TESIS. Henky Hidayat

UNIVERSITAS INDONESIA

UNIVERSITAS INDONESIA TESIS

UNIVERSITAS INDONESIA

KANDUNGAN FENOL TOTAL EKSTRAK BUAH MENGKUDU (Morinda citrifolia) SKRIPSI

SKRIPSI. Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana Ekonomi NICHOLAS BINSAR ANDREW B

UNIVERSITAS INDONESIA

UNIVERSITAS DIPONEGORO BANGUNAN SHOPPING MALL DENGAN KONSEP CITY WALK DI SEMARANG TUGAS AKHIR DENI WIBAWANTO

KATA PENGANTAR. i Pemetaan citra..., Haryadi Herdian, FASILKOM UI, 2009

UNIVERSITAS INDONESIA

UNIVERSITAS INDONESIA

ANALISIS KEBUTUHAN TENAGA BERDASARKAN BEBAN KERJA DI BAGIAN HUMAN RESOURCE DEPARTEMENT (HRD) RUMAH SAKIT KARYA BHAKTI BOGOR TAHUN 2009 SKRIPSI

ANALISIS PELAKSANAAN PENGAWASAN ORANG ASING BERDASARKAN UNDANG-UNDANG NOMOR 9 TAHUN 1992 TENTANG KEIMIGRASIAN TESIS RUDI HALOMOAN TOBING

RELEASE AND DISCHARGE SEBAGAI ALTERNATIF PENYELESAIAN MASALAH (Studi Kasus Kebijakan Penyelesaian BLBI)

UNIVERSITAS INDONESIA FAKTOR-FAKTOR YANG BERHUBUNGAN DENGAN KETIDAKSERTAAN WUS DALAM KB (STUDI KECAMATAN TANAH ABANG JAKARTA PUSAT) TAHUN 2009 SKRIPSI

UNIVERSITAS DIPONEGORO KAMPUS FAKULTAS PSIKOLOGI UNIVERSITAS DIPONEGORO TUGAS AKHIR ATIKAH FAKULTAS TEKNIK JURUSAN TEKNIK ARSITEKTUR

LP3A SEKOLAH INKLUSI DI KABUPATEN BOYOLALI ISTI NUGROHO

UNIVERSITAS INDONESIA. PELAKSANAAN GOOD CORPORATE GOVERNANCE PADA PROGRAM CORPORATE SOCIAL RESPONSIBILITY PT ANTAM Tbk SKRIPSI

UNIVERSITAS INDONESIA

UNIVERSITAS INDONESIA EKSISTENSI DAN PERAN AMAKUDARI DALAM PERUSAHAAN INDUSTRI JEPANG SKRIPSI

UNIVERSITAS DIPONEORO JUDUL REDESAIN GEDUNG JURUSAN TEKNIK ARSITEKTUR UNIVERSITAS DIPONEGORO

UNIVERSITAS INDONESIA FAKTOR-FAKTOR PENYALAHGUNAAN NARKOBA PADA SISWA SEKOLAH LANJUTAN TINGKAT ATAS

Transkripsi:

UNIVERSITAS INDONESIA PENGELOMPOKAN DOKUMEN BAHASA INDONESIA DENGAN TEKNIK REDUKSI DIMENSI NONNEGATIVE MATRIX FACTORIZATION DAN RANDOM PROJECTION SKRIPSI Suryanto Ang 1205000886 FAKULTAS ILMU KOMPUTER UNIVERSITAS INDONESIA DEPOK 2009

UNIVERSITAS INDONESIA PENGELOMPOKAN DOKUMEN BAHASA INDONESIA DENGAN TEKNIK REDUKSI DIMENSI NONNEGATIVE MATRIX FACTORIZATION DAN RANDOM PROJECTION SKRIPSI Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana Suryanto Ang 1205000886 FAKULTAS ILMU KOMPUTER UNIVERSITAS INDONESIA DEPOK 2009

HALAMAN PERNYATAAN ORISINALITAS Skripsi ini adalah hasil karya saya sendiri, dan semua sumber baik yang dikutip maupun dirujuk telah saya nyatakan dengan benar Nama : Suryanto Ang NPM : 1205000886 Tanda Tangan : Tanggal : ii

HALAMAN PENGESAHAN Skripsi ini diajukan oleh : Nama : Suryanto Ang NPM : 1205000886 Program Studi : Ilmu Komputer Judul Skripsi : Pengelompokan Dokumen Bahasa Indonesia dengan Teknik Reduksi Dimensi Nonnegative Matrix Factorization dan Random Projection Telah berhasil dipertahankan di hadapan Dewan Penguji dan diterima sebagai bagian persyaratan yang diperlukan untuk memperoleh gelar Sarjana Ilmu Komputer pada Program Studi Ilmu Komputer, Fakultas Ilmu Komputer, Universitas Indonesia DEWAN PENGUJI Pembimbing : Dr. Hisar Maruli Manurung, S.Kom ( ) Penguji : Dra. Mirna Adriani, Ph.D ( ) Penguji : Dr. Ade Azurat, S.Kom ( ) Ditetapkan di : Tanggal : iii

KATA PENGANTAR Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa karena atas rahmat dan karunia-nya penulis dapat menyelesaikan tugas akhir ini dalam jangka waktu yang telah ditetapkan. Atas rahmat dan karunia-nya juga, penulis dapat menyusun laporan tugas akhir yang berisi penjelasan mengenai tugas akhir yang penulis lakukan. Penulis juga ingin menyampaikan rasa terima kasih kepada semua pihak yang secara langsung maupun tidak langsung telah memberikan bantuan, dukungan serta semangat, sehingga penulis dapat menyelesaikan tugas akhir ini dengan baik. Penulis ingin menyampaikan rasa terima kasih kepada: 1. Kedua orang tua penulis yang selalu mendoakan, memberikan dukungan serta semangat pada setiap kegiatan yang penulis lakukan. 2. Saudara-saudara penulis yang selalu memberikan dukungan dan motivasi sehingga penulis dapat mengerjakan tugas akhir ini dengan semangat. 3. Bapak Hisar Maruli Manurung selaku dosen pembimbing tugas akhir yang telah membimbing penulis dalam pengerjaan tugas akhir hingga penyusunan laporan. 4. Bapak Achmad Nizar Hidayanto selaku pembimbing akademis. 5. Rekan-rekan penulis di Laboratorium Information Retrieval yang telah membantu penulis dan selalu bersama penulis dalam setiap suka dan duka. 6. Rekan-rekan penulis di Fakultas Ilmu Komputer yang telah memberikan bantuan kepada penulis. 7. Semua pihak yang tidak bisa penulis sebutkan disini satu per satu yang telah ikut membantu penulis dalam pengerjaan tugas akhir ini. Penulis menyadari bahwa penulisan laporan ini tidak sepenuhnya sempurna, masih terdapat kekurangan. Oleh karena itu, penulis sangat mengharapkan saran dan masukan atas laporan ini agar penulis dapat memperbaiki kesalahan pada kesempatan yang lain. Penulis berharap semoga laporan ini dapat memberikan manfaat bagi para pembaca semua. iv

Jakarta, Juni 2009 Suryanto Ang v

HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI TUGAS AKHIR UNTUK KEPENTINGAN AKADEMIS Sebagai sivitas akademik Universitas Indonesia, saya yang bertanda tangan dibawah ini: Nama : Suryanto Ang NPM : 1205000886 Program Studi : Ilmu Komputer Fakultas Jenis Karya : Ilmu Komputer : Skripsi Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Indonesia Hak Bebas Royalti Noneksklusif (Non-exclusive Royalty- Free Right) atas karya ilmiah saya yang berjudul : PENGELOMPOKAN DOKUMEN BAHASA INDONESIA DENGAN TEKNIK REDUKSI DIMENSI NONNEGATIVE MATRIX FACTORIZATION DAN RANDOM PROJECTION Dengan Hak Bebas Royalti Noneksklusif ini Universitas Indonesia berhak menyimpan, mengalihmedia/format-kan, mengelola dalam bentuk pangkalan data (database), merawat, dan memublikasikan tugas akhir saya selama tetap mencantumkan nama saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta. Demikian pernyataan ini saya buat dengan sebenarnya. Dibuat di : Pada tanggal : Yang menyatakan ( ) vi

DAFTAR ISI HALAMAN JUDUL i HALAMAN PERNYATAAN ORISINALITAS ii HALAMAN PENGESAHAN iii KATA PENGANTAR iv HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI TUGAS AKHIR UNTUK KEPENTINGAN AKADEMIS...vi ABSTRAK.vii DAFTAR ISI...ix DAFTAR TABEL.xii DAFTAR GAMBAR xiii BAB I PENDAHULUAN 1 1.1. Latar Belakang..1 1.2. Permasalahan 2 1.3. Tujuan...2 1.4. Ruang Lingkup.3 1.5. Metodologi Penelitian..3 1.6. Sistematika Penulisan...4 BAB II LANDASAN TEORI..5 2.1. Pengelompokan Dokumen atau Document Clustering.5 2.2. Teknik untuk Mengelompokkan Dokumen..7 2.3. Vector Space Model.8 2.4. Metrik untuk Pengukuran Tingkat Kesamaan 11 2.5. Nonnegative Matrix Factorization..13 2.6. Random Projection.17 2.7. K-Means.20 BAB III PERANCANGAN...22 3.1. Alur Pengelompokan Dokumen.22 3.2. Data 23 3.3. Persiapan Data 24 3.4. Penentuan Fitur...25 3.5. Term-Document Matrix..26 vii Universitas Indonesia

3.6. Teknik Pengelompokan Dokumen.28 3.6.1. Nonnegative Matrix Factorization 29 3.6.2. Random Projection...29 3.7. Pemetaaan Kluster yang Dibangun ke Kluster yang Sebenarnya..30 3.8. Evaluasi Kinerja.31 3.9. Perancangan Eksperimen 32 BAB IV IMPLEMENTASI...34 4.1. Persiapan Data 34 4.2. Implementasi Penentuan Fitur 39 4.3. Pembuatan Term-Document Matrix...42 4.4. Implementasi Teknik Pengelompokan Dokumen..45 4.4.1. Implementasi Teknik Non-Negative Matrix Factorization..46 4.4.2. Implementasi Teknik Random Projection dengan K-Means 49 4.5. Evaluasi Kinerja.51 BAB V HASIL DAN PEMBAHASAN 52 5.1. Percobaan Pengelompokan Dokumen 52 5.2. Percobaan dari Aspek Fitur 58 5.2.1. Analisa Efek Stopwords...60 5.2.2. Analisa Pengaruh Jumlah Fitur yang Digunakan.62 5.2.3. Analisa Pengaruh Jenis Informasi Fitur...63 5.3. Percobaan dari Aspek Parameter Khusus Teknik..64 5.3.1. Analisa Parameter Teknik Nonnegative Matrix Factorization.67 5.3.2. Analisa Parameter Teknik Random Projection 68 5.4. Percobaan dari Aspek Dokumen 69 5.4.1. Analisa Pengaruh Jumlah dan Ukuran Kluster.71 5.4.2. Analisa Pengaruh Keseragaman Ukuran Kluster.74 5.5. Percobaan dari Aspek Teknik Pengelompokan..76 5.6. Percobaan dari Aspek Kemiripan Kluster..77 5.7. Percobaan dari Aspek Sumber Dokumen...81 5.8. Percobaan Pengelompokan Dokumen ke Kluster yang Jumlahnya Melebihi Jumlah Kategori yang Dipakai..82 5.9. Rangkuman Hasil Percobaan..85 viii Universitas Indonesia

BAB VI PENUTUP...87 6.1. Rangkuman.87 6.2. Kesimpulan.88 6.3. Kendala...88 6.4. Saran...89 DAFTAR PUSTAKA 90 Lampiran A: Daftar Stopwords..92 Lampiran B: Contoh Artikel..93 B.1. Contoh Artikel Kompas Kategori Bisnis Keuangan..93 B.2. Contoh Artikel Kompas Kategori Olahraga..93 B.3. Contoh Artikel Kompas Kategori Kesehatan 93 B.4. Contoh Artikel Kompas Kategori Perempuan...94 B.5. Contoh Artikel Kompas Kategori Sains...94 B.6. Contoh Artikel Kompas Kategori Travel...94 B.7. Contoh Artikel Kompas Kategori Properti 95 B.8. Contoh Artikel Kompas Kategori Politik Hukum.95 B.9. Contoh Artikel Antara Kategori Olahraga.96 Lampiran C: Hasil Eksperimen..97 C.1. Hasil Eksperimen dari Aspek Fitur: Penggunaan Stopwords, Jumlah Fitur yang Digunakan, Jenis Informasi Fitur.97 C.2. Hasil Eksperimen dari Aspek Parameter Khusus Teknik..99 C.3. Hasil Eksperimen dari Aspek Jumlah dan Ukuran Kluster.100 C.4. Hasil Eksperimen dari Aspek Keseragaman Ukuran Kluster..102 C.5. Hasil Eksperimen dari Aspek Teknik: Nonnegative Matrix Factorization, Random Projection dengan K-Means, dan K-Means..103 C.6. Hasil Eksperimen dari Aspek Kemiripan Kluster 103 C.7. Hasil Eksperimen Pengelompokan Dokumen dari Sumber Berbeda..105 C.8. Hasil Eksperimen Pengelompokan Dokumen ke dalam Kluster yang Jumlahnya Melebihi Jumlah Kategori yang Dipakai..106 ix Universitas Indonesia

DAFTAR TABEL Tabel 5.1. Variabel Percobaan... Tabel 5.2. Akurasi Hasil Percobaan dari Aspek Fitur: Jenis Informasi Fitur, Persentase Fitur yang Digunakan, dan Penggunaan Stopwords dengan Teknik Nonnegative Matrix Factorization Tabel 5.3. Akurasi Hasil Percobaan dari Aspek Fitur: Jenis Informasi Fitur, Persentase Fitur yang Digunakan, dan Penggunaan Stopwords dengan Teknik Random Projection Tabel 5.4. Efek Stopwords pada Akurasi NMF dan RP.. Tabel 5.5. Pengaruh Jumlah Fitur dan Jenis Informasi Fitur yang Digunakan pada Akurasi NMF dan RP Tabel 5.6. Akurasi Hasil Percobaan dari Aspek Nilai Lambda dan Jumlah Iterasi Teknik Nonnegative Matrix Factorization... Tabel 5.7. Akurasi Hasil Percobaan dari Aspek Jumlah Pengurangan Dimensi dan Tipe Distribusi Matriks Acak teknik Random Projection... Tabel 5.8. Pengaruh Jumlah dan Ukuran Kluster pada Akurasi NMF Tabel 5.9. Pengaruh Jumlah dan Ukuran Kluster pada Akurasi RP... Tabel 5.10.Pengaruh Keseragaman Ukuran Kluster pada Akurasi NMF dan RP Tabel 5.11.Perbandingan Akurasi Pengelompokan dengan NMF, RP dengan K-Means, dan K-Means. Tabel 5.12.Pengaruh Kemiripan Kluster pada Akurasi NMF... Tabel 5.13.Pengaruh Kemiripan Kluster pada Akurasi RP. Tabel 5.14.Akurasi Pengelompokan Dokumen dari Sumber Berbeda... Tabel 5.15.Hasil Percobaan Pengelompokan Dokumen ke Kluster yang Jumlahnya Melebihi Jumlah Kategori yang Dipakai dengan Teknik NMF... Tabel 5.16.Hasil Percobaan Pengelompokan Dokumen ke Kluster yang Jumlahnya Melebihi Jumlah Kategori yang Dipakai dengan Teknik RP... 55 59 60 60 62 65 66 72 72 74 77 79 79 82 83 84 x Universitas Indonesia

DAFTAR GAMBAR Gambar 2.1. Contoh Term-document Matrix.. Gambar 2.2. Ilustrasi Vektor Dokumen dalam Sistem Koordinat... Gambar 3.1. Alur Pengelompokan Dokumen.. Gambar 3.2. Term-document Matrix... Gambar 4.1. Pseudocode Pengambilan Data Artikel dari Website.. Gambar 4.2. Tampilan Website Kompas Kategori Kesehatan Gambar 4.3. Tampilan Salah Satu Artikel Kompas. Gambar 4.4. Pseudocode Penentuan Fitur... Gambar 4.5. Pseudocode Penghapusan Stopwords. Gambar 4.6. Pseudocode Pembuatan Term-document Matrix Gambar 4.7. Term-document Matrix dengan Informasi Fitur Presence... Gambar 4.8. Vektor Label Kategori Dokumen Gambar 4.9. Tahapan Pengelompokan Dokumen... Gambar 4.10.Pseudocode Implementasi Nonnegative Matrix Factorization... Gambar 4.11.Pseudocode Implementasi Random Projection dengan K- Means.. Gambar 4.12.Pseudocode Evaluasi Kinerja.. Gambar 5.1. Grafik Pengaruh Stopwords pada Akurasi NMF dan RP Gambar 5.2. Grafik Pengaruh Jumlah Fitur dan Jenis Informasi Fitur pada Akurasi NMF dan RP. Gambar 5.3. Grafik Percobaan NMF dengan Informasi Jumlah Iterasi dan Konvergensi Gambar 5.4. Grafik Pengaruh Nilai Lambda dan Jumlah Iterasi pada Akurasi NMF Gambar 5.5. Pengaruh Tipe Distribusi Matriks Acak dan Jumlah Pengurangan Dimensi pada Akurasi RP. 10 12 22 26 36 36 37 40 41 44 45 45 46 48 50 51 61 63 66 67 69 xi Universitas Indonesia

Gambar 5.6. Grafik Pengaruh Jumlah dan Ukuran Kluster pada Akurasi NMF Gambar 5.7. Grafik Pengaruh Jumlah dan Ukuran Kluster pada Akurasi RP. Gambar 5.8. Grafik Pengaruh Keseragaman Kluster pada Akurasi NMF dan RP... Gambar 5.9. Grafik Perbandingan Akurasi Pengelompokan dengan NMF, RP dengan K-Means, dan K-Means... Gambar 5.10.Grafik Pengaruh Kemiripan Kluster pada Akurasi NMF Gambar 5.11.Grafik Pengaruh Kemiripan Kluster pada Akurasi RP... Gambar 5.12.Akurasi Pengelompokan Dokumen dari Sumber Berbeda.. 73 74 75 77 80 80 82 xii Universitas Indonesia

13 Universitas Indonesia