3. METODOLOGI. Penelitian dilakukan dalam tiga tahap utama : Persiapan, Evaluasi

dokumen-dokumen yang mirip
1. PENDAHULUAN. Perkembangan teknologi informasi, khususnya teknologi Internet. mudah dan gratis, mengakibatkan informasi berlimpah.

PERANCANGAN PROTOTIPE SISTEM TEMU KEMBALI INFORMASI MENGGUNAKAN ALGORITMA FUZZY CLUSTERING AHMAD IRFANI

BAB III METODOLOGI PENELITIAN

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

BAB IV IMPLEMENTASI DAN PENGUJIAN

PENDAHULUAN. 1.1 Latar Belakang

PERANCANGAN PROTOTIPE SISTEM TEMU KEMBALI INFORMASI MENGGUNAKAN ALGORITMA FUZZY CLUSTERING AHMAD IRFANI

V HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

Penyusun Tugas Akhir : Ivan Hardiyanto (NRP : ) Dosen Pembimbing : Yudhi Purwananto, S.Kom, M.Kom Rully Soelaiman, S.Kom, M.

Gambar 5.1 Form Master Pegawai

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. informasi yang berbeda-beda. Berita yang dipublikasi di internet dari hari ke hari

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB V PENUTUP. Menggunakan Metode Fuzzy C-Means Clustering, dapat diambil kesimpulan

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. Perkembangan Aplikasi Web yang semakin berkembang pesat sejak munculnya

4 HASIL DAN PEMBAHASAN

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

APLIKASI MANAJEMEN PERPUSTAKAAN BERBASIS WEB MENGGUNAKAN PHP DAN MYSQL PADA SMA NEGERI 5 BINJAI TUGAS AKHIR FATIMAH

BAB I PENDAHULUAN Latar Belakang

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. serta dapat bertingkah sesuai norma-norma yang berlaku. Sebab ide dasar

BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM

DAFTAR ISI. SKRIPSI... ii

BAB I PENDAHULUAN. diidentifikasikan menurut lokasinya dalam sebuah database, dimana nantinya data

BAB IV IMPLEMENTASI DAN EVALUASI

ANALISIS KLASTERING LIRIK LAGU INDONESIA

BAB I PENDAHULUAN. informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga

APLIKASI ALGORITMA FUZZY C-MEANS CLUSTERING UNTUK PENGELOMPOKKAN LULUSAN

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Penerapan Algoritma K-Means untuk Clustering

BAB I PENDAHULUAN. yang berjalan untuk meningkatkan kegiatan usaha agar dapat berkembang ke

SEMINAR PROGRESS TUGAS AKHIR


BAB 1 PENDAHULUAN UKDW

III. METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN 1.1 Pendahuluan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah. Perkembangan Internet memang sangat cepat dan jauh berbeda dengan masa awal

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 3 ANALISA SISTEM

BAB I PENDAHULUAN. Semakin cepat waktu yang ditempuh maka semakin pendek pula jalur yang

BAB III METODE PENELITIAN

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Dengan menggunakan kecerdasan buatan maka tidaklah mustahil akan ada mesin yang benar-benar mampu berpikir layaknya manusia.

Bab 3 Metode Penelitian

BAB I PENDAHULUAN I-1

BAB III METODE PENELITIAN

BAB II TINJAUAN PUSTAKA

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN. Universitas Muhammadiyah Surakarta merupakan salah satu dari beberapa instansi

BAB III METODE PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB 1 PENDAHULUAN. dunia ini dengan menggunakan fasilitas maupun dengan cara chatting. Mungkin

BAB 3 METODE PENULISAN

BAB I PENDAHULUAN. Perkembangan teknologi dan ilmu pengetahuan pada masa globalisasi ini

BAB V IMPLEMENTASI DAN PENGUJIAN

PERANCANGAN WEBSITE PENJUALAN SECARA ONLINE MENGGUNAKAN PHP DAN MYSQL TUGAS AKHIR MIRA RIZKY S TANJUNG

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

BAB I PENDAHULUAN. nya. Karena diare merupakan hal yang sering dan rentan terjadi pada anak-anak di

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB 1 PENDAHULUAN. dengan berkembangnya internet di dunia, semua aktivitas coba dibawa ke internet.

BAB 3 ANALISA DAN PERANCANGAN

BAB I PENDAHULUAN Latar Belakang Masalah

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. yang benar-benar mempunyai skill atau kemampuan dalam bidang Teknologi

BAB I PENDAHULUAN. 1.1 Latar Belakang

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency

3.4 Data dari Melati Mekar Mandiri... 38

BAB 1 PENDAHULUAN. Kebutuhan akan informasi yang akurat dan tepat untuk penyajian data sangat

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN :

BAB I PENDAHULUAN. dalam suatu informasi berbasis geografis, misalnya data yang diidentifikasikan

Proyek Akhir II Aplikasi Transaksi Pengisian Voucher Handphone Berbasis Web BAB I PENDAHULUAN

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. Jaringan komputer adalah sebuah sistem yang terdiri atas komputerkomputer

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen

1. BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. persiapannya lebih singkat. E-Learning menjawab semua tantangan tersebut.

II TINJAUAN PUSTAKA. * adalah operasi konvolusi x dan y, adalah fungsi yang merepresentasikan citra output,

BAB 1 PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB II KAJIAN LITERATUR

BAB IV ANALISIS KERJA PRAKTEK

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU

IMPLEMENTASI LOGIKA FUZZY DALAM RECRUITMENT ASISTEN LABORATORIUM MENGGUNAKAN METODE C-MEANS (STUDI KASUS: TEKNIK INFORMATIKA UNIVERSITAS TANJUNGPURA)

BAB III ANALISIS DAN PERANCANGAN

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga

Transkripsi:

3. METODOLOGI A. Kerangka Pemikiran Penelitian dilakukan dalam tiga tahap utama : Persiapan, Evaluasi dan Pembuatan Prototipe Sistem (Gambar 3.1). Tahap Persiapan terdiri dari pengumpulan dokumen, input file dokumen ke basisdata dan membuat matriks representasi. Evaluasi algoritma dilakukan untuk memilih algoritma fuzzy clustering yang terbaik. yang dibandingkan ada tiga, yakni algoritma Fuzzy Subtractive Clustering (FSC), Hyperspherical- Fuzzy C-Means Clustering (H-FCM) dan Fuzzy Competitive Clustering. P E R S I A P A N STUDI PUSTAKA E V A L U A S I H-FCM FSC FCCL Matriks Data Uji E V A L U A S I KRITERIA UJI Precision Recall Speed Terbaik PEMBUATAN PROTOTIPE SISTEM Gambar 3.1 Kerangka Pemikiran Penelitian 52

Prototipe dikembangkan menggunakan algoritma clustering terbaik di antara ketiga algoritma yang diuji. Prototipe sistem temu kembali informasi bekerja berdasarkan input dokumen dan query, metode representasi dokumen dan query, proses atau metode pencarian dan metode menampilkan hasil query (Gambar 3.2). Pada penelitian ini, dokumen direpresentasikan oleh serangkaian term atau istilah yang memiliki bobot sedangkan query dipecah menjadi untaian kata. Metode pencarian yang digunakan metode Boolean. Gambar 3.2 Cara Kerja Prototipe Sistem Temu-Kembali Informasi B. Bahan dan Alat Dokumen yang digunakan sebagai bahan penelitian adalah artikel dan berita berbahasa Indonesia yang diambil dari beberapa situs Internet. Pembuatan prototipe sistem menggunakan PHP sebagai bahasa pemrogaman, MySQL sebagai Sistem Manajemen Basis Data dan HTML (Hypertext Markup Language) sebagai antar-muka sistem. C. Tata Laksana 1. Tahap Persiapan Pengujian dilakukan dalam 4 tahap (Gambar 3.3). Proses pengolahan data dan pembuatan prototipe selengkapnya dapat dilihat pada Lampiran 1. 53

Gambar 3.3 Tata Laksana Persiapan dan Evaluasi a. Pencarian Untuk menentukan algoritma yang akan digunakan, dilakukan penelusuran algoritma fuzzy clustering pada literatur. yang dicari memiliki sifat fuzzy dan partisi (mengelompokkan dokumen pada satu tingkat). Hasil penelusuran menghasilkan tiga algoritma : FCM, H-FCM dan FSC. b. Pengumpulan data Data yang digunakan adalah artikel yang dikumpulkan dari beberapa situs web. Artikel-artikel tersebut sudah terbagi menjadi beberapa kelompok, yakni berita politik, ekonomi, olah-raga dan iptek. Tidak semua bagian artikel digunakan sebagai data uji, melainkan hanya pargaraf utamanya saja. c. Representasi Data Uji Tujuan dari proses ini adalah untuk mendapatkan matriks bobot berukuran m x n; dimana m = banyaknya dokumen dan n = banyaknya kata. Ada tiga formula pembobotan term pada dokumen, yaitu Term 54

Frekuensi (TF), Term Frekuesni Inverse Dokumen Frekuensi (TFIDF) dan Salton. d. Penulisan Program Ketiga algoritma yang akan diuji diimplementasikan dalam program Matlab. Ketiga program tersebut masing-masing dijalankan untuk meng-cluster matriks bobot data. 2. Evaluasi Fuzzy Clustering a. Uji Formula Pembobotan Uji formula pembobotan dilakukan untuk mendapatkan formula pembobotan terbaik. Uji ini dilakukan bersamaan dengan uji algoritma. b. Uji Kinerja Kinerja algoritma dinilai berdasarkan cluster hasil. Ada tiga kriteria uji yang digunakan, yaitu Akurasi, Kolektifitas dan kecepatan (waktu eksekusi) algoritma. terbaik selanjutnya digunakan dalam pengembangan prototipe sistem temu kembali informasi. Ruang lingkup Penelitian Analisa Kebutuhan Pengembangan Prototipe Evaluasi Prototipe Sepesifikasi Sistem Komponen Daur Ulang Pengembangan Software Validasi Sistem Software Hasil Gambar 3.4 Tata Laksana Evaluasi 55

3. Pengembangan Prototipe Sistem Dalam pengembangan sistem, prototipe yang dihasilkan bukan merupakan tujuan akhir, melainkan untuk memberikan gambaran sistem yang lebih jelas kepada pengguna (Sommerville, 2000). Pada penelitian ini, prototyping melaksanakan tiga langkah dari enam langkah metode pengembangan sistem (Gambar 3.4). a. Outline Requirements Ada enam kriteria yang harus dipenuhi oleh sistem temu kembali informasi (Cleverdon, 1966), yakni : 1. Kemampuan sistem dalam menyediakan material yang relevan 2. Waktu pencarian yang relatif cepat 3. Presentasi output 4. Usaha pengguna untuk memperoleh informasi yang diinginkan 5. Akurasi 6. Kolektifitas Kriteria tersebut dapat digunakan sebagai parameter validasi dan verifikasi sistem yang dihasilkan. b. Pengembangan Prototipe Prototipe dibagi menjadi tiga modul utama, yaitu modul Representasi & Penyimpanan Dokumen, modul Pencarian dan modul Representasi Hasil. Masing-masing modul dikembangkan dalam dua tahap, yaitu perancangan dan implementasi. Pada tahap akhir, ketiga sub prototipe yang dihasilkan digabung menjadi sebuah prototipe sistem. Prototipe yang dihasilkan selanjutnya diuji apakah sudah 56

memenuhi kriteria (akurasi, kolektifitas dan kecepatan) yang diinginkan. Tata laksana Pengembangan Prototipe Sistem selengkapnya dapat dilihat pada Gambar 3.5. Analisis Pembuatan prototipe diawali dengan proses analisis. Tahapan analisis dilakukan untuk memahami kebutuhan, tujuan dan permasalahan dari pengembangan sistem. Pada tahap ini juga ditentukan model data dan fungsi atau modul yang diperlukan untuk mencapai tujuan pengembangan sistem. Analisa Model Disain Implementasi Representasi Dokumen Modul Input Pengujian Metode Pencarian Modul Pencari Prototipe Sistem Implementasi Clustering Terbaik Representasi Hasil Modul Representasi Hasil Tidak Apakah Prototipe memenuhi kriteria? Pengembangan Modul Penyimpanan Pengembangan Modul Pencari Pengembangan Modul Representasi Hasil Ya Selesai Gambar 3.5 Tata Laksana Pengembangan Prototipe Sistem Temu Kembali Informasi. 57

Perancangan & Implementasi Model Penyimpanan & Representasi Dokumen Dokumen beserta atribut nya (judul, nama pengarang, tahun dan abstrak) disimpan dalam basisdata. Karena pada proses pencarian dokumen direpresentasikan oleh serangkaian istilah yang dimiliki, maka istilah-istilah tersebut juga perlu disimpan dalam database. Rancangan basisdata harus diatur sedemikian rupa, sehingga kita dapat mengetahui dengan cepat dan tepat istilah apa saja yang dimiliki oleh dokumen beserta frekuensi kemunculan dan bobotnya; juga dalam dokumen apa saja suatu istilah ditemukan. Tujuan dari Representasi Dokumen adalah untuk mendapatkan daftar istilah yang dimiliki setiap dokumen. Setiap istilah memiliki nilai bobot pada setiap dokumen yang dihitung berdasarkan rumus (Salton & Buckley, 1988). Setiap istilah dan bobotnya disimpan pada basisdata. Perancangan & Implementasi Model Pencarian Model pencarian terdiri atas model input dan metode pencarian. Pada penelitian ini diusulkan ada dua jenis input yang digunakan untuk pencarian dokumen, yaitu bahasa query dan parameter kedekatan. Bahasa query dirancang untuk dapat menggunakan Operator Boolean (AND dan OR). Parameter kedekatan nantinya akan digunakan untuk memperluas atau mempersempit cakupan pencarian dengan membandingkan derajat keanggotaan dokumen pada cluster hasil. Dokumen yang ditampilkan pada hasil hanyalah dokumen dengan 58

derajat keanggotaan sama dengan atau lebih besar dari parameter kedekatan. Implementasi Clustering Terbaik Fuzzy Clustering yang digunakan merupakan algoritma terbaik hasil pengujian. menerima input dokumen hasil pencarian dan matriks bobot istilah setiap dokumen. Output dari algoritma adalah beberapa cluster dokumen hasil pencarian. Perancangan & Implementasi Representasi Hasil Output pencarian harus dirancang sedemikian rupa sehingga dapat menggambarkan pengelompokan dokumen yang ada, tanpa mengurangi kemudahan pengguna dalam mengakses dokumen yang diinginkan. Disain output yang diusulkan akan terdiri atas cluster, dokumen dan derajat keanggotaan dokumen pada cluster. Setelah query dilakukan, pertama kali sistem menampilkan link cluster hasil query. Link cluster dapat diklik untuk membuka halaman yang menampilkan dokumen beserta derajat keanggotaannya pada cluster tersebut. Dokumen ditampilkan berurutan sesuai dengan derajat keanggotaannya. c. Evaluasi Prototipe Dari enam kriteria Cleverdon (1966), hanya tiga kriteria yang digunakan untuk mengevaluasi prototipe, yakni: waktu pencarian, akurasi dan kolektifitas. Tiga kriteria ini dipilih karena dapat dihitung langsung secara kuantitatif. Waktu pencarian dihitung mulai dari pengguna menekan tombol pencarian sampai sistem menampilkan hasil dalam bentuk cluster. 59

Akurasi dihitung menggunakan persamaan 36 dan kolektifitas menggunakan persamaan 37. d. Kompleksitas Sistem Kompleksitas waktu sistem dihitung pada proses representasi matriks dokumen dan proses clustering. Proses representasi matriks memiliki T(n) = n (12m + 11) + 23 m + 11 atau T(n) O(nm). Proses clustering yang menggunakan algoritma H-FCM memiliki kompleksitas waktu sebesar O(nc 2 m) (n = total kata pada dokumen, c = total cluster, i = iterasi dan m = total dokumen, dengan c << i < m << n). Secara keseluruhan, sistem memiliki kompleksitas O(nc 2 m). 60