BAB III METODOLOGI PENELITIAN. Desain penelitian adalah tahapan atau gambaran yang akan dilakukan

dokumen-dokumen yang mirip
BAB III BAB 3 METODOLOGI PENELITIAN. dalam proses penelitian implementasi metode Bisecting K-Means untuk. Tahapan penelitian yang dilakukan yaitu:

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari

BAB 3 METODE PENELITIAN. dalam melakukan penelitian untuk memudahkan penyusun dalam

1 BAB III METODE PENELITIAN

BAB 3 METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

1 BAB III METODOLOGI PENELITIAN. collaborative filtering ini digambarkan pada gambar 3.1

BAB III METODOLOGI PENELITIAN. Gambar 3.1 merupakan desain penelitian yang akan digunakan dalam

BAB III METODELOGI PENELITIAN. Desain penelitian adalah langkah dan proses yang akan dilakukan dalam

BAB III METODOLOGI PENELITIAN. Untuk memperlancar proses penelitian, maka dibentuk desain penelitian yang

Gambar 3.1 Desain penelitian

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB III METODE PENELITIAN

Bab III METODOLOGI PENELITIAN. Pada penelitian ini menggunakan ala penelitian berupa perangkat keras

Berikut langkah-langkah penelitian yang dilakukan: 1. Menentukan kebutuhan data yang akan digunakan.

4 BAB 4 IMPLEMENTASI DAN PENGUJIAN

BAB V IMPLEMENTASI SISTEM

BAB III METODE PENELITIAN. Tahapan penelitian yang akan dilakukan adalah sebagai berikut: keputusan tingkat kesehatan.

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. sebagai sumber pertama dan utama yang banyak memuat ajaran-ajaran yang

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

Bab 3 Metoda dan Perancangan Sistem

BAB I PENDAHULUAN. digunakan untuk identitas citra adalah nama file, tanggal pengambilan,

BAB III METODOLOGI PENELITIAN. dibutuhkan desain penelitian. Berikut adalah tahapan-tahapan dalam desain

BAB I PENDAHULUAN. perkembangan teknologi yang ada. Semakin banyak fitur yang dibenamkan ke

BAB III METODOLOGI PENELITIAN. Desain penelitian adalah tahapan atau gambaran yang akan dilakukan

BAB I PENDAHULUAN. Dari tahun ke tahun sudah tidak dapat dipungkiri bahwa teknologi informasi

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. dalam memperkenalkan identitas suatu bangsa. Provinsi Jawa Barat adalah salah

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III MET PEN METODOLOGI PENELITIAN

BAB I PENDAHULUAN. informasi yang berbeda-beda. Berita yang dipublikasi di internet dari hari ke hari

BAB V IMPLEMENTASI PERANGKAT LUNAK. Aplikasi setelah dianalisa dan dirancang, maka aplikasi tersebut siap

BAB III METODOLOGI PENELITIAN. melakukan penelitian yang bertujuan untuk memudahkan peneliti dalam

BAB I PENDAHULUAN. Menurut Peraturan Menteri Pendidikan dan Kebudayaan (Permendikbud) Nomor 103

BAB I PENDAHULUAN. pesat, salah satunya adalah perangkat portable seperti ponsel, notebook dan yang

BAB I PENDAHULUAN. Kemajuan teknologi informasi saat ini fungsinya sudah merambah ke

BAB IV HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN. dan dengan fungsi yang hampir menyerupai komputer. Android adalah sistem

BAB V IMPLEMENTASI DAN PENGUJIAN

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN. pengembangan sistem pemugaran citra digital dengan algoritma exemplar-based

BAB III METODE PENELITIAN. Desain penelitian adalah tahapan yang menggambarkan susunan dalam

BAB III METODOLOGI PENELITIAN. Metode yang diterapkan dalam pembuatan skripsi ini, antara lain: dengan topik baik berupa textbook atau paper.

BAB III METODOLOGI PENELITIAN. menu makanan berbasis web pada konsumen restoran menggunakan metode

BAB 1 PENDAHULUAN Pengantar

BAB III METODOLOGI PENELITIAN. penelitian dalam hal ini adalah Abstraksi dari karya ilmiah dan skripsi pada

BAB IV IMPLEMENTASI DAN PENGUJIAN

III. METODOLOGI PENELITIAN

BAB I PENDAHULUAN. bagaimana membuat mesin (komputer) dapat melakukan pekerjaan seperti dan

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN. implementasi algoritma Blowfish pada audio steganografi berbasis MP3.

BAB III METODE PENELITIAN. peneltian, dibutuhkan desain penelitian. Berikut adalah tahapan penelitian yang dilakukan:

BAB III METODOLOGI PENELITIAN. digunakan pada proses rekomendasi penjurusan pada jenjang menengah. Merumuskan Masalah

BAB I PENDAHULUAN. beserta penyediaan fasilitasnya, tidak hanya dilakukan oleh pemerintah, namun

BAB I PENDAHULUAN. didapatkan secara mudah, cepat, efektif dan akurat. pengaruh perkembangan teknologi informasi. Sebagai institusi pendidikan, saat

BAB III METODOLOGI PENELITIAN

APLIKASI PENGELOLAAN DATA BARANG CV. TRIMULTI MANUNGGAL BERBASIS WEBSITE MENGGUNAKAN PHP DAN MYSQL

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. Sebagaimana diketahui, Sistem Informasi Geografis merupakan Sistem. yang dapat menjelaskan situasi dan keadaan tempat tersebut.

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

1.2. Latar Belakang Masalah

1.1 Latar Belakang Masalah

BAB 3. METODE PENELITIAN. Desain penelitian adalah tahapan atau gambaran yang akan dilakukan

BAB III METODOLOGI PENELITIAN

UKDW BAB 1 PENDAHULUAN

BAB 1 PENDAHULUAN. jual beli barang secara online dengan hanya memanfaatkan fasilitas forum jual. beli, atau menggunakan media telepon dan sms.

BAB III METODOLOGI PENELITIAN

Artikel Jurnal penelitian tugas akhir di suatu institusi perguruan tinggi

BAB I PENDAHULUAN. Sistem informasi manajemen layanan kesehatan (SIMLKES) merupakan

BAB I PENDAHULUAN. dan terkadang juga tidak mengikuti jam mata kuliah. Salah satu faktor

BAB 4 IMPLEMENTASI DAN PENGUJIAN

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. manusia dari segala aspek kehidupan dan berbagai bidang.

1.1 Latar Belakang Masalah

BAB III METODOLOGI PENELITIAN. ini. Pada dasarnya penelitian ini terpisah antara pengembangan MBROLA

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB 3. METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

APLIKASI SISTEM INFORMASI PENGOLAHAN DATA PADA DIREKTORAT RESERSE KRIMINAL KHUSUS POLDA SUMBAR

BAB III METODOLOGI PENELITIAN. Tahap Awal. 2. Menentukan algoritma kriptografi yang digunakan dalam penelitian

BAB V IMPLEMENTASI SISTEM

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB V IMPLEMENTASI SISTEM. Implementasi dari Sistem Informasi Pengolahan Data Penerimaan DSPB dan

BAB III METODOLOGI PENELITIAN

BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM. Tahap ini juga merupakan tahap meletakkan sistem agar siap untuk dioperasikan dan

BAB III METODOLOGI PENELITIAN

BAB V IMPLEMENTASI SISTEM. informasi telah digunakan oleh pengguna. Sebelum benar-benar bisa digunakan

BAB III METODOLOGI PENELITIAN

2.19 CSS (Cascading Style Sheets) PHP Codeigniter Studi Pustaka... 28

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. dimana ilmu pengetahuan dan pendidikan tidak hanya dapat diperoleh dari metode


BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. Terdapat sistem operasi yang berkembang antara lain mobile phone

Transkripsi:

BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian adalah tahapan atau gambaran yang akan dilakukan peneliti dalam melakukan penelitian. Desain penelitian dibuat untuk memudahkan peneliti dalam melakukan tahap-tahap penelitian. adalah: Tahapan-tahapan desain penelitian yang peneliti lakukan diantaranya 1. Mengumpulkan data yang diperlukan berupa textbook, paper dan karya ilmiah yang membahas algoritma-algoritma yang digunakan untuk pengelompokan dokumen. Dikumpulkan juga data berupa paper yang membahas pengujian cluster dan preprocessing teks. 2. Setelah dikumpulkan data yang diperlukan, ditentukan data yang akan dipakai pada penelitian ini yaitu berupa textbook, paper dan karya ilmiah yang membahas algoritma Clustering Based On Frequent Word Sequences (CFWS) dan K-Means. 3. Mempersiapkan alat dan bahan penelitian berupa komputer, tools bahasa pemrograman dan bahan penelitian berupa seratus dokumen yang diambil dari website kompas. 38

39 4. Setelah disiapkan alat dan bahan penelitian, dibangun perangkat lunak dengan metode Rational Unified Process (RUP). 5. Hasil dari pembangunan perangkat lunak pengelompokan dokumen adalah cluster hasil pengelompokan dokumen dengan CFWS dan cluster hasil pengelompokan dengan K-Means. 6. Kumpulan cluster hasil implementasi kedua algoritma tersebut diuji dengan mengukur akurasi dan kemurnian cluster berdasarkan nilai F- Measure dan Purity. 7. Setelah diuji, didapatkan algoritma yang tepat untuk pengelompokan dokumen berbahasa Indonesia. Gambar dibawah ini merupakan gambar desain penelitian dari tahapan-tahapan penelitian yang dilakukan diatas:

40 Langkah awal penelitian: 1. Mengumpulkan data yang diperlukan. 2. Menentukan data yang dibutuhkan untuk penelitian ini. 3. Mempersiapkan alat dan bahan penelitian. Tahap analisis: 1. Mendeskripsikan perangkat lunak. 2. Analisis kebutuhan perangkat lunak. Tahap desain: 1. Membuat rancangan aplikasi. 2. Membuat rancangan database. Dataset Tahap coding: 1. Implementasi CFWS : a. preprocessing b.find fws c.built gst d.clustering 2. Implementasi K-Means: a. preprocessing b.vector term c.clustering k- means Tahap pengujian: Perangkat lunak diuji menggunakan black box. Rational Unified Process (RUP) Cluster CFWS Cluster K-Means Dataset dikelompokan secara manual. Pengujian cluster dengan F- Measure dan K-Means Kumpulan cluster yang bagus. Gambar 3.1 Desain Penelitian

41 3.2 Metodologi Penelitian 3.2.1 Metode Pengambilan Data Metode pengambilan data yang digunakan pada penelitian ini adalah metode studi kepustakaan. Pada metode ini dilakukan eksplorasi dan studi literatur yaitu dengan mempelajari teknik clustering, algoritma CFWS, algoritma K-Means, pembangunan sistem pengelompokan dokumen melalui literaturliteratur seperti textbook, jurnal, karya ilmiah, paper dan sumber ilmiah lainnya yang didapat dari internet. Pada metode ini juga dilakukan eksplorasi dan studi literatur yang membahas pengujian cluster dan preprocessing teks. 3.2.2 Metode Pengembangan Perangkat Lunak Metode pendekatan perangkat lunak yang digunakan untuk mengelompokan dokumen adalah Rational Unified Process (RUP). Rational Unified Process merupakan proses rekayasa perangkat lunak yang melaksanakan tugas dan tanggung jawab diantara organisasi pengembang perangkat lunak berdasarkan pendekatan disiplin. RUP merupakan petunjuk untuk menggunakan Unified Modeling Language (UML) yang merupakan tools yang digunakan untuk membangun perangkat lunak pada penelitian ini.

42 Proses RUP dapat dilihat pada gambar berikut: Gambar 3.2 Rational Unified Process (Sumber: Openia.2010 : 1 dalam www.openia.com) Berdasarkan gambar diatas, terdapat 4 fase yaitu: 1. Inception Phase : Pada fase ini, dilakukan analisis kebutuhan perangkat lunak dan deskripsi perangkat lunak. Pada fase ini, dianalisis kebutuhan sistem, interaksi sistem, interaksi sistem dengan user dan analisis kelaskelas yang akan diimplementasikan. Kebutuhan sistem pada penelitian ini yaitu sistem harus dapat melakukan preprocessing teks, sistem dapat melakukan proses mendapatkan frequent word sequence, sistem dapat membangun generalized suffix tree, sistem dapat melakukan clustering

43 dengan k-mismatch, sistem dapat mengubah dokumen menjadi vector space model dan sistem dapat melakukan clustering dengan k-means. 2. Elaboration Phase: Pada fase ini, dirancang kelas-kelas yang berkaitan dengan kebutuhan-kebutuhan sistem yang telah didefinisikan pada fase inception. Kelas-kelas tersebut adalah preprocessing, getwords, fws, TreeNode, mapping, node, ClusterKmismatch, overlapping, ClusterKmeans, vectorterm dan dokumen. Pada fase ini, dirancang juga antarmuka perangkat lunak atau interface yang disesuaikan dengan kebutuhan fungsional yang telah ditentukan. 3. Construction Phase: Pada fase ini, semua desain yang berkaitan dikembangkan dan digabung menjadi perangkat lunak. Pada fase ini, dilakukan tahapan coding terhadap desain yang telah dirancang. Pada implementasi algoritma CFWS, frequent word sequence yang telah didapatkan, digabung berdasarkan batas ketidakcocokan kata. Apabila batas ketidakcocokan kata adalah satu maka dua frequent word sequence yang memiliki satu perbedaan kata dapat digabungkan. Untuk algoritma k- means, ditentukan centroid awal terlebih dahulu. Dokumen-dokumen yang memiliki kedekatan terhadap centroid tersebut digabung menjadi satu. Setelah itu, dihitung ulang centroid pada suatu cluster berdasarkan jumlah anggota pada cluster tersebut. 4. Transition Phase: Pada fase ini, perangkat lunak diuji dengan menggunakan black box. Pengujian dilakukan untuk semua fungsi yang

44 terdapat pada perangkat lunak. Jika ada kesalahan atau tambahan fitur dapat kembali ke tahap sebelumnya yaitu Construction Phase. 3.3 Alat dan Bahan Penelitian 3.3.1 Alat Penelitian Untuk membuat perangkat lunak, pada penelitian ini digunakan alat penelitian berupa perangkat keras dan perangkat lunak sebagai berikut: 1. Perangkat keras Perangkat keras yang digunakan adalah notebook TOSHIBA Portege M800 dengan spesifikasi sebagai berikut: a. Processor Intel Centrino 2.0 GHz b. RAM 1 GB c. Harddisk minimal 40 GB d. Monitor beresolusi 1280 pixels e. Mouse dan keyboard 2. Perangkat lunak Perangkat lunak yang digunakan adalah sebagai berikut: a. Sistem operasi: Microsoft Windows Vista Basic b. Bahasa pemrograman: Java (Java SE 6) c. Tools pemrograman: Netbeans 6.0.1 d. Database Management System (DBMS): MySQL

45 Adapun library yang digunakan untuk membantu membangun perangkat lunak adalah sebagai berikut: a. MySQL Connector Java versi 5.1.6. Library yang digunakan untuk melakukan koneksi antara bahasa pemrograman Java dengan basis data MySQL. Adapun daftar stopword berbahasa Indonesia yang digunakan pada saat preprocessing text diambil di situs berikut ini: http://fpmipa.upi.edu/staff/yudi/stop_words_list.txt 3.3.2 Bahan Penelitian Bahan penelitian yang digunakan adalah dokumen berupa berita berbahasa Indonesia yang didapat dari World Wide Web yang disalin ke dalam file berekstensi txt. Bahan penelitian ini diambil dari situs berita kompas. 3.4 Implementasi Penelitian 3.4.1 Prosedur Pengerjaan Penelitian Peneliti ini membutuhkan beberapa tahap pengerjaan dimulai dari pengumpulan data berupa dokumen berita berbahasa Indonesia, eksplorasi teori algoritma K-Means dan CFWS, pemahaman bahasa pemrograman Java, merancang perangkat lunak pengelompokan dokumen dan menguji akurasi dan kemurnian cluster hasil implementasi CFWS dan K-Means berdasarkan patokan dataset yang dikelompokan secara manual.

46 Adapun urutan pengerjaan yang harus dilalui adalah sebagai berikut: 1. Pengumpulan data berupa dokumen berita berbahasa Indonesia dan menyalinnya pada file txt. Dikumpulkan juga data yang membantu proses clustering seperti daftar stopword berbahasa Indonesia. 2. Melakukan pengelompokan dokumen secara manual untuk digunakan sebagai patokan perhitungan akurasi dan kemurnian pada saat proses pengujian cluster. 3. Membuat rancangan kelas-kelas dengan Java. Dalam langkah ini, terlibat beberapa tool baik software maupun library yang digunakan untuk mengembangkan perangkat lunak. 4. Pembangunan interface aplikasi yang disesuaikan dengan fitur-fitur yang telah didefinisikan pada kebutuhan fungsional sistem yaitu: a. Preprocessing b. Menemukan frequent word sequence c. Membangun generalized suffix tree d. Clustering dengan k-mismatch e. Mengubah dokumen menjadi vector space model f. Clustering dengan k-means 5. Perancangan dan pembangunan datastore yang disesuaikan dengan kebutuhan fitur. Pada penelitian ini, dibuat 4 datastore yaitu folder untuk penyimpanan file hasil preprocessing, menemukan frequent word sequence, pengubahan dokumen menjadi vector space model dan preprocessing pada paket implementasi k-means.

47 3.4.2 Pengumpulan Data Pengumpulan data pada penelitian ini meliputi teori-teori yang menunjang implementasi algoritma K-Means dan CFWS. Dikumpulkan juga teori-teori yang berhubungan dengan pengujian akurasi dan kemurnian cluster serta teori-teori yang berhubungan dengan preprocessing teks.