BAB III BAB 3 METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian merupakan tahapan yang akan dilakukan peneliti untuk mempermudah dalam melakukan penelitian. Desain penelitian yang digunakan dalam proses penelitian implementasi metode Bisecting K-Means untuk pengelompokan dokumen elektronik berbahasa Indonesia digambarkan seperti pada Gambar 3.1. Tahapan penelitian yang dilakukan yaitu: 1. Menentukan kebutuhan data yang digunakan untuk dilakukan pengelompokan 2. Mengumpulkan data yang dibutuhkan, data yang telah ditentukan kemudian dikumpulkan untuk diproses. 3. Mempersiapkan alat dan bahan penelitian. Alat yang dipersiapkan berupa perangkat keras dan perangkat lunak yang menunjang pembuatan sistem. Dan bahan yang digunakan merupakan data-data berupa dokumen elektronik yang telah dikumpulkan untuk dilakukan proses. 4. Pengembangan perangkat lunak dengan menggunakan metode V-Model. Pranajati, 2012 Implementasi Metode Bisecting K-Means Untuk Pengelompokan Dokumen Elektronik Berbahasa Indonesia Universitas Pendidikan Indonesia repository.upi.edu
29 5. Hasil dari pembangunan perangkat lunak pengelompokan dokumen yaitu berupa cluster-cluster hasil dari implementasi metode Bisecting K-Means beserta dengan nilai Overall Similarity. 6. Cluster-cluster yang didapatkan diuji kualitasnya dengan menggunakan nilai Purity dan Entropy yang memanfaatkan dataset yang dikelompokan secara manual.
30 1. Menentukan kebutuhan data 2. Mengumpulkan data 3. Menyiapkan alat dan bahan penelitian Analisa Kebutuhan: 1. Mendeskripsikan perangkat lunak 2. Analisis kebutuhan perangkat lunak Desain Sistem: Merancang perangkat lunak berdasarkan analisis kebutuhan Tes Unit & Antarmuka, Pengujian Sistem, serta Acceptable Testing: Pengujian Black Box Dataset Desain Program: merekayasa struktur program, algoritma, serta struktur data Coding: 1. Preprocessing 2. Pemodelan 3. Bisecting K-Means 1. Cluster 2. Nilai Overall Similarity Evaluasi Cluster: 1. Purity 2. Entropy Pengelompokan dataset secara manual Gambar 3.1. Desain penelitian 3.2 Metode Penelitian 3.2.1 Proses Pengumpulan Data Pada penelitian ini, data dan informasi-informasi yang akurat dapat menunjang proses penelitian. Pada proses ini dilakukan eksplorasi dan studi literatur yaitu dengan mempelajari metode Bisecting K-Means melalui literaturliteratur seperti textbook, jurnal, karya ilmiah, paper dan sumber ilmiah lainnya
31 yang didapat dari internet. Pada metode ini juga dilakukan eksplorasi dan studi literatur yang membahas tentang preprocessing teks dan pengujian kualitas cluster. 3.2.2 Proses Rekayasa Sistem Proses rekayasa yang dilakukan dalam penelitian ini yaitu menggunakan metode V-Model. Tahapan pada V-Model serupa dengan model waterfall/classical tetapi lebih menekankan terhadap asosiasi antar tahapan sebelum pemrograman dan sesudahnya. Penekanan yang utama ada pada tahap verifikasi dan validasi. Analisa Kebutuhan Validasi Kebutuhan Acceptable Testing Desain Sistem System Testing Operations & Maintenance Verifikasi Desain Desain Program Tes Unit & Antarmuka Coding Gambar 3.2. V-Model
32 Tahapan yang dilakukan dalam V-Model yaitu: 1. Analisa Kebutuhan, dilakukan pengumpulan data serta informasi yang kemudian dianalisis sehingga mendapatkan gambaran kebutuhan aplikasi 2. Desain Sistem, perekayasaan sistem berdasarkan analisis kebutuhan. 3. Desain Program, perekayasaan struktur program, algoritma, serta struktur data. 4. Coding, dibangun suatu aplikasi dari hasil perancangan program yang mampu menyelesaikan atau mengolah data-data yang telah terkumpul. 5. Tes Unit dan Antarmuka, dilakukan suatu pengujian terhadap aplikasi yang telah dibangun setingkat low-level testing dan jika ada kekurangan maka tahap ini berkoneksi dengan tahap 3 yaitu Desain Program. 6. System Testing, dilakukan pengujian pada sistem, bila terjadi ketidak sesuaian maka tahap ini berkoneksi dengan tahap 2 yaitu Desain Sistem. 7. Acceptable Testing, dilakukan pengujian bersifat menyeluruh dengan simulasi data sebenarnya. Bila terjadi ketidaksesuaian, maka tahap ini akan berinteraksi langsung dengan tahap 1 yaitu Analisis Kebutuhan. 8. Operations & Maintenance, merupakan tahap akhir pengembangan sistem dimana sistem diimplementasi dan diterima serta dijalankan sesuai kebutuhan.
33 3.3 Alat dan Bahan Penelitian Pada penelitian ini digunakan alat penelitian berupa perangkat keras dan perangkat lunak sebagai berikut: 1. Perangkat keras a. Processor AMD Turion X2 Dual Core b. SRAM 3 GB c. Harddisk berkapasitas 180 GB d. Monitor beresolusi 1280 pixel e. Mouse dan keyboard 2. Perangkat lunak a. Microsoft Windows 7 Professional b. Java SE 6 c. Netbeans 7.0 d. XAMPP 1.7.3 e. Microsoft Office 2010 f. Adobe Reader X Adapun library yang digunakan untuk membantu membangun perangkat lunak : 1. Apache POI 3.8, digunakan untuk membaca teks pada file-file Microsoft Office. 2. Apache PdfBox 1.6.0, digunakan untuk membaca teks pada file PDF.
34 3. MySQL Connector 5.1.18, digunakan untuk menghubungkan bahasa pemrograman Java dengan database MySQL. Bahan penelitian yang digunakan adalah kumpulan stopwords dan kata dasar yang diambil dari http://www.kaskus.us/showthread.php?t=8521714, serta dataset berupa dokumen-dokumen elektronik yang diambil dari http://ilmukomputer.org/ dan http://file.upi.edu/browse.php?dir=direktori/dual- MODES. 3.4 Implementasi Penelitian 3.4.1 Prosedur Pengerjaan Penelitian Penelitian ini membutukan beberapa tahapan yang harus dilakukan seperti pengumpulan data berupa dokumen, stopwords, kata dasar bahasa Indonesia, eksplorasi algoritma Bisecting K-Means, perancangan perangkat lunak, serta pengujian kualitas dari hasil implementasi berdasarkan atau tidak berdasarkan dataset yang dikelompokan secara manual. berikut: Prosedur pengerjaan penelitian yang harus dilakukan adalah sebagai 1. Pengumpulan data berupa dokumen elektronik, stopwords, serta kata-kata dasar berbahasa Indonesia. 2. Melakukan pengelompokan dokumen secara manual yang digunakan sebagai salah satu parameter untuk melakukan pengukuran kualitas dari implementasi penelitian yang telah dilakukan.
35 3. Membangun perangkat lunak yang disesuaikan dengan proses-proses yang telah didefinisikan pada kebutuhan fungsional sistem. 4. Perancangan dan pembangunan datastore yang disesuaikan dengan kebutuhan fitur. Datastore yang digunakan yaitu directory yang berisi dokumen elektronik, database kata dasar dan stopwords bahasa Indonesia, serta file teks yang berisi data-data pengelompokan secara manual. 3.4.2 Pengumpulan Data Pengumpulan data yang dilakukan yaitu meliputi teori-teori yang menunjang implementasi algoritma Bisecting K-Means. Dikumpulkan juga teoriteori yang berhubungan dengan pembentukan kata Bahasa Indonesia, pemodelan data, serta pengujian kualitas cluster.