BAB III ANALISA DAN PERANCANGAN SISTEM

dokumen-dokumen yang mirip
TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

BAB III ANALISIS III.1 Analisis Konseptual Teknik Pengolahan Data

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

Bab 3 Metode Penelitian

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL

BAB IV PEMBAHASAN. Pada penelitian ini menggunakan data mahasiswa Fakultas Teknik alumni

BAB III ANALISA DAN PERANCANGAN

BAB III METODOLOGI PENELITIAN

JURNAL TEKNIK POMITS Vol. 1, No. 1, (2012) 1-5 1

BAB III METODOLOGI PENELITIAN

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

PENDAHULUAN. 1.1 Latar Belakang

Penerapan Algoritma K-Means untuk Clustering

BAB III ANALISA DAN PERANCANGAN SISTEM

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III PERANCANGAN SISTEM

BAB III ANALISIS MASALAH DAN RANCANGAN PROGRAM

Pengumpulan Data. Analisa Data. Pembuatan Use Case,Activity dan Sequence Diagram. Perancangan Database. Bisnis Proses.

BAB IV PERANCANGAN SISTEM

UKDW BAB I PENDAHULUAN

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-521

BAB III METODOLOGI PENELITIAN

BAB IV ANALISA DAN PERANCANGAN

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

BAB III ANALISA DAN PERANCANGAN. Pada dasarnya perancangan sistem yang dibuat oleh peneliti adalah

BAB I PENDAHULUAN. masyarakat tanpa kertas (paperless society) (Hernawati, 2005). Berdasarkan buku

DETEKSI PLAGIARISME DENGAN ALGORITMA RABIN KARP DAN ALGORITMA KLASTERISASI SUFFIX TREE PADA TEKS DOKUMEN TUGAS AKHIR

BAB IV ANALISIS, PERANCANGAN, DAN IMPLEMENTASI PERANGKAT LUNAK

BAB III METODOLOGI PENELITIAN

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

BAB I PENDAHULUAN Latar Belakang

PEMBANGUNAN SISTEM SMART BUILDING BERBASIS MIKROKONTROLER (Deteksi Ketinggian Air Dalam Sebuah Gedung)

Perbandingan Metode Single Linkage dan Fuzzy C Means Untuk Pengelompokkan Trafik Internet

Bab 2 Tinjauan Pustaka

BAB III ANALISA DAN DESAIN SISTEM

SISTEM REKOMENDASI KURIKULUM DENGAN METODE K-MEANS CLUSTERING

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODE PENELITIAN

BAB II KAJIAN PUSTAKA

BAB III ANALISIS DAN PENYELESAIAN MASALAH

BAB III METODE PENELITIAN DAN PERANCANGAN SISTEM

BAB III ANALISIS MASALAH DAN RANCANGAN PROGRAM

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

BAB I PENDAHULUAN UKDW

BAB 2 TINJAUAN PUSTAKA

IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR

BAB 3 ANALISA SISTEM

BAB III ANALISIS DAN PERANCANGAN

BAB 1 PENDAHULUAN Latar Belakang

BAB III METODE DAN PERANCANGAN SISTEM. menggunakan referensi jurnal, e-book, dan artikel terkait.

BAB III PERANCANGAN DAN PEMBUATAN ALAT. Proses perancangan meliputi tujuan dari sebuah penelitian yang kemudian muncul

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi informasi semakin pesat sampai saat ini dengan terus dikembangkannya

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

BAB I PENDAHULUAN. internet yang kini menjadi peranan penting. Kebutuhan user yang semakin

BAB 3 ANALISIS DAN PERANCANGAN

SEGMENTASI CITRA MENGGUNAKAN K-MEANS DAN FUZZY C- MEANS DENGAN BERBAGAI RUANG WARNA

KOMBINASI ALGORITMA AGGLOMERATIVE CLUSTERING DAN K-MEANS UNTUK SEGMENTASI PENGUNJUNG WEBSITE

BAB IV PERANCANGAN DAN IMPLEMENTASI PERANGKAT LUNAK

PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL

BAB III METODOLOGI PENELITIAN

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Inventarisasi adalah kegiatan melaksanakan pengurusan berupa penyelenggaraan,

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

IMPLEMENTASI HIERARCHICAL CLUSTERING DAN BRANCH AND BOUND PADA SIMULASI PENDISTRIBUSIAN PAKET POS

BAB 1 PENDAHULUAN. Universitas Muhammadiyah Surakarta merupakan salah satu dari beberapa instansi

BAB III METODOLOGI PENELITIAN. Desain penelitian adalah tahapan atau gambaran yang akan dilakukan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN.

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

BAB III ANALISIS DAN PERANCANGAN. Pada bab ini akan dijelaskan mengenai proses analisa perangkat lunak dan perancangan atau desain perangkat lunak.

DAFTAR ISI LEMBAR PENGESAHAN SURAT PERNYATAAN

Implementasi Algoritma Self Organizing Map (SOM) untuk Clustering Mahasiswa pada Matakuliah Proyek (Studi Kasus : JTK POLBAN)

BAB I PENDAHULUAN. teliti. Sehingga tidak terjadi bentrok baik antar mata pelajaran, guru, kelas

BAB III BAB 3 METODOLOGI PENELITIAN. dalam proses penelitian implementasi metode Bisecting K-Means untuk. Tahapan penelitian yang dilakukan yaitu:

Penerapan Metode Clustering K- Means Untuk Mengukur Tingkat Kedisplinan Siswa Di SMK Perikanan Nusantara Demak

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB I PENDAHULUAN 1.1. Latar Belakang

PEMANFAATAN ARDUINO DALAM PENGEMBANGAN SISTEM KEAMANAN RUMAH BERBASIS WEB

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

MODEL DATA MINING CAPAIAN PEMBELAJARAN. N. Tri Suswanto Saptadi. Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 12/4/2015

BAB 3 ANALISIS DAN PERANCANGAN SISTEM PROGRAM APLIKASI HANDS RECOGNIZER

BAB III ANALISIS. 3.1 Analisis Model Business Process Outsourcing

BAB II LANDASAN TEORI

PEMANFAATAN ARDUINO DALAM PENGEMBANGAN SISTEM RUMAH PINTAR BERBASIS MOBILE DAN WEB (Studi Kasus : Penjadwalan Lampu Rumah)

Transkripsi:

BAB III ANALISA DAN PERANCANGAN SISTEM Bab ini menjelaskan tentang analisa data, rancangan sistem, dan skenario pengujian. Bagian analisa data meliputi data penelitian, analisis data, data preprocessing. Bagian rancangan sistem meliputi alur metode yang digunakan dan diagram fungsional. Bagian skenario pengujian meliputi proses dari beberapa metode pengujian yan digunakan pada sistem. 3.1 Data Penelitian Data yang digunakan dalam penelitian ini adalah data tugas akhir Teknik Informatika sebanyak 722 data yang diambil dari Digital Library Perpustakaan Pusat Universitas Muhammadiyah Malang (DIGILIB UMM) mulai angkatan lulusan tahun 2014 2015. Data abstrak tugas akhir tersebut disimpan dalam format Comma Separated Value (.CSV). Berikut contoh dari data tugas akhir seperti berikut : Abstrak Wireless Sensor Network adalah infrastruktur jaringan nirkabel yang terdiri dari beberapa node sensor. Arduino Mega memiliki 54 pin input atau output dan berisi semua yang diperlukan untuk mendukung mikrokontroler. Raspberry pi adalah perangkat kecil yang mampu untuk memungkinkan orang dari segala usia untuk mengeksplorasi komputasi. Implementasi penggunaan arduino dan raspberry pi banyak digunakan dalam aplikasi wireless sensor. Restful Web Service pada dasarnya menggunakan metode operasional yang sederhana yang dimiliki oleh protokol HTTP untuk berkomunikasi. Sistem informasi merupakan suatu komponen yang terdiri dari manusia teknologi informasi dan prosedur kerja yang memproses menyimpan menganalisis dan menyebarkan informasi untuk mencapai suatu tujuan. Penerapan tekologi informasi telah dilakukan di segala aspek kehidupan manusia salah satunya dalam bidang keamanan. 20

3.2 Analisa Data Setelah semua data terkumpul dan diperoleh, maka selanjutnya adalah melakukan pengecekan data untuk diambil bagian abstraknya. Penelitian ini dilakukan secara manual dikarenakan isi data dari Digilib UMM masih dalam format Extensible Markup Languange (.XML) yang disimpan di file Microsoft Excel. Proses tersebut yang pada awalnya data berjumlah 722 data menurun menjadi 650 data. Dari 650 data dibagi menjadi tiga data yaitu data pertama yang berisi 550 data, data kedua berisi 600 data sedangkan data ketiga 650 data. Hal iu dilakukan untuk melihat pengaruh penambahan 50 data baru terhadap hasil clustering. Data dari proses pengecekan tersebut lalu disimpan kedalam format.csv dan dilakukan proses tokenizing dan case folding secara manual agar bisa dilakukan tahapan preprocessing. Data selanjutnya disimpan dalam format Attribut-Relation File Format (.ARFF) agar bisa dilakukan preprocessing. 3.3 Data Preprocessing Tahapan preprocessing ini digunakan untuk memasukkan data abstrak yang sudah disimpan dalam bentuk format.arff. Tahapan preprocessing ini dilakukan dengan menggunakan tools Waikato Environment for Knowledge Analysis (WEKA). Data abstrak.arff dimasukkan kedalam menu preprocess, maka akan muncul grafik dan keterangan data yang diinputkan. Pada menu filter, pilih filter unsupervised attribute dan pilih filter StringToWordVector. Filter tersebut digunakan untuk mengkonversi data String menjadi atribut vektor yang merupakan frekuensi kata dari data abstrak yang diinputkan. Setelah data abstrak berubah menjadi vektor kata maka data tersebut disimpan kembali ke dalam format.arff dengan nama yang berbeda. Hasil preprocess tersebut selanjutnya akan digunakan pada proses implementasi menggunakan pemrograman java. 3.4 Rancangan Sistem Rancangan sistem analisis ini merupakan struktur dan isi yang ada pada sistem yang dibuat berdasarkan analisis kebutuhan pada penelitian. Rancangan sistem analisis ini menjelaskan beberapa gambaran sistem yang akan dibuat yaitu alur dua metode yang digunakan, diagram use case, dan flowchart sistem. Alur dua 21

metode yang digunakan pada sistem. Diagram use case menjelaskan fitur yang ada pada sistem analisis perbandingan metode tersebut. flowchart diagram menjelaskan alur sistem analisis perbandingan metode k-means dan single linkage sampai pengujian menggunakan dua metode evaluasi. 3.4.1 Use Case Diagram Pada sistem analisis ini permodelan kebutuhan fungsional atau fitur-fitur yang digunakan dalam sistem di modelkan menggunakan diagram use case. Diagram use case merupakan diagram yang memodelkan aspek perilaku sistem dan merepresentasikan sebuah interaksi aktor dengan sistem. Pada use case yang ditekankan adalah apa yang diperbuat sistem bukan bagaimana sistem tersebut itu berjalan. Aktor pada use case ini hanya satu yaitu user, dimana user ini merupakan sebuah entitas yang berinteraksi dengan sistem untuk melakukan pekerjaanpekerjaan tertentu. Use case diagram dapat dilihat pada Gambar 3.1. Gambar 3. 1 Diagram Use Case Sistem analisis perbandingan metode k-means dan single linkage ini memiliki use case yaitu supply dataset, clustering, supply data hasil clustering, dan pengujian. Supply dataset digunakan untuk mengupload data hasil preprocessing untuk diproses clustering dengan menggunakan metode k-means dan single linkage. Setelah hasil clustering didapatkan maka data tersebut akan otomatis tersimpan untuk digunakan pada pengujian. Pada supply data hasil clustering di upload kembali data hasil clustering dengan kedua metode tersebut kemudian dilakukan 22

pengujian menggunakan metode cluster analysis of variance dan silhouette coefficient pengujian. 3.4.2 Flowchart Sistem Tahapan tahapan pada sistem analisis perbandingan metode ini dimulai dengan menentukan jumlah cluster yang akan bentuk sebelum memilih metode clustering yang akan digunakan untuk pemrosesan data dan proses pengujian. Tahapan tahapan sistem analisis dapat dilihat pada Gambar 3.2. Gambar 3. 2 Flowchart Sistem Tahapan awal pada sistem analisis ini yaitu memasukkan jumlah cluster yang ingin dibentuk terlebih dahulu. Setelah ditetapkan jumlah cluster yang akan dibentuk, maka tahapan selanjutnya adalah mengupload dataset.arff untuk diproses menggunakan metode k-means atau single linkage. Tahapan selanjutnya yaitu memilih metode clustering dan memilih metode evaluasi atau pengujian untuk menguji hasil dari proses clustering. 23

3.4.3 Alur Metode K-Means Pada metode k-means, data yang sudah dilakukan tahapan preprocessing dan sudah dalam format.arff kemudian akan dijadikan sebagai inputan untuk mengetahui hasil pengelompokkan data. Pada tahapan preprocessing data dengan menggunakan filter StringToWordVector, vektor kata yang dihasilkan sudah memiliki bobot kata. Bobot kata tersebut berfungsi untuk perhitungan jarak kedekatan antar kata yang lain. Perhitungan jarak dilakukan dengan menggunakan algoritma euclidean distance untuk menghitung jarak antar kata pada data tersebut. Berikut alur metode k-means yang ada pada Gambar 3.3. Start Input abstrak tugas akhir Hitung jarak ke masing-masing centroid dengan Euclidean Distance Data Preprocessing Pilih centroid terdekat Tentukan jumlah cluster Tidak ada data yang berpindah cluster? Tentukan centroid cluster dari data yang dihasilkan tidak Finish ya Gambar 3. 3 Alur Metode K-Means Clustering Pada Gambar 3.3, setelah data dari hasil preprocess akan dilakukan proses clustering dengan metode k-means. Terlebih dahulu dengan menentukan jumlah cluster yang ingin dibentuk setelah itu menghitung jarak dengan menggunakan algoritma euclidean distance. Apabila tidak ada data yang berpindah cluster maka proses clustering tersebut selesai. 24

3.4.4 Alur Metode Single Linkage Pada metode single linkage, proses pengelompokkan data hampir sama dengan metode k-means yaitu data hasil tahapan preprocess akan dilakukan clustering dan untuk perhitungan jarak antar data menggunakan algoritma euclidean distance. Perbedaan terletak pada proses clustering data, metode k-means memerlukan adanya titik pusat atau centroid sebagai acuan untuk menghitung jarak kedekatan antar data, sedangkan pada metode single linkage untuk membentuk sebuah cluster ditentukan dengan menghitung jarak ke semua data, kemudian dua data yang memiliki jarak kedekatan paling kecil akan digabung menjadi sebuah cluster baru. Alur metode single linkage dijelaskan pada Gambar 3.4. Start Input abstrak tugas akhir Jarak yang paling minimal digabungkan membentuk cluster baru Data Preprocessing K = 1? Jumlah data n = jumlah k cluster tidak ya Hitung jarak antar cluster dengan Euclidean Distance Finish Gambar 3. 4 Alur Metode Single Linkage Pada Gambar 3.4, sama dengan metode k-means dimana harus menentukan terlebih dahulu jumlah cluster yang ingin dibentuk dan juga menghitung jarak antar data, kemudian jarak dua data yang paling minimal digabung untuk membentuk cluster baru hingga membentuk sebuah hierarki. Apabila tidak ada cluster lagi yang dapat dibentuk, maka proses clustering data dengan metode single linkage selesai. 25

3.5 Skenario Pengujian Hasil data yang sudah dimasukkan kedalam metode k-means dan single linkage clustering akan dilakukan proses pengujian yaitu dengan metode validasi cluster analysis of variance dan silhouette coefficient. Hal tersebut dilakukan untuk mengetahui performansi hasil cluster dengan metode k-means dan single linkage. Performansi hasil cluster ini menentukan metode manakah yang lebih baik untuk pengelompokkan data, apakah metode k-means atau single linkage hierarchical clustering. Skenario pengujian performansi hasil cluster ini dilakukan dengan menguji tiga data yang berbeda. Data tersebut akan dibentuk dengan penentuan jumlah cluster sebanyak 3, 5, dan 7 untuk mengetahui perbedaan hasil pada penyebaran data yang dihasilkan oleh kedua metode. Data yang dihasilkan nantinya juga akan di uji dengan metode pengujian cluster analysis of variance dan silhouette coefficient. 3.5.1 Cluster Analysis of Variance Tahapan pengujian ini dilakukan untuk mengukur hasil penyebaran atau distribusi hasil kedua metode clustering yang digunakan. Pengujian memiliki dua parameter yang digunakan untuk mencari nilai variance cluster yaitu within cluster dan between cluster. Parameter within cluster adalah nilai rata-rata dari hasil pengukuran jarak data pada suatu cluster, sedangkan between cluster adalah nilai rata-rata dari hasil pengukuran jarak data antar cluster. Pengukuran jarak diketahui dari hasil penggunaan algortima euclidean distance pada kedua metode yang digunakan. Untuk mengetahui nilai dari variance, maka parameter within cluster akan dibagi dengan parameter between cluster. 3.5.2 Silhouette Coefficient Tahapan pengujian ini dilakukan untuk menguji kualitas dari hasil clustering dengan dua metode yang digunakan. Tahapan untuk menghitung nilai silhouette coefficient untuk setiap objek i, hitung rata-rata jarak dari objek i dengan seluruh objek yang ada pada satu cluster. Nantinya akan didapatkan nilai rata-rata yang disebut sebagai ai. Untuk setiap objek i, hitung rata-rata jarak dari objek i dengan objek yang berada pada cluster yang lain. Semua jarak rata-rata yang dihasilkan nantinya akan diambil nilai yang terkecil yang disebut sebagai bi.. Setelah didapatkan nilai ai an bi, maka objek i memiliki nilai silhouette coefficient. 26

Apabila nilai silhouette bernilai atau mendekati 1 maka objek i berada pada cluster yang tepat, apabila nilai silhouette bernilai atau mendekati 0 maka objek i berada pada dua cluster atau tidak jelas penempatannya, sedangkan apabila nilai silhouette bernilai atau mendekati -1 maka objek i lebih tepat dimasukkan pada cluster yang lain. 27