SISTEM INFORMASI GEOGRAFIS PEMETAAN PERSEBARAN ALUMNI DENGAN ANALISA CLUSTERING

Ukuran: px
Mulai penontonan dengan halaman:

Download "SISTEM INFORMASI GEOGRAFIS PEMETAAN PERSEBARAN ALUMNI DENGAN ANALISA CLUSTERING"

Transkripsi

1 TESIS SISTEM INFORMASI GEOGRAFIS PEMETAAN PERSEBARAN ALUMNI DENGAN ANALISA CLUSTERING I KADEK DWI GANDIKA SUPARTHA FAKULTAS TEKNIK UNIVERSITAS UDAYANA DENPASAR 2018

2 TESIS SISTEM INFORMASI GEOGRAFIS PEMETAAN PERSEBARAN ALUMNI DENGAN ANALISA CLUSTERING MPUL DALAM I KADEK DWI GANDIKA SUPARTHA PROGRAM MAGISTER PROGRAM STUDI TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA DENPASAR 2018

3 SISTEM INFORMASI GEOGRAFIS PEMETAAN PERSEBARAN ALUMNI DENGAN ANALISA CLUSTERING Tesis untuk Memperoleh Gelar Magister pada Program Magister, Program Studi Teknik Elektro, Program Pascasarjana Universitas Udayana I KADEK DWI GANDIKA SUPARTHA PROGRAM MAGISTER PROGRAM STUDI TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA DENPASAR 2018

4 LEMBAR PENGESAHAN TESIS INI TELAH DISETUJUI PADA TANGGAL 30 AGUSTUS 2018 Pembimbing I, Pembimbing II, Dr. Ir. Made Sudarma, M.A.Sc Dr. Dewa Made Wiharta, ST,.MT NIP NIP Mengetahui Koordinator Program Studi Magister Teknik Elektro Fakultas Teknik Universitas Udayana, Dekan Fakultas Teknik Universitas Udayana Ir. Linawati.M.Eng,Sc, Ph.D Prof. Ir. Ngakan Putu Gede Suardana,MT,Ph.D NIP NIP

5 LEMBAR PENETAPAN PANITIA PENGUJI TESIS Tesis Ini Telah Diuji pada Tanggal 30 Agustus 2018 Panitia Penguji Tesis Berdasarkan SK Rektor Universitas Udayana, Nomor : 4525/UN14.2.5/EP/2018 tanggal 24 Agustus 2018 Ketua : Dr. Ir. Made Sudarma, M.A.Sc. Anggota : 1. Dr. Dewa Made Wiharta, ST,.MT. 2. Nyoman Pramaita, ST., MT., Ph.D. 3. Ir. Linawati, M.Eng.Sc,Ph.D. 4. Dr. Nyoman Gunantara, ST., MT.

6 SURAT PERNYATAAN BEBAS PLAGIAT Nama : I Kadek Dwi Gandika Supartha Nim : Program Studi : Magister Teknik Elektro Judul : Sistem Informasi Geografis Pemetaan Persebaran Alumni dengan Analisa Clustering Dengan ini menyatakan bahwa karya ilmiah tesis ini bebas plagiat. Apabila dikemudian hari terbukti terdapat plagiat dalam karya ilmiah ini, maka saya bersedia menerima sanksi sesuai peraturan Mendiknas RI No. 17 Tahun 2010 dan Peraturan Perundang-undang yang berlaku. Denpasar, 30 Agustus 2018 Yang membuat pernyataan Materai 6000 I Kadek Dwi Gandika Supartha

7 UCAPAN TERIMA KASIH Puji syukur kita panjatkan kehadirat Tuhan Yang Maha Esa atas segala rahmat dan hidayah-nya penulis dapat menyelesaikan tesis dengan judul Sistem Informasi Geografis Pemetaan Persebaran Alumni dengan Analisa Clustering. Pada kesempatan ini perkenankanlah penulis mengucapkan terima kasih yang sebesar-besarnya kepada Dr. Ir. Made Sudarma, M.A.Sc sebagai pembimbing I yang dengan penuh perhatian telah memberikan dorongan, semangat, bimbingan, dan saran selama penulis mengikuti Program Magister, khususnya dalam penyelesaian Tesis ini. Terima kasih sebesar-besarnya pula penulis sampaikan kepada Dr. Dewa Made Wiharta, ST,.MT sebagai Pembimbing II yang dengan penuh perhatian dan kesabaran telah memberikan bimbingan dan saran kepada penulis. Ucapan yang sama juga ditujukan kepada Rektor Universitas Udayana Prof. Dr.dr. A.A. Raka Sudewi, Sp.S (K) atas kesempatan dan fasilitas yang diberikan kepada penulis untuk mengikuti dan menyelesaikan pendidikan Program Magister di Universitas Udayana. Ucapan terima kasih ini juga ditujukan kepada Dekan Fakultas Teknik Universitas Udayana yang dijabat oleh Prof. Ir. Ngakan Putu Gede Suardana,MT,Ph.D atas kesempatan yang diberikan kepada penulis untuk menjadi mahasiswa Program Magister pada Fakultas Teknik Universitas Udayana. Pada kesempatan ini, penulis juga menyampaikan rasa terima kasih kepada Ir. Linawati.M.Eng,Sc, Ph.D, selaku Ketua Program Studi Magister Teknik Elektro. Ungkapan terima kasih penulis sampaikan pula kepada para penguji tesis, yaitu Nyoman Pramaita, ST., MT., Ph.D, Ir. Linawati.M.Eng,Sc, Ph.D., Dr. Nyoman

8 Gunantara, ST., MT.yang telah memberikan masukan, saran, sanggahan, dan koreksi sehingga Tesis ini dapat terwujud seperti ini. Pada kesempatan ini, penulis juga menyampaikan rasa terima kasih kepada Orang tuaku tercinta Alm I Made Arga Suparta dan Ni Made Suadnyani yang tiada hentinya memberikan doa, semangat, dan pengorbanan yang sangat besar. Saudaraku I Gede Adnya Puspa Supartha dan Ni Komang Ayu Fitri Pratiwi yang selalu menjadi motivasi selama pengerjaan tesis. Komang Sri Antari yang selalu dengan sabar memberikan semangat dan dukungannya dari awal sampai tesis ini selesai. Teman-teman seperjuangan Magister Sistem Komputer dan Informasi atas semangat dan dukungannya. Semua pihak yang telah membantu dalam penyusunan laporan ini yang tidak dapat kami sebutkan satu per satu. Penulis menyadari bahwa penulisan tesis yang telah dibuat masih jauh dari kesempurnaan. Oleh karena itu, penulis sangat mengharapkan kritik dan saran yang membangun dari pembaca. Denpasar, Agustus 2018 Penulis

9 SISTEM INFORMASI GEOGRAFIS PEMETAAN PERSEBARAN ALUMNI DENGAN ANALISA CLUSTERING ABSTRAK STMIK STIKOM Indonesia (STIKI Indonesia) merupakan salah satu perguruan tinggi yang berlokasi di Denpasar Bali dan telah memiliki data alumni yang cukup banyak, tetapi data tersebut kurang dimaksimalkan karena tidak diolah lebih lanjut untuk menjadi informasi yang lebih berguna dan pada saat ini STIKI Indonesia kurang mengetahui informasi persebaran alumni secara spesifik di dunia kerja karena belum adanya sistem yang bisa melakukan hal tersebut. Untuk mengatasi permasalah tersebut diatas dapat memanfaatkan teknologi Sistem Informasi Geografis (SIG) dan data mining. Dimana SIG memiliki kemampuan untuk menyajikan informasi dalam bentuk grafis dengan menggunakan peta sebagai antar muka, sehingga persebaran alumni dapat diketahui secara spesifik dan data mining adalah proses untuk mengekstraksi atau mendeteksi pola-pola yang tersembunyi dari sebuah database besar. Clustering dilakukan pada data alumni dengan atribut bidang pekerjaan, Indeks Prestasi Komulatif (IPK), lama study dan lama pengerjaan tugas akhir. Metode yang digunakan yaitu Fuzzy C-Means (FCM) dan untuk pengukuran validitas cluster menggunakan Modified Partition Coefficient (MPC) (untuk mengukur cluster yang mengalami overlap) dan Classification Entropy (CE) (untuk mengukur tingkat kekaburan/fuzziness dari partisi cluster. Berdasarkan indeks validitas CE dan MPC pada clustering alumni dengan dua atribut, jumlah cluster yang paling optimal adalah 2 cluster dan yang memiliki karakteristik terbaik adalah adalah cluster ke 1 dimana memiliki anggota sebanyak 367 orang (69,77% dari jumlah keseluruhan alumni). Pada clustering alumni dengan tiga atribut, jumlah cluster yang paling optimal adalah 2 cluster dan cluster yang memiliki karakteristik terbaik adalah cluster ke 1 yang memiliki anggota sebanyak 403 orang (76,62% dari jumlah keseluruhan alumni). Pada clustering alumni dengan empat atribut, jumlah cluster yang paling optimal adalah 2 cluster dan cluster yang memiliki karakteristik terbaik adalah cluster ke 2 yang jumlah anggotanya 357 (67,87% dari jumlah keseluruhan alumni). Dari hasil tersebut dilihat bahwa alumni STIKI Indonesia yang memiliki karakteristik ideal jumlahnya cukup banyak dibanding dengan total keseluruhan alumni. Pada pengujian menggunakan metode black box testing pada Sistem Informasi Geografis Pemetaan Persebaran Alumni dengan Analisa Clustering didapatkan hasil bahwa semua modul dalam sistem telah berfungsi dengan baik dan dapat menampilkan informasi sesuai dengan yang dirancang. Keywords Fuzzy C-Means; Data Mining; Alumni, SIG

10 SISTEM INFORMASI GEOGRAFIS PEMETAAN PERSEBARAN ALUMNI DENGAN ANALISA CLUSTERING ABSTRACT STMIK STIKOM Indonesia (STIKI Indonesia) is one of the universities located in Denpasar Bali and has a lot of alumni data, but the data is not maximized because it is not processed further to become more useful information and at this time STIKI Indonesia lacks knowledge information on alumni distribution because there is no system that can do this. To overcome these problems above can utilize the technology of Geographic Information Systems (GIS) and data mining. GIS has the ability to present information in graphical form by using maps as interfaces, so that the distribution of alumni can be specifically identified and data mining is the process of extracting or detecting hidden patterns from a large database. Clustering is performed on data of alumni with the attributes field of work, cumulative grade point (GPA), long long study and final project. The method used is Fuzzy C-Means (FCM) and for cluster validity measurement using Modified Partition Coefficient (MPC) (to measure clusters that experience overlap) and Classification Entropy (CE) (to measure the level of blur / fuzziness of the cluster partition. Based on the validity index of CE and MPC on alumni clustering with two attributes, the most optimal number of clusters is 2 clusters and the best characteristic is the cluster 1 with 367 members (69,77% of the total alumni). In alumni clustering with three attributes, the most optimal number of clusters is 2 clusters and clusters that have the best characteristics is cluster 1 which has 403 members (76,62% of the total alumni). In alumni clustering with four attributes, the most optimal number of clusters is 2 clusters and clusters that have the best characteristics are cluster 2 with 357 members (67,87% of the total alumni). From these results it was seen that the STIKI Indonesia alumni who had ideal characteristics were quite large compared to the total alumni. In the test using the black box testing method in the Geographic Information System for Alumni Distribution Mapping with Clustering Analysis, the results show that all modules in the system are functioning properly and can display information in accordance with the design. Keywords Fuzzy C-Means; Data Mining; Alumni, SIG x

11 DAFTAR ISI SAMPUL DALAM... ii LEMBAR PENGESAHAN... iv LEMBAR PENETAPAN PANITIA PENGUJI TESIS... v SURAT PERNYATAAN BEBAS PLAGIAT... vi UCAPAN TERIMA KASIH... vii ABSTRAK... ix ABSTRACT... x DAFTAR ISI... xi DAFTAR TABEL... xiii DAFTAR GAMBAR... xiv DAFTAR LAMPIRAN... xvi BAB I PENDAHULUAN Latar Belakang Rumusan Masalah Tujuan Penulisan Manfaat Ruang Lingkup Keaslian Penelitian... 5 BAB II DASAR TEORI State of The Art Data Mining Tugas Data Mining CRISP-DM Himpunan Fuzzy Clustering Hard Clustering dan Fuzzy Clustering Metode Fuzzy C-Means Clustering Ukuran Validitas Cluster Sistem Informasi Geografis xi

12 2.7 Pengujian Perangkat Lunak BAB III METODE PENELITIAN Tempat dan Waktu Penelitian Data Sumber Data Jenis Data Teknik Pengumpulan Data Gambaran Umum Penelitian Pengumpulan Data Data Preprosesing Data Mining Pemetaan dengan Google Maps Jadwal Pelaksanaan Kegiatan BAB IV ANALISA DATA DAN PEMBAHASAN Implementasi Clustering dengan Algoritma Fuzzy C-Means Implementasi Sistem Informasi Geografis Alumni Hasil uji coba Clustering Data Alumni dengan Dua Atribut Analisis Cluster dengan Dua Atribut Clustering Data Alumni dengan Tiga Atribut Analisis Cluster dengan Tiga Atribut Clustering Data Alumni dengan Empat Atribut Analisis Cluster dengan Empat Atribut Pengujian Black Box Testing BAB V SIMPULAN DAN SARAN Simpulan Saran DAFTAR PUSTAKA LAMPIRAN xii

13 DAFTAR TABEL Tabel 3.1 Atribut Sebelum Seleksi Data Tabel 3.2 Seleksi Data Tabel 3.3 Konversi Atribut Bidang Kerja Tabel 4.1. Koordinat Titik Pusat Cluster (Jumlah Cluster = 2) Tabel 4.2. Koordinat Titik Pusat Cluster (Jumlah Cluster = 3) Tabel 4.3. Koordinat Titik Pusat Cluster (Jumlah Cluster = 4) Tabel 4.4. Koordinat Titik Pusat Cluster (Jumlah Cluster = 5) Tabel 4.5. Koordinat Titik Pusat Cluster (Jumlah Cluster = 6) Tabel 4.6. Indek MPC dan CE pada Algoritma FCM Tabel 4.7 Nilai Titik Pusat Cluster Tabel 4.8. Koordinat Titik Pusat Cluster (Jumlah Cluster = 2) Tabel 4.9. Koordinat Titik Pusat Cluster (Jumlah Cluster = 3) Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 4) Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 5) Tabel Indek MPC dan CE pada Algoritma FCM Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 2) Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 3) Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 4) Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 5) Tabel Indek MPC dan CE pada Algoritma FCM Tabel 4.18 Hasil Pengujian Black Box xiii

14 DAFTAR GAMBAR Gambar 1.1 Diagram Fish Bone Keaslian Penelitian... 6 Gambar 2.1 Proses KDD Sumber: Fayyad dkk, Gambar 2.2 Tahapan dalam Proses Knowledge Discovery in Database Sumber: Tan dkk, Gambar 2.3 Empat Tugas Inti Data Mining Sumber: Tan dkk, Gambar 2.4 Siklus Hidup CRISP-DM Sumber: Chapman, Gambar 2.5. Contoh Proses Clustering Sumber: Jansen, Gambar 2.6. Hard dan Fuzzy Clustering Sumber: Jansen, Gambar 2.7 Sub Sistem SIG Sumber: Prahasta Gambar 2.8 Komponen Sistem Informasi Geografis Sumber: Ekadinata, Gambar 2.9 Kategori Sistem Informasi Geografis Sumber: Riyanto, Gambar 3.1 Gambaran Umum penelitian Gambar 3.2 Clustering Fuzzy C Means Gambar 3.3 Rancangan Tampilan Utama Gamber 3.4 Rancangan Form Manipulasi Data Alumni Gambar 3.5 Rancangan Tabel Gambar 4.1 Form Clustering Data Alumni Gambar 4.2 Halaman Utama Sistem Informasi Geografis Alumni Gambar 4.3 Halaman Pengelolaan Data Provinsi Sistem Informasi Geografis Alumni Gambar 4.4 Halaman Pengelolaan Data Kabupaten Sistem Informasi Geografis Alumni Gambar 4.5 Halaman Pengelolaan Data Kecamatan Sistem Informasi Geografis Alumni Gambar 4.6 Halaman Pengelolaan Data Cluster Gambar 4.7 Halaman Manipulasi Data Alumni Sistem Informasi Geografis Alumni Gambar 4.8 Halaman Lokasi Alumni Sistem Informasi Geografis Alumni Gambar 4.9 Halaman Detail Data Alumni xiv

15 Sistem Informasi Geografis Alumni Gambar Hasil Clustering Menggunakan FCM 2 Atribut dengan 2 Cluster 47 Gambar Hasil Clustering Menggunakan FCM 2 Atribut dengan 3 Cluster 48 Gambar Hasil Clustering Menggunakan FCM 2 Atribut dengan 4 Cluster 49 Gambar Hasil Clustering Menggunakan FCM 2 Atribut dengan 5 Cluster 50 Gambar Hasil Clustering Menggunakan FCM 2 Atribut dengan 6 Cluster 51 Gambar Hasil Clustering Menggunakan FCM 3 Atribut dengan 2 Cluster 55 Gambar Hasil Clustering Menggunakan FCM 3 Atribut dengan 3 Cluster 56 Gambar Hasil Clustering Menggunakan FCM 3 Atribut dengan 4 Cluster 57 Gambar Hasil Clustering Menggunakan FCM 3 Atribut dengan 5 Cluster 58 Gambar Hasil Clustering Menggunakan FCM 4 Atribut dengan 2 Cluster 61 Gambar Hasil Clustering Menggunakan FCM 4 Atribut dengan 3 Cluster 62 Gambar Hasil Clustering Menggunakan FCM 4 Atribut dengan 4 Cluster 63 Gambar Hasil Clustering Menggunakan FCM 4 Atribut dengan 5 Cluster 64 Gambar Pengujian Tampilan Awal Gambar Pengujian Fasilitas Pencarian Gambar Pengujian Menampilkan Data Alumni Gambar Pengujian Menampilkan Data Detail Alumni xv

16 DAFTAR LAMPIRAN Lampiran 1 Tabel State Of The Art Review... 76

17 BAB I PENDAHULUAN 1.1 Latar Belakang STMIK STIKOM Indonesia (STIKI Indonesia) merupakan salah satu perguruan tinggi yang berlokasi di Denpasar Bali dan beroperasi menerima mahasiswa baru sejak tahun 2008, sampai saat ini memiliki mahasiswa kurang lebih sebanyak orang. Tahun 2012 untuk pertama kalinya STIKI Indonesia meluluskan mahasiswa angkatan pertama dan STIKI Indonesia telah memiliki alumni kurang lebih 700 orang. Mahasiswa yang telah lulus dari STIKI Indonesia ditampung dalam sebuah organisasi dengan nama Ikatan Alumni STIKI Indonesia (IKA-STIKI). IKA-STIKI dikelola oleh bagian alumni dan pusat karir yang berada dibawah bagian kemahasiswaan. Bagian ini memiliki tugas utama untuk mengelola data alumni dan menjaga hubungan baik antara STIKI Indonesia dengan semua alumninya. IKA-STIKI Indonesia secara berkala melakukan pendataan alumni yang dilakukan dengan cara tracer study, dengan tujuan untuk mengetahui persebaran alumni di dunia kerja dan data alumni seperti lama study, dan Indeks Prestasi Komulatif (IPK) diperoleh dari bagian akademik. Data alumni yang sudah terkumpul cukup banyak tapi kurang dimaksimalkan dan diolah menjadi sebuah informasi yang mungkin akan berguna bagi STIKI Indonesia. Kondisi seperti ini biasanya disebut dengan istilah rich of data but poor of information. Pada saat ini STIKI Indonesia kurang mengetahui informasi persebaran alumni secara spesifik di dunia kerja karena belum adanya sistem yang bisa melakukan hal tersebut. Untuk mengatasi permasalah tersebut diatas dapat memanfaatkan teknologi Sistem Informasi Geografis (SIG) dan data mining. Dimana SIG memiliki kemampuan untuk menyajikan informasi dalam bentuk grafis dengan menggunakan peta sebagai antar muka (Handoko 2012), sehingga persebaran alumni dapat diketahui secara spesifik. Data mining dapat dimanfaatkan untuk memperoleh informasi yang tersembunyi dari kumpulan data almuni. 1

18 2 Menurut Berry dan Linoff (2004) data mining adalah proses untuk mengekstraksi atau mendeteksi pola-pola yang tersembunyi dari sebuah database besar. Salah satu metode yang diterapkan dalam data mining adalah clustering. Menurut Jain (1999), teknik clustering pada data mining digunakan untuk mengelompokkan objek-objek yang memiliki kemiripan dalam kelas atau segmen yang sama, sementara objek-objek yang terletak pada kelas yang berbeda akan menunjukkan karakteristik yang berbeda juga. Dengan menggunakan teknik clustering pada database yang besar maka akan menghemat waktu, tenaga dan juga dapat memberikan hasil yang lebih maksimal. Pada penelitian ini akan melakukan clustering terhadap data alumni dan hasilnya ditampilkan dalam bentuk Sistem Informasi Geografis (SIG) berbasis web. Atribut yang akan digunakan dalam melakukan clustering yaitu: bidang pekerjaan, Indeks Prestasi Komulatif (IPK), lama study dan lama pengerjaan tugas akhir. Hasil penelitian ini diharapkan dapat dimanfaatkan oleh STIKI Indonesia dalam membantu proses pengambilan kebijakan seperti peninjauan kurikulum atau perbaikan silabus. Pada tahun 2012 Slamet Handoko melakukan penelitian tentang clustering data alumni Politeknik Negeri Semarang (IKA POLINES) dengan metode K-Means dan hasilnya disajikan dalam bentuk peta digital berbasis web. Mekanisme pengelompokan atau clustering didasarkan pada empat atribut yaitu: jenis perusahaan, klasifikasi jabatan, bidang kerja dan kompetensi prodi. Sedangkan letak geografis alumni akan digunakan sebagai fitering data pada saat pengguna memilih lokasi pemetaan alumni di suatu wilayah. Dalam penelitian ini cluster dibagi menjadi tiga yaitu: 1. Alumni dengan bidang kerja sesuai dengan kompetensi, 2. Alumni dengan bidang kerja kurang sesuai dengan kompetensi dan 3. Alumni dengan bidang kerja tidak sesuai dengan kompetensi. Berdasarkan data yang diperoleh, hasil menunjukkan 51 alumni bekerja sesuai dengan kompetensinya, sedangkan 23 alumni dengan pekerjaan kurang sesuai dan 26 alumni tidak sesuai dengan kompetensinya. Hasil dari penelitian ini digunakan untuk membantu pengambilan keputusan apakah perlu mengadakan

19 3 perubahan kurikulum atau tidak. Dalam penelitian ini hasil clustering tidak mengalami proses validasi sehingga hasil cluster belum tentu merupakan cluster yang paling baik. Secara umum ada tiga metode yang bisa digunakan dalam analisis clustering yaitu: (1) menggunakan metode statistik, (2) metode kompleks dan (3) kecerdasan buatan. Metode yang akan digunakan dalam melakukan cluster data alumni adalah metode fuzzy clustering (metode kompleks), yaitu dengan algoritma Fuzzy C-Means Clustering (FCM). Pengelompokan dengan logika fuzzy terus berkembang karena pada umumnya data tidak bisa dipisahkan secara tegas ke dalam kelompok, tetapi memiliki kecenderungan yang dinyatakan dengan derajat keanggotaan, yang bernilai antara 0 dan 1 terhadap pengelompokannya (Hoppner 2014). FCM memiliki tingkat akurasi yang tinggi dan waktu komputasi yang cepat (Hammouda, 2000), juga dapat memberikan hasil yang halus dan cukup efektif untuk meningkatkan homogenitas tiap cluster yang dihasilkan (Shihab, 2000). Algoritma FCM merupakan algoritma supervised clustering (jumlah cluster ditentukan). Tahun 2016 Paulus Mudjihartono melakukan clustering terdahap data alumni dengan pendekatan metode optimasi dengan nama Abandoned and Reborn Particle Swarm Optimization (AR-PSO) dengan tujuan untuk meminimalisasi hasil cluster yang tidak diinginkan. Data yang digunakan yaitu data alumni Jurusan Ilmu komputer yang berisikan data program kursus yang diikuti dan jangka waktu pengerjaan tugas akhir. Pada pengujian hasilnya dibandingkan metode K-Means, DBSCN dan Agglomerative kemudian hasil clustering dievaluasi yaitu the closeness, the separation dan the purity. Hasil menunjukkan bahwa metode AR- PSO setara dengan metode K-Means dan mengungguli dua metode lainnya. Berdasarkan penelitian tersebut maka dalam penelitian ini diusulkan untuk melakukan proses validasi terhadap hasil clustering yang telah dilakukan sebelumnya. Untuk memvalidasi apakah partisi fuzzy yang diterapkan dalam proses clustering sesuai dengan data, digunakan indeks pengukuran validitas cluster (Wu dan Yang, 2005), metode yang akan digunakan untuk menguji validitas cluster pada penelitian ini adalah indeks Modified Partition Coefficient (MPC) (untuk mengukur

20 4 cluster yang mengalami overlap) dan Classification Entropy (CE) (untuk mengukur tingkat kekaburan/fuzziness dari partisi cluster. Sasaran dari penelitian ini adalah melakukan analisa clustering terhadap data alumni STIKI Indonesia dengan menggunakan metode Fuzzy C-Means (FCM) dan melakukan validasi terhadap hasilnya, selain itu juga melakukan pemetaan persebaran data alumni dengan memanfaatkan teknologi Sistem Informasi Geografis (SIG). 1.2 Rumusan Masalah Berdasarkan latar belakang permasalahan di atas maka dapat dirumuskan sejumlah permasalahan utama yang menjadi fokus dari penelitian ini yaitu: 1. Bagaimanakah mengukur tingkat validitas FCM dalam melakukan clustering terhadap data alumni? 2. Bagaimana kinerja Sistem Informasi Geografis pemetaan persebaran alumni dengan analisis clustering? 1.3 Tujuan Penulisan Sejumlah tujuan yang ingin dicapai dalam penelitian ini antara lain: 1. Mengetahui hasil validasi algoritma Fuzzy C-Means dalam proses clustering. 2. Untuk mengetahui kinerja Sistem Informasi Geografis berbabasis web untuk pemetaan sebaran alumni dengan analisa clustering 1.4 Manfaat 1. Manfaat Praktis Penelitian ini dapat digunakan sebagai acuan oleh STMIK STIKOM Indonesia (STIKI) untuk mengetahui profil alumni dan persebarannya di dunia kerja yang dapat digunakan sebagai pertimbangan dalam pengambilan kebijakan. 2. Manfaat Akademis Pembuatan Tesis ini dapat membantu peneliti mengerti konsep penggunaan Fuzzy C-Means dalam melakukan clustering data alumni.

21 5 1.5 Ruang Lingkup 1. Data alumni yang digunakan yaitu data alumni STMIK STIKOM Indonesia (STIKI Indonesia) yang diperoleh dari bagian alumni dan pusat karir. Data yang digunakan yaitu dari tahun 2012 sampai 2016 yang berjumlah 700 data. 2. Dalam penelitian ini tidak membahas tentang mekanisme pengambilan data alumni, data yang diperoleh langsung dari bagian Alumni dan Pusat Karir STIKI Indonesia dalam format file excel yang siap untuk diolah. 3. Aplikasi yang digunakan dalam proses clustering adalah Matlab sedangkan untuk pemetaannya menggunakan google map dan google mapapi 1.6 Keaslian Penelitian Penelitian tentang clustering data alumni telah banyak dilakukan sebelumnya. Penelitian tersebut diantaranya Sistem Informasi Geografis Berbasis Web untuk Pemetaan Sebaran Alumni Menggunakan Metode K-Means, Analisis Profil Akademik Alumni Dengan Menggunakan Metode Klasterisasi K-Means Pada STIKOM Uyelindo Kupang, Clustering Lulusan Mahasiswa Matematika FMIPA UNTAN Pontianak Menggunakan Algoritma Fuzzy C-Means, Clustering Analysis on Alumni Data Using Abandoned and Reborn Particle Swarm Optimization. Pada Gambar 1.1 berikut menunjukkan keaslian penelitian ini. Beberapa penelitian mengenai clustering data alumni sudah pernah dilakukan dengan menggunakan parameter-parameter yang terlihat pada gambar fishbone. Pada penelitian ini mencoba menerapkan metode yang sudah pernah dilakukan sebelumnya tetapi dengan parameter yang berbeda dan diaplikasikan pada data alumni STIKI Indonesia.

22 Cluster Validity Penyajian Data Metode Clustering Sum of the Squared Errors (SSE) Analisis Cluster & GIS Fuzzy C Means (FCM) Abandoned and Reborn Particle Swarm Optimization Modified Partition Coefficient (MPC) dan Classification Entropy (CE). Jenis perusahaan, Klasifikasi jabatan, bidang kerja dan kompetensi prodi Analisis Cluster K-Means NEM, IPK, Masa studi, Masa Skripsi dan prodi STIKI Indonesia Politeknik Negeri Semarang Sistem Informasi Geografis Sebaran Alumni dengan Analisis Clustering Bidang pekerjaan,(ipk), Lama Study, Lama Pengerjaan Tugas Akhir IPK dan Lama Studi FMIPA UNTAN Pontianak Variabel Sumber Data Gambar 1.1 Diagram Fish Bone Keaslian Penelitian 6

23 BAB II DASAR TEORI 2.1 State of The Art State of The Art merupakan pencapaian tertinggi dari sebuah proses pengembangan sebuah penelitian. Berikut adalah beberapa penelitian tentang clustering. Pada tahun 2012, Slamet Handoko melakukan penelitian dengan judul Sistem Informasi Geografis Berbasis Web untuk Pemetaan Sebaran Alumni Menggunakan Metode K-Means. Penelitian ini melakukan clustering data alumni Politeknik Negeri Semarang (IKA POLINES) dengan metode K-Means dan hasilnya disajikan dalam bentuk peta digital berbasis web. Mekanisme pengelompokan atau clustering didasarkan pada empat variabel yaitu: jenis perusahaan, klasifikasi jabatan, bidang kerja dan kompetensi program studi. Sedangkan letak geofrafis alumni akan digunakan sebagai filtering data pada saat pengguna memilih lokasi pemetaan alumni di suatu wilayah. Dalam penelitian ini cluster dibagi menjadi tiga yaitu : 1.Alumni dengan bidang kerja sesuai dengan kompetensi, cluster 2.Alumni dengan bidang kerja kurang sesuai dengan kompetensi dan cluster 3.Alumni dengan bidang kerja tidak sesuai dengan kompetensi. Berdasarkan data yang diperoleh, hasil menunjukkan 51 alumni bekerja sesuai dengan kompetensinya, sedangkan 23 alumni dengan pekerjaan kurang sesuai dan 26 alumni tidak sesuai dengan kompetensinya. Hasil dari penelitian ini digunakan untuk membantu pengambilan keputusan apakah perlu mengadakan perubahan kurikulum atau tidak. Pada tahun 2014, Dewi Anggraini, melakukan penelitian dengan judul Analisis Profil Akademik Alumni Dengan Menggunakan Metode Klasterisasi K-Means Pada STIKOM Uyelindo Kupang. Pada penelitian ini melakukan clustering data alumni dengan tujuan untuk mengetahui karakteristik profil alumni pada STIKOM Uyelindo Kupang dengan menggunakan metote K-Means. Atribut yang digunakan dalam proses clustering yaitu NEM, Indeks Prestasi Komulatif (IPK), masa studi, masa skripsi dan program studi. Karakteristik alumni tiga prodi 7

24 8 (Teknik Informatika S1/D3 dan Sistem Infromasi S1) dan dengan nilai K = 3 diperoleh kelompok data yang cukup menunjukkan adanya pola tegas dari profil alumni yang dapat memberikan gambaran umum dan pertimbangan tentang pengembangan kebijakan perguruan tinggi. Pada tahun 2013, Cary Lineker Simbolon dkk, menghasilkan penelitian dengan judul Clustering Lulusan Mahasiswa Matematika FMIPA UNTAN Pontianak Menggunakan Algoritma Fuzzy C-Means. Pada penelitian ini menggunakan Fuzzy C-Means untuk melakukan clustering lulusan jurusan Matematika FMIPA Universitas Tangjungpura (UNTAN) dengan menggunakan variabel IPK dan Lama studi. Berdasarkan clustering yang dilakukan diperoleh 4 cluster. Dari hasil keempat cluster tersebut diketahui bahwa pada cluster 4 memiliki anggota lulusan yang paling banyak dengan 33 lulusan. Cluster 4 terdiri dari lulusan dengan kisaran lama studi 5,91 tahun. Hal ini menunjukkan bahwa masih banyak mahasiswa jurusan Matematika di Fakultas MIPA Untan Pontianak yang menempuh lama studi lebih dari 10 semester atau 5 tahun. Hasil ini diharapkan dapat dijadikan sebagai bahan pertimbangan jurusan dalam meningkatkan IPK mahasiswa untuk menyelesaikan masa studinya dengan cepat. Pada tahun 2016, Paulus Mudjihartono dkk menghasilkan sebuah penelitian dengan judul Clustering Analysis on Alumni Data Using Abandoned and Reborn particle Swarm Optimization. Pada penelitian ini melakukan clustering terhadap data alumni dengan menggunakan optimasi metode dengan nama Abandoned and Reborn Particle Swarm Optimization (AR-PSO) berdasarkan metode Particle Swarm. Menggunakan dataset alumni Ilmu Komputer (ILKOM) yang berisikan satu kolom id, 22 kolom kursus dan satu kolom untuk jangka waktu pengerjaan tugas akhir dalam bulan dan dikategorikan menjadi tiga yaitu lama, medium dan pendek. Data ini terdiri dari 435 baris yang sudah siap untuk diclustering. Pada pengujian metode ini dibandingkan dengan metode K-Means, DBSCAN, Agglomerative, hasil menunjukkan bahwa metode yang digunakan setara dengan K-Means dan mengungguli 2 Metode lainnya. Pada tahun 2011, Bahar menghasilkan sebuah penelitian dengan judul Penentuan Jurusan Sekolah Menengah Atas Dengan Algoritma Fuzzy C

25 9 Means. Pada penelitian ini melakukan penjurusan di SMA berdasarkan Nilai mata pelajaran inti dengan menggunakan metode Fuzzy C Means. Penelitian ini juga menguji tingkat akurasi algoritma Fuzzy C-Means dalam penentuan jurusan pada Sekolah Menengah Atas. Dari 81 sampeldata siswa yang diuji dalam penelitian ini menunjukkan bahwa algoritma Fuzzy C Means memiliki tingkat akurasi yang lebih tinggi (rata-rata 78,39%) jika dibandingkan dengan metode penentuan jurusan secara manual yang selama ini dilakukan (hanya memiliki tingkat akurasi rata-rata 56,17%) Pada tahun 2010, Sumanto menghasilkan sebuah penelitian dengan judul Penerapan Fuzzy C-Means dalam pemilihan Peminatan Tugas Akhir Mahasiswa Pada penelitian ini menggunakan Fuzzy C-Means untuk melakukan pemilihan peminatan tugas akhir yang sesuai untuk mahasiswa. Proses penentuan peminatan Tugas Akhir dimulai dari pemilihan peminatan Tugas Akhir, disesuaikan dengan persyaratan kelulusan matakuliah yang berhubungan dengan peminatan Tugas Akhir yang dipilih oleh mahasiswa tersebut, sampai dengan pengujian hasil dari Tugas Akhir mahasiswa. Dari hasil penelitian dapat disimpulkan bahwa Fuzzy C-Means dalam penentuan pemilihan peminatan tugas akhir mempunyai keakuratan 80%. Pada tahun 2006, Andina Budiarti dkk menghasilkan sebuah penelitian dengan judul Studi Karakteristik Kelulusan Peserta Didik dengan Teknik Clustering. Pada penelitian ini teknik clustering diterapkan pada domain akademik dengan menggunakan algoritma Expectation Maxization (EM) yang ada di WEKA. Sebagai data uji coba digunakan data peserta didik Program Magister Teknologi Infromasi Universitas Indonesia (MTI-UI). Untuk mempermudah interpretasi dari hasil clustering digunakan teknik association rules. Dari hasil percobaan yang dilakukan, jalur lulus alternatif, Proyek Akhir terbukti mempercepat kelulusan mahasiswa. Karakteristik kelompok mahasiswa yang mengambil masing-masing jalur juga dapat diidentifikasi, informasi ini merupakan temuan yang sangat berguna bagi pihak penyelenggara pendidikan. Pada tahun 2010, Paul R.Burger dkk menghasilkan sebuah penelitian dengan judul GIS Spatial Analysis of University Of Nebraska at Kearney

26 10 Alumni Cohorts, Pada penelitian ini memiliki tujuan untuk memanfaatkan teknologi Sistem Informasi Geografis (SIG) dan analisis spasial pada data alumni Universitas Nebraska at Kearney (UNK) dari tahun untuk mengamati pola perubahan ditribusi persebaran kelompok alumni setiap 5 tahun. Mean centers, location quotitensts dan analisis cluster digunakan untuk menilai sejauh mana kelompok alumni UNK telah bermigrasi selama periode 75 tahun dan proporsi persebaran alumni UNK setiap wilayah dibandingkan dengan lulusan perguruan tinggi secara keseluruhan. Kemudian pola spasial dibandingkan dengan tren migrasi diseluruh Amerika Serikat pada periode yang sama. Penelitian kesembilan pada tahun 2015, Ariyady Kurniawan Muchsin, Made Sudarma menghasilkan sebuah penelitian dengan judul Penerapan Fuzzy C-Means Untuk Penentuan Besar Uang Kuliah Tunggal Mahasiswa Baru. Pada penelitian ini menggunakan metode Fuzzy C-Means (FCM) untuk mentukan besar uang kuliah tunggal mahasiswa baru di Universitas Udayana, dan menggunakan Index Xie dan Beni untuk mentukan cluster optimum dalam proses penentuan golongan Uang Kuliah Tunggal (UKT) sehingga dapat memenuhi nilai keadilan bagi calon mahasiswa baru. Dalam penelitian ini ada 7 atribut yang digunakan dalam proses cluster diantaranya yaitu : 1. Nilai jual objek pajak (NJOP) tanah (Rp). 2. Rata-rata rekening air perbulan (RP) dalam 3 bulan terakhir. 3. Rata-rata rekening listrik perbulan (Rp) dalam 3 bulan terakhir. 4. Nilai total saat ini dari mobil dalam keluarga (Rp). 5. Nilai total saat ini dari sepeda motor dalam keluarga (Rp). 6. Jumlah tanggungan orang tua berdasarkan KK (orang). 7. Total penghasilan keluarga (Ayah + Ibu + pendapatan lainnya) (Rp). Dari 7 point yang menggambarkan kondisi perekonomian keluarga calon mahasiswa baru dan dengan teknik clustering FCM dan Index Xie Beni data tersebut dapat diolah menjadi golongan UKT sehingga dapat membantu pihak Universitas untuk memenuhi rasa keadilan dalam menentukan golongan UKT bagi calon mahasiswa baru.

27 11 Berdasarkan studi literatur diatas maka diusulkan penelitian dengan judul Sistem Informasi Geografis Pemetaan Persebaran Alumni dengan Analisis Clustering. Rangkuman dari penelitian yang sudah pernah dilakukan sebelumnya dapat dilihat pada Lampiran Data Mining Data mining merupakan proses pencarian pola-pola yang menarik dan tersembunyi (hidden pattern) dari suatu kumpulan data yang berukuran besar yang tersimpan dalam suatu basis data, data warehouse, atau tempat penyimpanan data lainnya (Tan dkk, 2006). Menurut Sumanthi dan Sivandham (2009), data mining juga didefinisikan sebagai bagian dari proses penggalian pengetahuan dalam database yang sering disebut dengan istilah Knowledge Discovery in Database (KDD). KDD merupakan suatu area yang mengintegrasikan berbagai metode, yang meliputi statistik, basis data, kecerdasan buatan (Artificial Intelligence), machine learning, pengenalan pola (Pattern Recognition), pemodelan yang menangani ketidakpastian, visualisasi data, optimasi, Sistem Informasi Manajemen (SIM), dan sistem berbasis pengetahuan (knowledge based-system). Sebagai bagian dari proses yang ada di dalam KDD, maka data mining didahului dengan proses pemilihan data, pembersihan data, pre-processing, dan transformasi data (Sumanthi dan Sivandham, 2009). Proses KDD dapat dilihat pada Gambar 2.1 dibawah ini. Gambar 2.1 Proses KDD Sumber: Fayyad dkk, 1996

28 12 Ada tiga tahap penting dalam KDD, yaitu (Tan dkk, 2006) : 1. Data preprocessing Proses ini bertujuan untuk mentransformasikan data input ke dalam format yang sesuai untuk kemudian dianalisa. Dalam tahap ini dilakukan proses penggabungan data dari berbagai sumber, pembersihan data untuk menghilangkan noise data dan data ganda, serta memilih atribut data yang diperlukan bagi proses data mining. 2. Data mining Proses ini bertujuan untuk medapatkan pola-pola dan informasi yang tersembunyi di dalam basis data. Ada beberapa teknik yang dapat digunakan dalam data mining untuk mendapatkan pola-pola dan informasi tersembunyi, yaitu classification, neural network, decision tree, genetic algorithm, clustering, OLAP (Online Analitycal Processing), dan association rules. 3. Postprocessing Proses ini bertujuan untuk memastikan hanya hasil yang valid dan berguna yang dapat digunakan oleh pihak yang berkepentingan. Contoh dari proses ini adalah proses visualisasi, yaitu proses untuk menganalisa dan mengeksplorasi data dan hasil dari proses data mining dari berbagai sudut pandang. Tiga tahapan dalam proses KDD dapat dilihat pada Gambar 2.2 di bawah ini. Data Preprocessing Data Mining Postprocessing Information Feature selection Dimensionality reduction Normalization Data subseting Filtering patterns Visualizations Pattern interpretation Gambar 2.2 Tahapan dalam Proses Knowledge Discovery in Database Sumber: Tan dkk, Tugas Data Mining Tugas data mining secara garis besar dibagi menjadi dua kategori utama, yaitu (Tan dkk, 2006) : 1. Tugas prediktif.

29 13 Tujuan utama dari tugas ini adalah untuk memprediksikan nilai dari atribut tertentu berdasarkan nilai dari atribut lainnya. Atribut yang diprediksi dikenal sebagai target atau dependent variable, sedangkan atribut yang digunakan untuk membuat prediksi disebut penjelas atau independent variable. 2. Tugas deskriptif. Tujuan utama dari tugas ini adalah untuk memperoleh pola (correlation, trend, cluster, trajectory, anomaly) untuk menyimpulkan hubungan di dalam data. Tugas deskriptif merupakan tugas data mining yang sering dibutuhkan pada teknik postprocessing untuk melakukan validasi dan menjelaskan hasil proses data mining. Inti dari tugas data mining adalah pemodelan prediktif, analisa asosiasi, analisa cluster, dan deteksi terhadap anomali. Empat tugas inti dari data mining dapat dilihat pada Gambar 2.3 di bawahi ni. Pemodelan Prediktif Deteksi Terhadap Anomali Data Analisa Asosiasi Analisa Cluster Gambar 2.3 Empat Tugas Inti Data Mining Sumber: Tan dkk, 2006 Pemodelan prediktif mengacu pada proses membangun model untuk variabel target sebagai fungsi dari variabel penjelas. Ada dua tipe dari pemodelan prediktif, yaitu klasifikasi (classification) yang digunakan untuk variabel target yang diskret, dan regresi (regression) yang digunakan untuk variable target yang kontinyu. Analisa asosiasi digunakan untuk menemukan pola yang mendeskripsikan fitur-fitur data yang saling berhubungan. Pola-pola ini biasanya digambarkan dalam bentuk aturan implikasi. Analisa cluster merupakan proses untuk mencari kelompok-kelompok data, sedemikian sehingga data yang berada

30 14 dalam satu kelompok memiliki kemiripan dibandingkan data yang terletak pada kelompok lain. Deteksi anomaly merupakan proses identifikasi data yang memiliki perbedaan karakteristik yang signifikan dengan data yang lain atau yang dikenal dengan istilah outlier (Tan dkk, 2006) CRISP-DM CRISP-DM (CRoss-Industry Standard Process for Data Mining) merupakan suatu konsorsium perusahaan yang didirikan oleh Komisi Eropa pada tahun 1996 dan telah ditetapkan sebagai proses standar dalam data mining yang dapat diaplikasikan di berbagai sektor industri. Gambar 2.4 menjelaskan tentang siklus hidup pengembangan data mining yang telah ditetapkan dalam CRISP-DM. Gambar 2.4 Siklus Hidup CRISP-DM Sumber: Chapman, 2000 Berikut ini adalah enam tahap siklus hidup pengembangan data mining (Chapman, 2000) : 1. Business Understanding Tahap pertama adalah memahami tujuan dan kebutuhan dari sudut pandang bisnis, kemudian menterjemakan pengetahuan ini ke dalam pendefinisian masalah

31 15 dalam data mining. Selanjutnya akan ditentukan rencana dan strategi untuk mencapai tujuan tersebut. 2. Data Understanding Tahap ini dimulai dengan pengumpulan data yang kemudian akan dilanjutkan dengan proses untuk mendapatkan pemahaman yang mendalam tentang data, mengidentifikasi masalah kualitas data, atau untuk mendeteksi adanya bagian yang menarik dari data yang dapat digunakan untuk hipotesa untuk informasi yang tersembunyi. 3. Data Preparation Tahap ini meliputi semua kegiatan untuk membangun dataset akhir (data yang akan diproses pada tahap pemodelan/modeling) dari data mentah. Tahap ini dapat diulang beberapa kali. Pada tahap ini juga mencakup pemilihan tabel, record, dan atribut-atribut data, termasuh proses pembersihan dan transformasi data untuk kemudian dijadikan masukan dalam tahap pemodelan (modeling). 4. Modeling Dalam tahap ini akan dilakukan pemilihan dan penerapan berbagai teknik pemodelan dan beberapa parameternya akan disesuaikan untuk mendapatkan nilai yang optimal. Secara khusus, ada beberapa teknik berbeda yang dapat diterapkan untuk masalah data mining yang sama. Di pihak lain ada teknik pemodelan yang membutuhan format data khusus. Sehingga pada tahap ini masih memungkinan kembali ke tahap sebelumnya. 5. Evaluation Pada tahap ini, model sudah terbentuk dan diharapkan memiliki kualitas baik jika dilihat dari sudut pandang analisa data. Pada tahap ini akan dilakukan evaluasi terhadap keefektifan dan kualitas model sebelum digunakan dan menentukan apakah model dapat mencapat tujuan yang ditetapkan pada fase awal (Business Understanding). Kunci dari tahap ini adalah menentukan apakah ada masalah bisnis yang belum dipertimbangkan. Di akhir dari tahap ini harus ditentukan penggunaan hasil proses data mining. 6. Deployment

32 16 Pada tahap ini, pengetahuan atau informasi yang telah diperoleh akan diatur dan dipresentasikan dalam bentuk khusus sehingga dapat digunakan oleh pengguna. Tahap deployment dapat berupa pembuatan laporan sederhana atau mengimplementasikan proses data mining yang berulang dalam perusahaan. Dalam banyak kasus, tahap deployment melibatkan konsumen, di samping analis data, karena sangat penting bagi konsumen untuk memahami tindakan apa yang harus dilakukan untuk menggunakan model yang telah dibuat. 2.3 Himpunan Fuzzy Teori himpunan fuzzy merupakan titik penting perkembangan konsep ketidakpastian. Teori himpunan fuzzy diperkenalkan oleh Lotfi A. Zadeh pada tahun 1965 (Klir dan Yuan, 1995). Dengan diperkenalkannya teori himpunan fuzzy, maka anggapan bahwa teori probabilitas sebagai satu-satunya alat untuk memecahkan masalah yang mengandung unsur ketidakpastian, mengalami perkembangan. Teori himpunan fuzzy merupakan salah satu alat untuk memecahkan masalah ketidakpastian. Himpunan nonfuzzy (crisp set) A didefinisikan oleh anggotaanggota himpunan tersebut. Jika a A, maka nilai yang berhubungan dengan a adalah 1. Namun, jika a A, maka nilai yang berhubungan dengan a adalah 0. Notasi A = {x P(x)} menunjukkan bahwa anggota A adalah x dengan P(x) benar. Jika XA merupakan fungsi karakteristik dari A, maka dapat dikatakan bahwa P(x) benar, jika dan hanya jika XA(x) = 1. Himpunan fuzzy didasarkan pada gagasan untuk memperluas jangkauan karakteristik sedemikian hingga fungsi tersebut akan mencakup bilangan riil pada interval [0,1]. Himpunan fuzzy merupakan himpunan dengan batas-batas keanggotaan yang tidak dapat ditentukan dengan dipenuhi atau tidak dipenuhinya suatu syarat keanggotaan. Keanggotaan himpunan fuzzy ditentukan oleh derajat keanggotaan yang menentukan tingkat kesesuaian setiap anggota dengan fungsi keanggotaan yang telah ditentukan dalam himpunan fuzzy. Misalkan A adalah himpunan fuzzy dan x adalah objek tertentu. Dalil x adalah anggota A tidak dapat dikatakan bernilai benar atau salah, seperti yang dinyatakan dalam logika dua nilai. Dalil ini dapat dikatakan bernilai benar hanya untuk derajat tertentu, yaitu derajat dimana x

33 17 betul-betul anggota A. Pada umumnya, nilai kebenaran suatu dalil dinyatakan dengan bilangan riil dalam interval [0,1]. Nilai ini juga mewakili derajat keanggotaan dalam himpunan fuzzy. Notasi fungsi keanggotaan dari himpunan fuzzy A yang dilambangkan dengan μa, adalah sebagai berikut : μa X [0,1]...(2.1) Dalam hal ini, setiap fungsi keanggotaan memetakan elemen-elemen himpunan semesta X ke bilangan riil dalam interval [0,1]. 2.4 Clustering Pengelompokan (clustering) merupakan teknik yang sudah cukup dikenal dan banyak digunakan untuk mengelompokkan data/objek ke dalam kelompok data (cluster) sehingga setiap cluster memiliki data yang mirip dan berbeda dengan data yang berada dalam cluster lain. Jika diberikan himpunan data yang berjumlah terhingga, yaitu X, maka permasalahan clustering dalam X adalah mencari beberapa pusat cluster yang dapat memberikan ciri kepada masing-masing cluster dalam X. Gambar 2.5 menunjukkan contoh sederhana dari proses clustering, dimana 3 cluster di dalam data dapat teridentifikasi dengan mudah. Kriteria kemiripan yang digunakan dalam kasus ini adalah jarak (dalam kasus ini jarak geometris). Proses ini disebut distance-based clustering. Cara lain untuk melakukan clustering adalah conceptual clustering. Dalam conceptual clustering, objek dikelompokkan berdasarkan kecocokannya menurut konsep deskriptif. Gambar 2.5 memperlihatkan contoh proses clustering. Gambar 2.5. Contoh Proses Clustering Sumber: Jansen, 2007

34 Hard Clustering dan Fuzzy Clustering Metode pengelompokan klasik (hard clustering) berdasarkan pada teori himpunan klasik, yang menentukan bahwa sebuah objek dapat menjadi anggota atau bukan anggota dari suatu cluster. Fuzzy clustering memperbolehkan suatu objek untuk menjadi anggota dari beberapa cluster sekaligus dengan derajat keanggotaan yang berbeda-beda. Derajat keanggotaan berada di antara rentang 0 dan 1. Jadi, dataset X dapat dipartisi menjadi c fuzzy subset. Di dalam situasi riil, fuzzy clustering memiliki hasil yang lebih natural dibandingkan dengan hard clustering. Iilustrasi perbedaan antara hard clustering dan fuzzy clustering ditunjukkan melalui Gambar 2.6 berikut ini. Gambar 2.6. Hard dan Fuzzy Clustering Sumber: Jansen, Metode Fuzzy C-Means Clustering Metode Fuzzy C-Means Clustering pertama kali dikenalkan oleh Jim Bezdek pada tahun 1981 (Jain dkk, 1999). Fuzzy C-Means adalah salah satu teknik pengelompokkan data yang mana keberadaan tiap titik data dalam suatu kelompok (cluster) ditentukan oleh derajat keanggotan. Metode Fuzzy C-Means termasuk metode supervised clustering dimana jumlah pusat cluster ditentukan di dalam proses clustering. Algoritma dari fuzzy c-means adalah sebagai berikut (Yan, 1994): 1. Input data yang akan dikelompokkan, yaitu X, berupa matrix berukuran n x m (n=jumlah sampel data, m=atribut setiap data). Xij data sampel ke-i (i=1,2, n), atribut ke-j (j=1,2,..m).

35 19 2. Tentukan jumlah cluster (c), pangkat untuk matriks partisi (w), maksimum iterasi (MaxIter), error terkecil yang diharapkan (ξ), fungsi objektif awal (Po=0), dan iterasi awal (t=1). 3. Bangkitkan bilangan random ηik, i=1,2, n; k=1,2, c sebagai elemen matrik partisi awal U. 4. Hitung pusat cluster ke-k: V kj, dengan k=1,2,,c; dan j=1,2,,m, menggunakan persamaan berikut (Yan, 1994) : dengan : V kj = n i=1 ((μ ik )w.x ij )...(2.2) n i=1(μ ik ) w Vkj adalah pusat cluster ke-k untuk atribut ke-j ηik adalah derajat keanggotaan untuk data sampel ke-i pada cluster ke-k xij adalah data ke-i, atribut ke-j 5. Hitung fungsi objektif pada iterasi ke-t menggunakan persamaan berikut (Yan, 1994) : dengan: n c m P t = ([ (X ij V kj ) 2 i=1 k=1 j=1 ] (μ ik ) w )...(2.3) Vkj adalah pusat cluster ke-k untuk atribut ke-j ηik adalah derajat keanggotaan untuk data sampel ke-i pada cluster ke-k xij adalah data ke-i, atribut ke-j Pt adalah fungsi objektif pada iterasi ke-t 6. Hitung perubahan matriks partisi menggunakan persamaan berikut (Yan, 1994): 1 w 1 j=1 ] m [ (X ij V kj ) 2 1 c w 1 k=1 j=1 ] μ ik = [ m (X ij V kj ) 2 Dengan I = 1,2,,n; dan k=1,2, c. Dimana : Vkj adalah pusat cluster ke-k untuk atribut ke-j...(2.4) ηik adalah derajat keanggotaan untuk data sampel ke-i pada cluster ke-k xij adalah data ke-i, atribut ke-j

36 20 7. Cek Kondisi berhenti: Jika : ( P t -P t-1 <ε) atau (t>maxlter) maka berhenti. Jika tidak: t=t+1, ulangi langkah ke Ukuran Validitas Cluster Sejak konsep himpunan fuzzy diperkenalkan oleh Zadeh pada tahun 1965, konsep fuzzy clustering banyak dikembangkan dan diterapkan. Dalam konsep fuzzy clustering, suatu data dapat menjadi anggota dari beberapa cluster sekaligus menurut derajat keanggotaannya (Wu dan Yang, 2005). Proses clustering dalam algoritma fuzzy clustering selalu mencari solusi terbaik untuk parameter yang telah didefinisikan. Namun solusi terbaik ini belum tentu dapat menentukan deskripsi terbaik dari struktur data. Dalam hal ini jumlah cluster yang ditentukan atau bentuk cluster mungkin tidak sesuai dengan data. Untuk menentukan jumlah cluster yang paling optimal dan dapat memvalidasi apakah partisi fuzzy yang diterapkan dalam proses clustering sesuai dengan data, digunakan indeks pengukuran validitas cluster. Berikut ini adalah beberapa metode pengukuran validitas cluster yang umumnya digunakan untuk algoritma fuzzy clustering (Wu dan Yang, 2005): 1. Partition Coefficient Partition Coefficient (PC) merupakan metode yang mengukur jumlah cluster yang mengalami overlap. Indeks PC mengukur validitas cluster dengan rumus sebagai berikut : dimana : c = jumlah cluster N = jumlah data μij c N PC(c) = 1 (μ N i=1 j=1 ij 2 )...(2.8) = derajat keanggotaan data ke-j pada cluster ke-i PC(c) = nilai indeks PC pada cluster ke-c Nilai PC berada dalam batas 1 PC(c) 1. Pada umumnya jumlah cluster yang c paling optimal ditentukan dari nilai PC yang paling besar.

37 21 2. Modified Partition Coefficient Partition Coefficient cenderung mengalami perubahan yang monoton terhadap beragam nilai c (jumlah cluster). Modifikasi dari indeks PC (Modified Partition Coefficient/MPC) dapat mengurangi perubahan yang monoton tersebut. dan didefinisikan dengan rumus berikut: MPC(c) = 1 dimana : c c 1 (1 PC(c))...(2.9) c = jumlah cluster MPC(c) = nilai indeks MPC pada cluster ke-c Nilai MPC berada dalam batas 0 PC(c) 1. Pada umumnya jumlah cluster yang optimal ditentukan dari nilai MPC yang paling besar. 3. Classification Entropy Classification Entropy (CE) merupakan metode yang mengukur tingkat kekaburan (fuzzyness) dari partisi cluster. Indeks CE mengukur validitas cluster dengan rumus sebagai berikut : dimana : c = jumlah cluster N = jumlah data μij c N CE(c) = 1 μ N i=1 j=1 ij log (μ ij )...(2.10) = derajat keanggotaan data ke-j pada cluster ke-i CE(c) = nilai indeks CE pada cluster ke-c Nilai CE berada dalam batas 0 CE(c) log2c. Pada umumnya jumlah cluster yang optimal ditentukan dari nilai PE yang paling kecil. 2.6 Sistem Informasi Geografis Sistem Informasi Geospasial atau juga dikenal sebagai Sistem Informasi Geografis (SIG) mulai dikenal pada awal tahun 1980-an. SIG adalah suatu sistem untuk memperoleh, menyimpan, menganalisis dan mengelola data spasial beserta data atribut terkait yang secara keruangan direferensikan pada bumi. Dangermond

38 22 mendefinisikan SIG sebagai kumpulan data yang terorganisir dari perangkat keras komputer, perangkat lunak, data geografi dan personil yang didesain untuk memperoleh, menyimpan, memperbaiki, memanipulasi, menganalisis dan menampilkan semua bentuk informasi yang bereferensi geografi. Sedangkan pengertian lain dari SIG adalah serangkaian prosedur baik dengan komputer maupun manual yang digunakan untuk menyimpan dan memanipulasi data bereferensi geografis atau data geospasial. Pengertian SIG dapat beragam tetapi mempunyai satu kesamaan, yaitu bahwa SIG adalah suatu sistem yang berkaitan dengan informasi geografis. Dalam arti yang lebih sempit, SIG merupakan suatu sistem berbasis komputer yang digunakan untuk menyimpan dan menganalisis objek-objek dan fenomena-fenomena dengan lokasi geografis merupakan karakteristik yang penting untuk dianalisis. SIG dapat diuraikan menjadi beberapa subsistem sebagai berikut (Prahasta, 2005): a. Data Input Sub-sistem ini bertugas untuk mengumpulkan, mempersiapkan, dan menyimpan data spasial dan atributnya dari berbagai sumber. Sub-sistem ini pula yang bertanggung jawab dalam mengonversikan atau mentransformasikan format-format data aslinya ke dalam format yang dapat digunakan oleh perangkat SIG yang bersangkutan. b. Data Output Sub-sistem ini bertugas untuk menampilkan atau menghasilkan keluaran (termasuk mengekspornya ke format yang dikehendaki) seluruh atau sebagian basis data (spasial) baik dalam bentuk softcopy maupun hardcopy seperti halnya tabel, grafik, report, peta, dan lain sebagainya. c. Data Management Sub-sistem ini mengorganisasikan baik data spasial maupun tabel-tabel atribut terkait ke dalam sebuah sistem basis data sedemikian rupa hingga mudah dipanggil kembali atau di-retrieve, di-update, dan di-edit. d. Data Manipulation & Analysis

39 23 Sub-sistem ini menentukan informasi-informasi yang dapat dihasilkan oleh SIG. Selain itu sub-sistem ini juga melakukan manipulasi (evaluasi dan penggunaan fungsi-fungsi dan operator matematis & logika) dan pemodelan data untuk menghasilkan informasi yang diharapkan.gambar 2.7 menunjukkan sub sistem dari Sistem Informasi Geografis (SIG), dari gambar tersebut dapat dilihat ada bagian input, proses dan output. Gambar 2.7 Sub Sistem SIG Sumber: Prahasta 2005 Komponen-komponen dalam SIG (Sistem Informasi Geografis) terdiri dari: a. Perangkat Keras Komputer SIG membutuhkan komputer untuk penyimpanan dan pemrosesan data. Ukuran dari sistem komputerisasi bergantung pada tipe SIG itu sendiri. Hardware yang digunakan dalam SIG memiliki spesifikasi yang lebih tinggi dibandingkan dengan sistem informasi lainnya. b. Perangkat Lunak Komputer Sebuah software SIG haruslah menyediakan fungsi dan tool yang mampu melakukan penyimpanan data, analisis, dan menampilkan informasi geografis. Sebagai inti dari sistem SIG adalah software dari SIG itu sendiri yang menyediakan fungsi-fungsi untuk penyimpanan, pengaturan, link, queri, dan analisis data geografi. c. Data Geografis

40 24 SIG dapat mengumpulkan dan menyimpan data dan informasi yang diperlukan baik secara langsung maupun tidak langsung. Data yang dapat diolah dalam SIG merupakan fakta-fakta di permukaan bumi yang memiliki referensi keruangan baik referensi secara relatif maupun referensi secara absolut, dan disajikan dalam sebuah peta. d. Sumberdaya Manusia Sumberdaya manusia yang terlatih merupakan sebagai komponen terakhir dari SIG. Peranannya adalah sebagai pengoperasi perangkat keras dan perangkat lunak, serta menangani data geografis dengan kedua perangkat tersebut. Sumberdaya manusia juga merupakan sebagai sistem analis yangmenerjemahkan permasalahan riil di permukaan bumi dengan bahasa SIG, sehingga permasalahan dapat diidentifikasi dan dicari solusinya. Untuk selengkapnya dapat dilihat komponen SIG pada Gambar 2.8 di bawah ini. Gambar 2.8 Komponen Sistem Informasi Geografis Sumber: Ekadinata,2008 Data yang diolah pada SIG adalah data geospasial, yang terdiri dari data spasial dan data non spasial. Pada diagram di atas data non spasial tidak digambarkan karena sebagian besar data yang akan ditangani dalam SIG merupakan data spasial yaitu sebuah data yang berorientasi geografis, memiliki sistem koordinat tertentu sebagai dasar referensinya dan mempunyai dua bagian penting yang membuatnya berbeda dari data lain yaitu informasi lokasi (spasial) dan informasi deskriptif (atribut). Data spasial dapat diperoleh dari berbagai sumber

41 25 seperti peta analog (seperti peta topografi, peta tanah, dan sebagainya), data sistem penginderaan jauh (citra satelit dan foto udara), data hasil pengukuran lapangan dan data GPS. Sedangkan data non spasial adalah data selain data spasial yaitu data yang berupa teks atau angka. Data non spasial ini akan menerangkan data spasial atau sebagai dasar untuk menggambarkan data spasial. Data non spasial ini nantinya dapat dibentuk data spasial. Menurut Muehler dan McKee dalam bukunya OpenGIS Guide, terdapat dua layanan utama dalam SIG yaitu layanan data geografis (geodata service) dan layanan pemrosesan data geografis (geoprocessing service). Berdasarkan teknologi dan implementasinya, sistem informasi geografis dapat dikategorikan dalam tiga aplikasi yaitu SIG berbasis desktop (desktop GIS), SIG berbasis web (web GIS), dan SIG berbasis mobile (mobile GIS). Meskipun demikian, ketiganya saling berhubungan satu sama lain (Riyanto, 2010). Pada Gambar 2.9 di bawah ini dapat dilihat ketegori sistem informasi geografis secara lengkap. Gambar 2.9 Kategori Sistem Informasi Geografis Sumber: Riyanto, Pengujian Perangkat Lunak Pengujian perangkat lunak adalah elemen kritis dari jaminan kualitas perangkatlunak dan merepresentasikan kajian pokok dari spesifikasi, desain, dan pengkodean. Sejumlah aturan yang berfungsi sebagai sasaran pengujian pada perangkat lunak adalah (Sukamto, 2009) : 1. Pengujian adalah proses eksekusi suatu program dengan maksud menemukan kesalahan.

42 26 2. Test case yang baik adalah test case yang memiliki probabilitas tinggi untuk menemukan kesalahan yang belum pernah ditemukan sebelumnya. 3. Pengujian yang sukses adalah pengujian yang mengungkap semua kesalahan yang belum pernah ditemukan sebelumnya. Karakteristik umum dari pengujian perangkat lunak adalah sebagai berikut (Sukamto, 2009) : 1. Pengujian dimulai pada level modul dan bekerja keluar kearah integrasi pada sistem berbasiskan komputer 2. Teknik pengujian yang berbeda sesuai dengan poin-poin yang berbeda pada waktunya. 3. Pengujian diadakan oleh software developer dan untuk proyek yang besar oleh group testing yang independent. 4. Testing dan Debugging adalah aktivitas yang berbeda tetapi debugging harus diakomodasikan pada setiap strategi testing Metode pengujian perangkat lunak ada 3 jenis, yaitu (Sukamto, 2009) : 1. White Box/Glass Box - pengujian operasi 2. Black Box - untuk menguji sistem 3. Use case - untuk membuat input dalam perancangan black box dan pengujian statebased Pengujian menggunakan sekumpulan aktifitas validasi, dengan pendekatan black box testing. Menurut Shalahuddin dan Rosa (2011), black box testing adalah menguji perangkat lunak dari segi spesifikasi fungsional tanpa menguji desain dan kode program. Pengujian dimaksudkan untuk mengetahui apakah fungsi-fungsi, masukan, dan keluaran dari perangkat lunak sesuai dengan spesifikasi yang dibutuhkan. Pengujian kotak hitam dilakukan dengan membuat kasus uji yang bersifat mencoba semua fungsi dengan memakai perangkat lunak apakah sesuaidengan spesifikasi yang dibutuhkan. Kasus uji yang dibuat untuk melakukan pengujian black box testing harus dibuat dengan kasus benar dan kasus salah. Menurut Pressman (2010), black box testing juga disebut pengujian tingkah laku, memusat pada kebutuhan fungsional perangkat lunak. Teknik pengujian black box

43 27 memungkinkan memperoleh serangkaian kondisi masukan yang sepenuhnya menggunakan semua persyaratan fungsional untuk suatu program. Beberapa jenis kesalahan yang dapat diidentifikasi adalah fungsi tidak benar atau hilang, kesalahan antar muka, kesalahan pada struktur data (pengaksesan basis data), kesalahan performasi, kesalahan inisialisasi dan akhir program.

44 28 BAB III METODE PENELITIAN 3.1 Tempat dan Waktu Penelitian Tempat penelitian tentang sistem informasi geografis pemetaan alumni dengan analisa clustering ini bertempat di STMIK STIKOM Indonesia (STIKI Indonesia) Jalan Tukad Pakerisan No. 97 Denpasar. Penelitian ini dilakukan mulai dari bulan Februari Data Dalam penelitian ini menggunakan data yang mendukung pelaksanaan dari proses penelitian yang dilakukan. Adapun hal-hal yang menyangkut data tersebut adalah sumber data, jenis data dan teknik pengumpulan data Sumber Data Data yang digunakan dalam analisis penelitian ini bersumber dari data sekunder. Data sekunder diperoleh literatur dengan referensi buku, jurnal, tesis, hasil browsing di internet dan dari STIKI Indonesia yang menunjang analisa selama penelitian berlangsung Jenis Data Jenis data yang digunakan dalam penelitian ini merupakan data kuantitatif. Data kuantitatif merupakan data angka yang diperoleh langsung dari pihak STIKI Indonesia Teknik Pengumpulan Data Dalam penulisan proposal tesis ini, pengumpulan data yang diperoleh didasarkan pada metode-metode sebagai berikut: 1. Metode Observasi Merupakan metode pengumpulan data dengan menghubungi pihak yang menyediakan data alumni yang akan digunakan dalam penelitian dalam hal ini yaitu STMIK STIKOM Indonesia (STIKI Indonesia). Observasi dilakukan untuk

45 29 mengetahui pengumpulan dan cara pemrosesan data alumni yang selama ini dilakukan di STIKI Indonesia. 2. Metode Kepustakaan Metode pengumpulan data yang dilakukan dengan membaca buku-buku literatur yang berkaitan dengan materi yang dipergunakan dalam penelitian. 3.3 Gambaran Umum Penelitian Gambaran umum penelitian dapat dilihat pada Gambar 3.1 di bawah ini: Berdasarkan Gambar 3.1 di bawah dapat dijelaskan bahwa gambaran umum penelitian secara garis besar dibagi menjadi 3 tahapan yaitu pengumpulan data, data preprosesing dan tahapan data mining. Gambaran umum penelitian dimulai dari proses pengumpulan data yaitu mengumpulkan data alumni dari STIKI Indonesia. Tahapan selanjutnya yaitu data preprossesing, tahapaan ini memiliki tujuan untuk mempersiapkan data sebelum masuk ketahapan data mining, terdapat tiga proses yaitu seleksi data, data cleaning dan transformasi data.

46 30 Mulai Pengumpulan data Data Preprosesing Seleksi Data Data Cleaning Transformasi data Clustering dengan FCM Data Mining Validasi Cluster Analisis Cluster Pemetaan dengan Google Map Selesai Gambar 3.1 Gambaran Umum penelitian Setelah tahapan data proprosesing masuk ketahapan data mining, pada tahapan ini terdapat tiga proses yaitu clustering dengan FCM, validasi cluster dan analisis cluster. Tahapan terakhir yaitu pemetaan dengan google map, pada tahapan

47 31 ini akan dibuat Sistem Informasi Geograsi (SIG) berbasis web dengan memanfaatkan google map Pengumpulan Data Pada tahapan ini yang dilakukan yaitu mengumpulkan data yang akan digunakan dalam penelitian ini. Data tersebut berjenis data sekunder yaitu data alumni STIKI Indonesia. Atribut data alumni yang akan digunakan dalam penelitian ini selengkapnya terdiri dari: Nomor Induk Mahasiswa (NIM), nama mahasiswa, jenis kelamin, alamat, no telepon, program studi, angkatan, tahun lulus, Indeks Prestasi Kumulatif (IPK), lama studi (dalam semester), lama pengerjaan tugas akhir (dalam semester), tempat bekerja, alamat tempat bekerja, kesesuaian bidang kerja Data Preprosesing Dalam tahapan ini terdapat tiga langkah yaitu seleksi data, data cleaning dan transformasi data. Tujuan dari tahapan ini adalah untuk mengubah data mentah menjadi data yang berkualitas, seperti memperbaiki data yang incomplete (tidak lengkap), noisy (data berisi kesalahan nilai) dan data tidak konsisten. 1. Seleksi Data Pada tahapan seleksi data yang akan dilakukan yaitu melakukan seleksi atribut yang akan digunakan. Tentunya tidak semua atribut dimasukkan dalam set data yang digunakan dalam proses data mining karena hanya yang berperan sebagai referensi identifikasi yang akan dipilih. Dari semua atribut yang disebutkan diatas maka yang akan digunakan dalam proses data mining adalah atribut NIM, Nama mahasiswa, Kesesuaian bidang kerja, Indeks Prestasi Kumulatif (IPK), Lama masa studi, Lama pengerjaan Tugas Akhir (TA). Tabel 3.1 menunjukkan data yang belum mengalami seleksi data dan Tabel 3.2 menunjukkan data yang telah mengalami seleksi data.

48 32 Tabel 3.1 Atribut Sebelum Seleksi Data No Atribut 1 NIM 2 Nama 3 Alamat 4 Jenis kelamin 5 Golongan darah 6 Tempat lahir 7 Tanggal lahir 8 No Hp 9 Program Study 10 Angkatan 11 Tahun lulus 12 IPK 13 Lama Study 14 Lama pengerjaan TA 15 Kesesuaian bidang kerja 16 Tempat bekerja 17 Alamat tempat bekerja Tabel 3.2 Seleksi Data NO NIM IPK Lama Studi Pengerjaan TA Bidang Kerja Kurang Sesuai Tidak Sesuai Tidak Sesuai Kurang Sesuai Sesuai Kurang Sesuai

49 33 Jumlah keseluruhan data adalah 526 alumni, untuk atribut lama studi dalam satuan semester dan pengerjaan tugas akhir dalam satuan bulan. 2. Data Cleaning Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses data cleaning. Tujuan dari proses ini adalah untuk memastikan kualitas data yang telah dipilih pada tahapan seleksi data. Proses data cleaning meliputi menghilangkan duplikasi data, memeriksa inkonsistensi data dan memperbaiki kesalahan pada data, proses ini dilakukan dengan metode query serderhana untuk menemukan anomalianomali data yang masih terdapat pada data. Misalkan penulisan jenis kelamin masih belum inkonsisten masih ada yang menggunakan p, l, laki-laki dan perempuan. 3. Transformasi Data Pada tahapan ini data yang akan dilakukan yaitu mengubah data yang telah dipilih sehingga data sesuai untuk proses data mining. Atribut bidang kerja berjenis data nominal sedangkan atribut lama studi, IPK dan pengerjaan TA berjenis data numerik. Oleh karena itu atribut bidang kerja berjenis data nominal harus dirubah menjadi data numerik dengan menggunakan rumus 3.1(Gniazdowski, Grabowski, 2015). dimana: R = data baru (Rank) n = frekuensi kemunculan data R = n+1 2 (3.1) Berikut ini merupakan perhitungan dengan menggunakan rumus 3.1 untuk atribut bidang kerja pada. Frekuensi kemunculan untuk nilai atribut sesuai = 169, untuk atribut kurang sesuai = 256 dan atribut tidak sesuai = 101. Jadi perhitungan masing-masing atribut adalah Nilai atribut kurang sesuai : R = Nilai atribut sesuai : R = = 85 Nilai atribut tidak sesuai : R = = 128,5 = 51 Jadi nilai numerik untuk atribut bidang kerja akan menjadi seperti Tabel 3.3.

50 34 Tabel 3.3 Konversi Atribut Bidang Kerja NO NIM IPK Lama Studi Pengerjaan TA Bidang Kerja , , , Data Mining Pada tahapan ini terdapat tiga proses yaitu melakukan clustering dengan Fuzzy C-Means, dan Validasi Cluster Analisis Cluster. 1. Clustering dengan Fuzzy C-Means Setelah data melewati preprosesing maka selanjutnya yaitu melakukan clustering dengan Fuzzy C-Mean, proses algoritmanya dapat dilihat pada Gambar 3.2 Proses clustering dengan Fuzzy C-Means berdasarkan Gambar 3.2 dapat dijelaskan sebagai berikut: Input data yang akan di cluster berupa matrik n x m (n = jumlah sampel data, m = atribut setiap data). Tentukan jumlah cluster (c), pangkat untuk matriks partisi (w), maksimum iterasi (MaxIter), nilai epsilon atau error terkecil yang diharapkan (ξ), fungsi objektif awal (Po = 0), dan iterasi awal (t = 1). Tentukan bilangan random ηik, i = 1,2, n; k =1,2, c sebagai matrik partisi awal U Hitung pusat cluster ke-k: V kj, dengan k = 1,2,,c; dan j = 1,2,,m, menggunakan persamaan (2.2)

51 35 Mulai Masukkan Data matrik ukuran n x m Jumlah cluster Pangkat matrik Iterasi Epsilon Fungsi objektif Hitung Fungsi Objektif Matrik partisi awal Nilai epsilon terpenuhi? Ya Naikkan Iterasi Tidak Hitung Pusat Cluster Tidak Mencapai iterasi maksimal? Hitung Perubahan Matrik Partisi Ya Cluster Alumni Selesai Gambar 3.2 Clustering Fuzzy C Means Hitung perubahan matriks partisi menggunakan persamaan (2.4) Hitung fungsi objektif pada iterasi ke-t menggunakan persamaan (2.3) Cek Kondisi berhenti: Jika : ( P t -P t-1 < ε) atau (t > Maxlter) maka berhenti. Jika tidak: t = t + 1, ulangi langkah ke Validasi Cluster Tujuan dari validasi cluster untuk menentukan jumlah cluster yang paling optimal dan memvalidasi apakah metode yang diterapkan sesuai dengan data.

52 36 Proses clustering diuji coba dengan berbagai nilai parameter. Dalam penelian ini menggunakan validasi cluster indeks Modified Partition Coefficient (MPC) (untuk mengukur cluster yang mengalami overlap) dan Classification Entropy (CE) (untuk mengukur tingkat kekaburan/fuzziness dari partisi cluster. 3. Analisis Cluster Setelah melewati proses data mining dan sudah divalidasi maka tahapan selanjutnya yaitu analisis cluster. Dalam tahapan ini yaitu melakukan analisis terhadap cluster-cluster yang telah terbentuk, hasilnya berupa karakteristik dari profile alumni STIKI Indonesia. Misalkan pada cluster pertama cenderung ditempati oleh alumni yang berkerja sesuai bidang studi dengan IPK diatas 3,6 memiliki lama studi kurang dari 8 semester dan lama pengerjaan tugas akhir selama satu semester Pemetaan dengan Google Maps Pada tahapan ini data hasil clustering akan aplikasikan dalam Sistem Informasi Geografis dengan memanfaatkan peta online dari Google Maps, database MySql dan Bahasa pemrograman menggunakan PHP. Atribut yang akan dimunculkan dalam peta yaitu NIM, Nama mahasiswa, Jenis kelamin, program studi, Angkatan, Pekerjaan, Alamat tempat bekerja, Cluster. Dari aplikasi ini akan dapat diketahui persebaran alumni STIKI Indonesia lengkap dengan profile alumni tersebut. 1. Rancangan User Interface Rancangan user interface terdiri dati 2 halaman yaitu halaman utama dan halaman manipulasi data. Untuk rancangan tampilan utama dapat dilihat pada Gambar 3.3 di bawah ini.

53 37 Sistem Informasi Geografis Alumni STIKI Indonesia Menu Cluster Angkatan Wilayah Tampilan Peta Gambar 3.3 Rancangan Tampilan Utama Tampilan halaman utama dari aplikasi sistem informasi geografis alumni dapat dilihat pada Gambar 3.3. Pada halaman ini terdapat menu cluster yang digunakan untuk memilih cluster yang akan ditampilkan, menu angkatan untuk menampilkan angkatan dari alumni yang akan ditampilkan, menu wilayah untuk memilih wilayah yang ingin ditampilkan. Terdapat juga tools navigasi yang dapat digunakan oleh user untuk navigasi peta. Rancangan form manipulasi data alumni dapat dilihat pada Gambar 3.4 di bawah ini. Pada halamn ini user dapat memanipulasi data alumni seperti melakukan insert, edit dan delete data. Menu Sistem Informasi Geografis Alumni STIKI Indonesia Data Alumni NIM Nama IPK Prodi Save Edit Delete Gamber 3.4 Rancangan Form Manipulasi Data Alumni

54 38 2. Rancangan Tabel Untuk rancangan tabel dapat dilihat pada Gambar 3.5 di bawah ini. Dalam SIG yang nanti akan dibuat akan menggunakan 4 buah tabel yaitu : tblcluster, tblalumni, tblkecamatan dan tbluser. Berikut merupakan fungsi dari masing-masing tabel tersebut : Tabel tblcluster Tabel tblcluster berguna untuk menyimpan data cluster yang dihasilkan dari proses clustering data alumni. Tabel ini terdiri dari field idcluster, cluster, dan analisis cluster. Tabel tblalumni Tabel tblalumni berguna untuk menyimpan data alumni yang akan ditampilkan pada peta. Tabel ini terdiri dari field nim, idcluster, idkecamatan, nama, jenis kelamin, angkatan, alamat, notlp, programstudi, tahunlulus, ipk, lamastudi, lamapengerjaanta, kesesuaian bidang kerja dan tempat bekerja. Tabel tblkecamatan Tabel tblkecamatan berguna untuk menyimpan data kecamatan yang akan digunakan untuk filter memunculkan data sesuai kecamatan. Tabel ini terdiri dari field idkecamatan, kecamatan, latitude dan longitude. Tabel tbluser Tabel tbluser berguna untuk menyimpan data user yang akan menggukankan sistem, dimana nantinya user akan dibedakan menjadi 2 yaitu user admin dan user operator yang memiliki role yang berbeda. Tabel ini terdiri dari field id kecamatan, kecamatan, latitude dan longitude. Untuk rancangan tabel selangkapnya dapat dilihat pada Gambar 3.5 di bawah ini.

55 39 tblcluster tblalumni tblkecamatan PK idcluster PK nim PK idkecamatan cluster analisiscluster PK tbluser iduser nama username password role idcluster nama idkecamatan jeniskelamin angkatan alamat notlp programstudi tahunlulus ipk lamastudi lamapengerjaanta kesesuaianbidangkerja tempatbekerja kecamatan latitude longitude Gambar 3.5 Rancangan Tabel 3.4 Jadwal Pelaksanaan Kegiatan Jadwal penyusunan Tesis ini dapat disusun dalam bentuk tabel sebagai berikut: Tabel 3.4 Jadwal Penyusunan Tesis 2018 Kegiatan Jan Feb Mar Apr Mei Juni Jul Ags Sep Studi Literatur Pengumpulan Data Pengolahan data Analisa dan Pembahasan Penyusunan laporan Tesis

56 BAB IV ANALISA DATA DAN PEMBAHASAN Untuk mengetahui tingkat keberhasilan dari penelitian ini, dapat dilihat dari hasil kerja sistem yang telah dibuat. Data yang digunakan dalam penelitian ini adalah data alumni dari tahun 2012 sampai tahun 2016 yang berjumlah sebanyak 700 data, setelah dilakukan seleksi data maka yang dapat digunakan dalam proses pengujian adalah sebanyak 526. Dalam penelitian ini dilakukan analisa terhadap hasil clustering dengan metode Fuzzy C-Means (FCM). Hasil clustering untuk algoritama Fuzzy C-Means (FCM) diuji dengan nilai parameter jumlah cluster yang berbeda-beda. Untuk menguji validitas cluster digunakan indeks Modified Partition Coefficient (MPC) dan Classification Entropy (CE). 4.1 Implementasi Clustering dengan Algoritma Fuzzy C-Means Implementasi clustering dengan algoritma Fuzzy C-Means dibuat berbasis GUI menggunakan MATLAB versi R2017a menggunakan Fuzzy Logic Toolbox. Tools editor yang digunakan untuk perancangan GUI di dalam MATLAB adalah GUIDE. Gambar 4.1 Form Clustering Data Alumni

57 41 Pada form ini user dapat melakukan clustering data alumni dengan 2 atribut, 3 atribut dan 4 atribut. Sebelum dapat melakukan proses clustering sebelumnya user harus meload data melalui tombol Load Data. Setelah data sudah muncul di grafik, untuk melakukan clustering tinggal menekan tombol cluster maka proses clustering akan berlangsung. Informasi yang dapat dilihat dalam form ini adalah jumlah cluster, maksimum iterasi, fungsi objectif, nilai validasi cluster, sebaran data cluster yang terbentuk, nilai pusat cluster dan jumlah anggota di setiap cluster. 4.2 Implementasi Sistem Informasi Geografis Alumni Pada Gambar 4.2 dapat dilihat tampilan utama dari Sistem Informasi Geografis Pemetaan berbasis web dengan analisa clustering. Sistem ini dibuat dengan menggukanan google maps sebagai peta dasarnya, google map api untuk dapat mengakses fitur dari google maps, bahasa pemrograman menggunakan PHP dan database Mysql. Gambar 4.2 Halaman Utama Sistem Informasi Geografis Alumni Pada halaman utama dapa dilihat menu maps, data provinsi, data kabupaten, data kecamatan, data cluster dan data alumni.

58 42 Gambar 4.3 Halaman Pengelolaan Data Provinsi Sistem Informasi Geografis Alumni Halaman pengelolaan data provinsi berfungsi untuk melakukan meneglola data provinsi yang ada di database. Seperti melakukan insert, update ataupun menghapus data provinsi. Gambar 4.4 Halaman Pengelolaan Data Kabupaten Sistem Informasi Geografis Alumni

59 43 Halaman pengelolaan data kabupaten berfungsi untuk mengelola data kabupaten yang ada di database. Seperti melakukan insert, update ataupun menghapus data kabupaten. Gambar 4.5 Halaman Pengelolaan Data Kecamatan Sistem Informasi Geografis Alumni Halaman pengelolaan data kecamatan berfungsi untuk mengelola data kecamatan yang ada di database. Seperti melakukan insert, update ataupun menghapus data kecamatan. Gambar 4.6 Halaman Pengelolaan Data Cluster

60 44 Halaman manipulasi data cluster berfungsi untuk melakukan manipulasi data cluster yang ada di database. Seperti melakukan insert, update ataupun menghapus data cluster. Data yang dapat diubah pada halaman ini adalah no cluster dan analisa cluster. Gambar 4.7 Halaman Manipulasi Data Alumni Sistem Informasi Geografis Alumni Halaman manipulasi data alumni berfungsi untuk melakukan manipulasi data alumni yang ada di database. Seperti melakukan insert, update ataupun menghapus data alumni. Data yang dapat diubah pada halaman ini Nim, nama, kecamatan, cluster, angkatan, jenis kelamin, no telp, program studi, tahun lulus, IPK, lama studi, lama pengerjaan TA, kesesuaian bidang kerja dan foto.

61 45 Gambar 4.8 Halaman Lokasi Alumni Sistem Informasi Geografis Alumni Gambar 4.9 Halaman Detail Data Alumni Sistem Informasi Geografis Alumni Pada Gambar 4.9 dapat dilihat tampilan dari sistem saat kita ingin melihat persebaran alumni, dalam gambar tersebut terlihat satu marker yang menandakan diwilayah tersebut ada alumni yang kerja. Jika marker tersebut di klik maka akan memunculkan Nim dan Nama dari alumni tersebut. Untuk melihat data detail alumni dapat melakukan klik di lihat detai, akan langsung muncul data detail dari

62 46 alumni tersebut. Filter percarian yang tersedia dalam sistem ini adalah pencarian berdasarkan angkatan, kecamatan dan tahun lulus. 4.3 Hasil uji coba Proses clustering data alumni menggukanan algoritma Fuzzy C-Means diuji coba dengan berbagai jumlah cluster. Proses clustering dilakukan dengan menetapkan nilai awal sebagai berikut (Yan, 2004) : 1. Jumlah cluster = ditentukan user 2. Pangkat = 2 3. Maksimum iterasi = Error terkecil yang diharapkan = Fungsi objektif awal = 0 6. Iterasi awal = Clustering Data Alumni dengan Dua Atribut Hasil proses clustering data alumni dengan dua atribut dan jumlah cluster 2 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 18, dengan nilai fungsi objektif

63 47 Gambar Hasil Clustering Menggunakan FCM 2 Atribut dengan 2 Cluster Dari grafik dapat dilihat pusat cluster ke 1 ditandai dengan X berwarna merah dan anggota clusternya ditandai dengan o berwarna merah. Pusat cluster ke 2 ditandai dengan X berwana biru dan anggota clusternya ditandai dengan o berwarna biru. Tabel 4.1 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster. Tabel 4.1. Koordinat Titik Pusat Cluster (Jumlah Cluster = 2) No Cluster Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) ,2750 7, , ,3679 Hasil proses clustering data alumni dua atribut dengan jumlah cluster 3 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 37, dengan nilai fungsi objektif

64 48 Gambar Hasil Clustering Menggunakan FCM 2 Atribut dengan 3 Cluster Dari grafik dapat dilihat pusat cluster ke 1 ditandai dengan X berwarna merah dan anggota clusternya ditandai dengan o berwarna merah. Pusat cluster ke 2 ditandai dengan X berwana hijau dan anggota clusternya ditandai dengan o berwarna hijau. Pusat cluster ke 3 ditandai dengan X berwarna biru dan anggota cluster ditandai dengan o berwarna biru. Tabel 4.2 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster. Tabel 4.2. Koordinat Titik Pusat Cluster (Jumlah Cluster = 3) No Cluster Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) , , ,2891 7, ,1187 9,6016

65 49 Hasil proses clustering data alumni dua atribut dengan jumlah cluster 4 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 22, dengan nilai fungsi objektif Gambar Hasil Clustering Menggunakan FCM 2 Atribut dengan 4 Cluster Dari grafik dapat dilihat pusat cluster ke 1 ditandai dengan X berwarna merah dan anggota clusternya ditandai dengan o berwarna merah. Pusat cluster ke 2 ditandai dengan X berwana hijau dan anggota clusternya ditandai dengan o berwarna hijau. Pusat cluster ke 3 ditandai dengan X berwarna biru dan anggota cluster ditandai dengan o berwarna biru. Pusat cluster ke 4 ditandai dengan X berwarna cyan dan anggota cluster ditandai dengan o berwarna cyan. Tabel 4.3 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster.

66 50 Tabel 4.3. Koordinat Titik Pusat Cluster (Jumlah Cluster = 4) No Cluster Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) , , ,2902 7, ,1554 8, , ,0608 Hasil proses clustering data alumni dua atribut dengan jumlah cluster 5 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 27, dengan nilai fungsi objektif Gambar Hasil Clustering Menggunakan FCM 2 Atribut dengan 5 Cluster Dari grafik dapat dilihat pusat cluster ke 1 ditandai dengan X berwarna merah dan anggota clusternya ditandai dengan o berwarna merah. Pusat cluster ke 2 ditandai dengan X berwana hijau dan anggota clusternya ditandai dengan o berwarna hijau. Pusat cluster ke 3 ditandai dengan X berwarna biru dan anggota cluster ditandai dengan o berwarna biru. Pusat cluster ke 4 ditandai dengan X berwarna cyan dan anggota cluster ditandai dengan o berwarna cyan. Pusat

67 51 cluster ke 5 ditandai dengan X berwana magenta dan anggota cluster ditandai dengan o berwana magenta. Tabel 4.4 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster. Tabel 4.4. Koordinat Titik Pusat Cluster (Jumlah Cluster = 5) No Cluster Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) ,0909 9, ,1545 8, ,2886 7, , , , ,4261 Hasil proses clustering data alumni dua atribut dengan jumlah cluster 6 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 23, dengan nilai fungsi objektif Gambar Hasil Clustering Menggunakan FCM 2 Atribut dengan 6 Cluster

68 52 Dari grafik dapat dilihat pusat cluster ke 1 ditandai dengan X berwarna merah dan anggota clusternya ditandai dengan o berwarna merah. Pusat cluster ke 2 ditandai dengan X berwana hijau dan anggota clusternya ditandai dengan o berwarna hijau. Pusat cluster ke 3 ditandai dengan X berwarna biru dan anggota cluster ditandai dengan o berwarna biru. Pusat cluster ke 4 ditandai dengan X berwarna cyan dan anggota cluster ditandai dengan o berwarna cyan. Pusat cluster ke 5 ditandai dengan X berwana magenta dan anggota cluster ditandai dengan o berwana magenta. Pusat cluster ke 6 ditandai dengan X berwana kuning dan anggota cluster ditandai dengan o berwana kuning. Tabel 4.5 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster. Tabel 4.5. Koordinat Titik Pusat Cluster (Jumlah Cluster = 6) No Cluster Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) , , ,3514 9, ,0218 9, ,2660 7, , , ,3916 6, Analisis Cluster dengan Dua Atribut Dari proses clustering yang telah dilakukan terhadap data alumni dengan 2 atribut (IPK dan masa studi), ada beberapa hal yang dapat dianalisis. Untuk menentukan jumlah cluster yang memiliki nilai fitness terbaik/jumlah cluster yang paling optimal digunakan indeks pengukuran validitas Modified Partition Coeficient (MPC) dan Classification Entropy (CE). Tabel 4.6 menunjukkan nilai nilai indeks MPC dan CE untuk setiap jumlah cluster yang diujikan pada algoritma Fuzzy C-Means (FCM).

69 53 Tabel 4.6. Indek MPC dan CE pada Algoritma FCM Jumlah Cluster Indeks CE Indeks MPC Dari tabel 4.6 dapat dilihat bahwa nilai indeks CE yang terkecil berada pada proses clustering dengan jumlah cluster = 2. Untuk nilai indeks MPC pada tabel 4.6 nilai terbesar berada pada proses clustering dengan jumlah cluster = 2. Sehingga berdasarkan indeks CE (nilai terkecil) dan indeks MPC (nilai terbesar), jumlah cluster yang paling optimal untuk data alumni dengan 2 atribut (IPK dan masa study) adalah 2 cluster. Pada penelitian sebelumnya yang dilakukan oleh Simbolon Lineker Cary (2013) yang menggunakan atribut yang sama yaitu IPK dan masa studi menghasilkan jumlah cluster yang berbeda yaitu 4 cluster. Perbedaan ini bisa diakibatkan beberapa hal: karena pada penelitian sebelumnya tidak menggunakan indeks validitas sehingga jumlah cluster yang terbentuk belum tentu merupakan jumlah cluster yang paling optimal. perbedaan jumlah dan karakteristik data. Jadi penelitian yang dilakukan sekarang ini dapat dikatakan lebih efektif, karena dapat diketahui bahwa jumlah cluster yang terbentuk (dua buah cluster) merupakan jumlah yang paling optimal berdasarkan nilai indeks validitas CE dan MPC. No Cluster Tabel 4.7 Nilai Titik Pusat Cluster Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) ,2750 7, , ,3679 Untuk menentukan karakteristik tiap cluster yang terbentuk kita dapat melihat Tabel 4.7, karakteristik cluster dapat ditentukan dari nilai titik pusat

70 54 clusternya setiap atributnya. Sehingga terbentuk yaitu : karakteristik dari hasil cluster yang Cluster ke 1 dengan jumlah anggota sebanyak 367 orang memiliki IPK ratarata 3,2750 dan masa studi rata-rata 7,9523 semester Cluster ke 2 dengan jumlah angota sebanyak 159 orang memiliki IPK rata-rata 3,0812 dan masa studi rata-rata 10,3679 semester Untuk clustering dengan 2 atribut jumlah cluster yang memiliki nilai fitnes terbaik/jumlah cluster yang paling optimal berdasarkan indeks validitas CE dan MPC adalah 2 cluster. Cluster yang memiliki karakteristik terbaik adalah cluster ke 1 dimana memiliki anggota sebanyak 367 orang atau jika dihitung dari total keseluruhan alumni (526 orang) maka persentasenya akan menjadi : persentase(%) = x 100 = 69,77% dari total keseluruhan alumni. Karakteristik cluster terbaik ditentukan dengan melihat nilai titik pusat cluster untuk atribut IPK yang paling besar dan nilai titik pusat cluster untuk atribut masa studi yang lebih kecil. Jadi jumlah alumni yang termasuk dalam cluster 1 yaitu cluster dengan karakteristik terbaik jumlahnya cukup banyak yaitu 69,77% dari total keseluruhan alumni Clustering Data Alumni dengan Tiga Atribut Hasil proses clustering data alumni dengan tiga atribut dan jumlah cluster 2 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 13, dengan nilai fungsi objektif

71 55 Gambar Hasil Clustering Menggunakan FCM 3 Atribut dengan 2 Cluster Dari grafik dapat dilihat pusat cluster ke 1 ditandai dengan X berwarna merah dan anggota clusternya ditandai dengan o berwarna merah. Pusat cluster ke 2 ditandai dengan X berwana biru dan anggota clusternya ditandai dengan o berwarna biru. Tabel 4.8 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster. No Cluster Tabel 4.8. Koordinat Titik Pusat Cluster (Jumlah Cluster = 2) Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) Titik Pusat Cluster (Masa TA) ,2275 8,5716 4, ,1440 9, ,0067 Hasil proses clustering data alumni tiga atribut dengan jumlah cluster 3 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 28, dengan nilai fungsi objektif

72 56 Gambar Hasil Clustering Menggunakan FCM 3 Atribut dengan 3 Cluster Dari grafik dapat dilihat pusat cluster ke 1 ditandai dengan X berwarna merah dan anggota clusternya ditandai dengan o berwarna merah. Pusat cluster ke 2 ditandai dengan X berwana hijau dan anggota clusternya ditandai dengan o berwarna hijau. Pusat cluster ke 3 ditandai dengan X berwarna biru dan anggota cluster ditandai dengan o berwarna biru. Tabel 4.9 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster. No Cluster Tabel 4.9. Koordinat Titik Pusat Cluster (Jumlah Cluster = 3) Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) Titik Pusat Cluster (Masa TA) ,2605 8,2525 5, ,1456 9, , ,1712 9,1304 3,0134 Hasil proses clustering data alumni tiga atribut dengan jumlah cluster 4 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 25, dengan nilai fungsi objektif

73 57 Gambar Hasil Clustering Menggunakan FCM 3 Atribut dengan 4 Cluster Dari grafik dapat dilihat pusat cluster ke 1 ditandai dengan X berwarna merah dan anggota clusternya ditandai dengan o berwarna merah. Pusat cluster ke 2 ditandai dengan X berwana hijau dan anggota clusternya ditandai dengan o berwarna hijau. Pusat cluster ke 3 ditandai dengan X berwarna biru dan anggota cluster ditandai dengan o berwarna biru. Pusat cluster ke 4 ditandai dengan X berwarna cyan dan anggota cluster ditandai dengan o berwarna cyan. Tabel 4.10 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster. No Cluster Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 4) Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) Titik Pusat Cluster (Masa TA) ,2604 8,2403 5, ,1785 9,0671 2, ,1495 9, , ,1101 9, ,9488

74 58 Hasil proses clustering data alumni tiga atribut dengan jumlah cluster 5 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 40, dengan nilai fungsi objektif Gambar Hasil Clustering Menggunakan FCM 3 Atribut dengan 5 Cluster Dari grafik dapat dilihat pusat cluster ke 1 ditandai dengan X berwarna merah dan anggota clusternya ditandai dengan o berwarna merah. Pusat cluster ke 2 ditandai dengan X berwana hijau dan anggota clusternya ditandai dengan o berwarna hijau. Pusat cluster ke 3 ditandai dengan X berwarna biru dan anggota cluster ditandai dengan o berwarna biru. Pusat cluster ke 4 ditandai dengan X berwarna cyan dan anggota cluster ditandai dengan o berwarna cyan. Pusat cluster ke 5 ditandai dengan X berwana magenta dan anggota cluster ditandai dengan o berwana magenta. Tabel 4.11 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster.

75 59 No Cluster Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 5) Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) Titik Pusat Cluster (Masa TA) ,2479 8,4244 2, ,1004 9,7679 5, ,1507 9, , ,1111 9, , ,2918 7,9687 5, Analisis Cluster dengan Tiga Atribut Dari proses clustering yang telah dilakukan terhadap data alumni dengan tiga buah atribut (IPK, masa studi dan masa TA), ada beberapa hal yang dapat dianalisis. Untuk menentukan jumlah cluster yang memiliki nilai fitness terbaik/jumlah cluster yang paling optimal digunakan indeks pengukuran validitas Modified Partition Coeficient (MPC) dan Classification Entropy (CE). Tabel 4.13 menunjukkan nilai nilai indeks MPC dan CE untuk setiap jumlah cluster yang diujikan pada algoritma Fuzzy C-Means (FCM). Tabel Indek MPC dan CE pada Algoritma FCM Jumlah Cluster Indeks CE Indeks MPC Dari tabel 4.13 dapat dilihat bahwa nilai indeks CE yang terkecil berada pada proses clustering dengan jumlah cluster = 2. Untuk nilai indeks MPC pada tabel 4.13 nilai terbesar berada pada proses clustering dengan jumlah cluster = 2. Sehingga berdasakan indeks CE (nilai terkecil) dan indeks MPC (nilai terbesar), jumlah cluster yang paling optiomal untuk data alumni dengan 3 buah atribut (IPK, masa study dan masa TA) adalah 2 cluster. Berdasarkan Tabel 4.8 (tabel koordinat titik pusat cluster) dapat dianalisis karakteristik dari cluster yang terbentuk yaitu :

76 60 pada cluster 1 yang jumlah anggotanya 403 orang memiliki rata-rata IPK 3,2275, masa studi rata-rata 8,5716 semester dan masa pengerjaan TA rata-rata 4,9147 bulan. pada cluster 2 yang jumlah anggotanya 123 orang memiliki rata-rata IPK 3,1440, masa studi kurang rata-rata 9,4120 semester dan masa pengerjaan TA rata-rata 12,0067 bulan. Jadi untuk clustering dengan 3 atribut jumlah cluster yang memiliki nilai fitnes terbaik/jumlah cluster yang paling optimal berdasarkan indeks validitas CE dan MPC yaitu adalah 2 cluster. Cluster yang memiliki karakteristik terbaik adalah cluster ke 1 yang memiliki anggota sebanyak 403 orang atau jika dihitung dari total keseluruhan alumni (526 orang) maka persentasenya akan menjadi : persentase(%) = x 100 = 76,62% dari total keseluruhan alumni. Karakteristik cluster terbaik ditentukan dengan melihat nilai titik pusat cluster untuk atribut IPK yang paling besar, nilai titik pusat cluster untuk atribut masa studi yang lebih kecil dan nilai titik pusat cluster untuk atribut masa TA yang lebih kecil. Jadi jumlah alumni yang termasuk dalam cluster 1 yaitu cluster dengan karakteristik terbaik jumlahnya sangat banyak yaitu 76,62% dari total keseluruhan alumni Clustering Data Alumni dengan Empat Atribut Hasil proses clustering data alumni dengan empat atribut dan jumlah cluster 2 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 10, dengan nilai fungsi objektif

77 61 Gambar Hasil Clustering Menggunakan FCM 4 Atribut dengan 2 Cluster Pada clustering dengan jumlah atribut 4, hasil persebaran cluster tidak bisa ditampilkan dalam bentuk grafik karena tidak mungkin menampilkan grafik dalam format empat dimensi. Jadi informasi yang ditampilkan yaitu angoota cluster dan titik pusat cluster. Tabel 4.14 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster. No Cluster Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 2) Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) Titik Pusat Cluster (Masa TA) Titik Pusat Cluster (B Kerja) ,1879 8,9535 6, , ,2145 8,7390 6, ,1770

78 62 Hasil proses clustering data alumni dengan empat atribut dan jumlah cluster 3 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 9, dengan nilai fungsi objektif Gambar Hasil Clustering Menggunakan FCM 4 Atribut dengan 3 Cluster Tabel 4.15 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster. No Cluster Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 3) Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) Titik Pusat Cluster (Masa TA) Titik Pusat Cluster (B Kerja) ,2164 8,7212 6, , , ,1467 9, , ,1964 8,8766 6, ,0066

79 63 Hasil proses clustering data alumni dengan empat atribut dan jumlah cluster 4 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 16, dengan nilai fungsi objektif Gambar Hasil Clustering Menggunakan FCM 4 Atribut dengan 4 Cluster Tabel 4.16 menunjukkan koordinat titik pusat setiap cluster yang terbentuk dari proses clustering dan jumlah anggota tiap cluster. No Cluster Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 4) Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) Titik Pusat Cluster (Masa TA) Titik Pusat Cluster (B Kerja) , ,1426 8, , ,2390 8,4512 4, , ,1967 8,8738 6, , ,1617 9, , ,4638

80 64 Hasil proses clustering data alumni dengan empat atribut dan jumlah cluster 5 menggunakan algoritma FCM ditunjukkan pada Gambar Proses clustering dihentikan pada iterasi ke 17, dengan nilai fungsi objektif Gambar Hasil Clustering Menggunakan FCM 4 Atribut dengan 5 Cluster No Cluster Tabel Koordinat Titik Pusat Cluster (Jumlah Cluster = 5) Jumlah anggota Titik Pusat Cluster (IPK) Titik Pusat Cluster (Masa Studi) Titik Pusat Cluster (Masa TA) Titik Pusat Cluster (B Kerja) Analisis Cluster dengan Empat Atribut Dari proses clustering yang telah dilakukan terhadap data alumni dengan 4 buah atribut (IPK, masa studi, masa TA dan bidang kerja), ada beberapa hal yang

81 65 dapat dianalisis. Untuk menentukan jumlah cluster yang memiliki nilai fitness terbaik digunakan indeks pengukuran validitas Modified Partition Coeficient (MPC) dan Classification Entropy (CE). Tabel 4.20 menunjukkan nilai nilai indeks MPC dan CE untuk setiap jumlah cluster yang diujikan pada algoritma Fuzzy C- Means (FCM). Tabel Indek MPC dan CE pada Algoritma FCM Jumlah Cluster Indeks CE Indeks MPC Dari tabel 4.20 dapat dilihat bahwa nilai indeks CE yang terkecil berada pada proses clustering dengan jumlah cluster = 2. Untuk nilai indeks MPC pada tabel 4.20 nilai terbesar berasa pada proses clustering dengan jumlah cluster 2. Sehingga berdasarkan indeks CE dan indeks MPC, jumlah cluster yang paling optimal untuk data alumni dengan 4 buah atribut (IPK, masa sudi, masa TA dan bidang kerja) adalah 2 cluster. Berdasarkan tabel 4.14 (Koordinat titik pusat cluster) dapat disimpulkan beberapa hal yaitu : pada cluster 1 yang jumlah anggotanya 169 orang memiliki rata-rata IPK 3,1879, masa studi rata-rata 8,9535 semester, masa pengerjaan TA rata-rata 6,7836 bulan dan berkerja kurang sesuai dengan bidang studi. pada cluster 2 yang jumlah anggotanya 357 orang memiliki rata-rata IPK 3,2145, masa studi rata-rata 8,7390 semester, masa pengerjaan TA rata-rata 6,5708 semester dan berkerja sesuai dengan bidang studi. Jadi untuk clustering dengan 4 atribut jumlah cluster yang memiliki nilai fitnes terbaik/jumlah cluster yang paling optimal berdasarkan indeks validitas CE dan MPC yaitu adalah 2 cluster. Cluster yang memiliki karakteristik terbaik adalah cluster ke 2 yang jumlah anggotanya 357 orang atau jika dihitung dari total keseluruhan alumni (526 orang) maka persentasenya akan menjadi : persentase(%) = x 100 = 67,87% dari total keseluruhan alumni. Jadi jumlah

82 66 alumni yang termasuk dalam cluster ke 2 yaitu cluster dengan karakteristik terbaik jumlahnya sangat banyak yaitu 76,62% dari total keseluruhan alumni Pengujian Black Box Testing Pengujian black box pada Sistem Informasi Geografis Pemetaan Persebaran Alumni dengan Analisa Clustering bertujuan untuk menemukan kesalahan fungsi pada program. Pengujian dilakukan dengan cara memasukkan input tertentu dan melihat hasil yang didapat dari input tersebut. Pengujian black box, yang diuji adalah masukan serta keluarannya. Pengujian dilakukan dengan cara memberi input atau masukan dari pengguna terhadap sistem yang sudah berjalan dan mengamati hasil output dari sistem. Pengujian tersebut akan dilakukan untuk mengetahui kesesuaian fungsi dari perangkat lunak. Berikut ini merupakan salah satu contoh langkah pengujian black box, pengujian yang ingin dilakukan yaitu pengujian pada tampilan awal, pengujian pada fasilitas pencarian berdasarkan kecamatan, pengujian memunculkan data alumni di wilayah kecamatan tertentu dan pengujian memunculkan data detail alumni. 1. Pengujian tampilan awal Gambar Pengujian Tampilan Awal

83 67 Pada pengujian ini output yang ingin dihasilkan yaitu tampilan posisi menu, peta dan posisi penanda alumni. Dilihat dari gambar 4.24 maka hasil pengujian menunjukkan bahwa sudah sesuai dengan yang dirancang. 2. Pengujian Fasilitas Pencarian Pada pengujian ini yang akan diuji adalah fasilitas pencarian yang ada yaitu : pencarian berdasarkan kecamatan, pencarian berdasarkan angkatan dan pencarian berdasarkan cluster. Gambar Pengujian Fasilitas Pencarian Pada gamber 4.25 merupakan salah satu skenario pengujian fasilitas pencarian berdasarkan kecamatan. Hasil pengujian menunjukkan bahwa antara input pencarian dan output yang diharapkan sudah sesuai dengan yang dirancang. 3. Pengujian memunculkan data alumni di wilayah tertentu Pada pengujian ini yang akan diujikan yaitu memunculkan data alumni pada kecamatan tertentu dilakukan dengan cara mengklik salah satu marker yang terdapat di peta.

84 68 Gambar Pengujian Menampilkan Data Alumni Gambar 4.25 merupakan salah satu tampilan pengujian menampilkan data alumni. Hasil pengujian menunjukkan bahwa antara input pencarian dan output yang diharapkan sudah sesuai dengan yang dirancang. 4. Pengujian memunculkan data detail alumni Pada pengujian ini output yang diharapkan yaitu pada saat diklik salah satu data alumni maka akan muncul data detail alumni yang bersangkutan. Apakah data yang muncul merupakan data yang sesuai atau bukan. Gambar Pengujian Menampilkan Data Detail Alumni

OPTIMASI JUMLAH HIDDEN NODES EXTREME LEARNING MACHINE MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION UNTUK PERAMALAN JUMLAH PENJUALAN BARANG

OPTIMASI JUMLAH HIDDEN NODES EXTREME LEARNING MACHINE MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION UNTUK PERAMALAN JUMLAH PENJUALAN BARANG OPTIMASI JUMLAH HIDDEN NODES EXTREME LEARNING MACHINE MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION UNTUK PERAMALAN JUMLAH PENJUALAN BARANG Tesis untuk Memperoleh Gelar Magister pada Program Magister,

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Sistem Pendukung Keputusan Sebuah aplikasi berupa Sistem Pendukung Keputusan (Decision Support System) mulai dikembangkan pada tahun 1970. Decision Support Sistem (DSS) dengan

Lebih terperinci

RANCANG BANGUN SISTEM OPINION MINING DENGAN METODE POS TAGGING

RANCANG BANGUN SISTEM OPINION MINING DENGAN METODE POS TAGGING TESIS RANCANG BANGUN SISTEM OPINION MINING DENGAN METODE POS TAGGING DAN SUPPORT VECTOR MACHINE UNTUK EKSTRAKSI DATA OPINI PUBLIK PADA LAYANAN JAMINAN KESEHATAN BALI MANDARA LUH RIA ATMARANI 1491761020

Lebih terperinci

CLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN

CLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN CLUSTERING KARYAWAN BERDASARKAN KINERJA DENGAN MENGGUNAKAN LOGIKA FUZZY C-MEAN Fitri Wulandari, Rinto Setiawan Jurusan Teknik Informatika Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif

Lebih terperinci

1. PENDAHULUAN. Kata Kunci: Data Mining, Clustering, Fuzzy C-Means

1. PENDAHULUAN. Kata Kunci: Data Mining, Clustering, Fuzzy C-Means CLUSTERING BIDANG PEKERJAAN BERDASARKAN PEMETAAN MATA KULIAH MENGGUNAKAN ALGORITMA FUZZY C-MEANS PADA FAKULTAS ILMU KOMPUTER UNIVERSITAS DIAN NUSWANTORO SEMARANG Taufiq Ramadhan Ashari 1, Ruri Suko Basuki

Lebih terperinci

CLUSTERING LULUSAN MAHASISWA MATEMATIKA FMIPA UNTAN PONTIANAK MENGGUNAKAN ALGORITMA FUZZY C-MEANS

CLUSTERING LULUSAN MAHASISWA MATEMATIKA FMIPA UNTAN PONTIANAK MENGGUNAKAN ALGORITMA FUZZY C-MEANS Buletin Ilmiah Mat. Stat. Dan Terapannya (Bimaster) Volume 02, No.1(2013), hal. 21-26 CLUSTERING LULUSAN MAHASISWA MATEMATIKA FMIPA UNTAN PONTIANAK MENGGUNAKAN ALGORITMA FUZZY C-MEANS Cary Lineker Simbolon,

Lebih terperinci

BAB 2 PENELITIAN TERKAIT DAN LANDASAN TEORI

BAB 2 PENELITIAN TERKAIT DAN LANDASAN TEORI BAB 2 PENELITIAN TERKAIT DAN LANDASAN TEORI 2.1 Penelitian Terkait Ada beberapa penelitian terkait dengan penggunaan Data Mining metode cluster dengan menggunakan Algoritma Fuzzy C-Means untuk dapat mengelompokkan

Lebih terperinci

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS WULAN ANGGRAENI wulangussetiyo@gmail.com Program Studi Pendidikan Matematika Universitas Indraprasta PGRI Abstract. The purpose of this study was to

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 State of the Art Penelitian mengenai segmentasi pasar pada sebuah perusahaan telah banyak digunakan dengan tujuan untuk mengetahui strategi pasar yang baik dan dapat menguntungkan

Lebih terperinci

Data Mining dengan Algoritma Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata

Data Mining dengan Algoritma Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata Data Mining dengan Algoritma Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata Cakra Ramadhana 1, Yohana Dewi Lulu W 2, Kartina Diah K. W. 3 1,2 Program Studi Sistem Informasi, Politeknik

Lebih terperinci

Student Clustering Based on Academic Using K-Means Algoritms

Student Clustering Based on Academic Using K-Means Algoritms Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com

Lebih terperinci

PENGENALAN AKSARA BALI MENGGUNAKAN METODE ZONING DAN KNN

PENGENALAN AKSARA BALI MENGGUNAKAN METODE ZONING DAN KNN TESIS PENGENALAN AKSARA BALI MENGGUNAKAN METODE ZONING DAN KNN I WAYAN AGUS SURYA DARMA PROGRAM PASCASARJANA UNIVERSITAS UDAYANA DENPASAR 2015 TESIS PENGENALAN AKSARA BALI MENGGUNAKAN METODE ZONING DAN

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data 3.1.1 Sumber Data Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. 1. Data primer Didapatkan peneliti secara langsung

Lebih terperinci

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perpustakaan merupakan tempat dimana seseorang mendapatkan pengetahuan, informasi atau hiburan dengan jumlah kategori yang bervarian seperti ilmiah, non fiksi, komedi,

Lebih terperinci

Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa

Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Pemanfaatan Algoritma FCM Dalam Pengelompokan Kinerja Akademik Mahasiswa Aidina Ristyawan 1), Kusrini 2), Andi Sunyoto

Lebih terperinci

TESIS EVALUASI LAYANAN BROADBAND CAMPUS DENGAN MENGGUNAKAN FRAMEWORK COBIT 4.1 DAN ITIL 3.0 FAJAR TRI PRABOWO

TESIS EVALUASI LAYANAN BROADBAND CAMPUS DENGAN MENGGUNAKAN FRAMEWORK COBIT 4.1 DAN ITIL 3.0 FAJAR TRI PRABOWO TESIS EVALUASI LAYANAN BROADBAND CAMPUS DENGAN MENGGUNAKAN FRAMEWORK COBIT 4.1 DAN ITIL 3.0 FAJAR TRI PRABOWO PROGRAM PASCASARJANA UNIVERSITAS UDAYANA DENPASAR 2016 TESIS EVALUASI LAYANAN BROADBAND CAMPUS

Lebih terperinci

UCAPAN TERIMAKASIH. Denpasar, Agustus Penulis

UCAPAN TERIMAKASIH. Denpasar, Agustus Penulis UCAPAN TERIMAKASIH Segenap puja dan puji syukur penulis panjatkan kehadapan Ida Sang Hyang Widhi Wasa sebagai sumber dari segala sumber pengetahuan, karena atas asung kertha wara nugrahanya Tesis yang

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Memahami definisi, proses serta teknik data mining. Pengenalan

Lebih terperinci

BABI PENDAHULUAN. 1.1 Latar Belakang

BABI PENDAHULUAN. 1.1 Latar Belakang BABI PENDAHULUAN 1.1 Latar Belakang Setiap perusahaan dituntut untuk siap menghadapi persaingan yang semakin ketat dengan perusahaan lain. Makin intensifnya persaingan yang dihadapi, telah menyebabkan

Lebih terperinci

TESIS IMPLEMENTASI ALGORITMA GENETIK DAN METODE FUZZY C-MEANS DALAM PENENTUAN KOMPETENSI MAHASISWA OLEH: ROSALIA HADI

TESIS IMPLEMENTASI ALGORITMA GENETIK DAN METODE FUZZY C-MEANS DALAM PENENTUAN KOMPETENSI MAHASISWA OLEH: ROSALIA HADI TESIS IMPLEMENTASI ALGORITMA GENETIK DAN METODE FUZZY C-MEANS DALAM PENENTUAN KOMPETENSI MAHASISWA OLEH: ROSALIA HADI PROGRAM PASCASARJANA UNIVERSITAS UDAYANA DENPASAR 2016 1 TESIS IMPLEMENTASI ALGORITMA

Lebih terperinci

PENGKLASIFIKASIAN LULUSAN JURUSAN TEKNIK ELEKTRO BERDASARKAN NILAI IPK DENGAN METODE FUZZY CLUSTERING. M. Rodhi Faiz

PENGKLASIFIKASIAN LULUSAN JURUSAN TEKNIK ELEKTRO BERDASARKAN NILAI IPK DENGAN METODE FUZZY CLUSTERING. M. Rodhi Faiz Rodhi Faiz, Pengklasifikasian Lulusan Jurusan Teknik Elektro Berdasarkan Nilai Ipk Dengan Metode Fuzzy Clustering PENGKLASIFIKASIAN LULUSAN JURUSAN TEKNIK ELEKTRO BERDASARKAN NILAI IPK DENGAN METODE FUZZY

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Gede Aditra

Lebih terperinci

SEGMENTASI PELANGGAN MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION DAN K-MEANS

SEGMENTASI PELANGGAN MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION DAN K-MEANS SEGMENTASI PELANGGAN MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION DAN K-MEANS TUGAS AKHIR Diajukan guna memenuhi sebagian persyaratan dalam rangka menyelesaikan Pendidikan Sarjana Strata Satu (S1) Program

Lebih terperinci

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop) 157 Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop) Elly Muningsih AMIK BSI Yogyakarta E-Mail : elly.emh@bsi.ac.id Abstrak Berkembangnya

Lebih terperinci

Ahmad Mauliyadi M, Hizir Sofyan, dan Muhammad Subianto. Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Syiah Kuala

Ahmad Mauliyadi M, Hizir Sofyan, dan Muhammad Subianto. Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Syiah Kuala Tersedia di www.fmipa.unsyiah.ac.id Jurnal Matematika 00 (2013) 01 05 PERBANDINGAN METODE FUZZY C-MEANS (FCM) DAN FUZZY GUSTAFSON-KESSEL (FGK) MENGGUNAKAN DATA CITRA SATELIT QUICKBIRD (Studi Kasus Desa

Lebih terperinci

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN :

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN : Clustering Data Status Tugas Belajar Dan Ijin Belajar Menggunakan Metode Fuzzy C-Means (Studi Kasus : Di Lingkungan Pemerintah Provinsi Kalimantan Timur) Fevin Triyas Rantika 1, Indah Fitri Astuti, M.Cs

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

KLASIFIKASI SUPERVISED LEARNING PADA TEKS BAHASA BALI DENGAN METODE INFORMATION GAIN DAN NAIVE BAYES CLASSIFIER

KLASIFIKASI SUPERVISED LEARNING PADA TEKS BAHASA BALI DENGAN METODE INFORMATION GAIN DAN NAIVE BAYES CLASSIFIER TESIS KLASIFIKASI SUPERVISED LEARNING PADA TEKS BAHASA BALI DENGAN METODE INFORMATION GAIN DAN NAIVE BAYES CLASSIFIER IDA BAGUS GEDE WIDNYANA PUTRA NIM 1491761007 PROGRAM MAGISTER PROGRAM STUDI TEKNIK

Lebih terperinci

LAPORAN SKRIPSI PENERAPAN ALGORITMA FUZZY C_MEANS DALAM PENENTUAN BEASISWA. Oleh : ARI IRAWAN

LAPORAN SKRIPSI PENERAPAN ALGORITMA FUZZY C_MEANS DALAM PENENTUAN BEASISWA. Oleh : ARI IRAWAN LAPORAN SKRIPSI PENERAPAN ALGORITMA FUZZY C_MEANS DALAM PENENTUAN BEASISWA Oleh : ARI IRAWAN 2010-51-221 SKRIPSI DIAJUKAN SEBAGAI SALAH SATU SYARAT UNTUK MEMPEROLEH GELAR SARJANA KOMPUTER PROGRAM STUDI

Lebih terperinci

MENENTUKAN NILAI AKHIR KULIAH DENGAN FUZZY C-MEANS

MENENTUKAN NILAI AKHIR KULIAH DENGAN FUZZY C-MEANS MENENTUKAN NILAI AKHIR KULIAH DENGAN FUZZY C-MEANS Arwan Ahmad Khoiruddin, S.Kom. Staf Pengajar Jurusan Tekn Informata, Fakultas Teknologi Industri, Universitas Islam Indonesia arwan@fti.uii.ac.id ABSTRACT

Lebih terperinci

Perbandingan Metode K-Means Dengan Fuzzy C-Means Untuk Analisa Karakteristik Mahasiswa Berdasarkan Kunjungan Ke Perpustakaan

Perbandingan Metode K-Means Dengan Fuzzy C-Means Untuk Analisa Karakteristik Mahasiswa Berdasarkan Kunjungan Ke Perpustakaan TESIS Perbandingan Metode K-Means Dengan Fuzzy C-Means Untuk Analisa Karakteristik Mahasiswa Berdasarkan Kunjungan Ke Perpustakaan (Studi Kasus Sekolah Tinggi Agama Hindu Negeri Tampung Penyang Palangka

Lebih terperinci

Break Even Point Estimation Using Fuzzy Cluster(FCM)

Break Even Point Estimation Using Fuzzy Cluster(FCM) Break Even Point Estimation Using Fuzzy Cluster(FCM) Stefant Cristian, Kartina Diah Kusuma W, S.T., Dadang Syarif SS, S.Si, M.Sc. Politeknik Caltex Riau Jl. Umban Sari No. 1, Phone: 0761-53939, Fax: 0761-554224

Lebih terperinci

PEMODELAN PENGELOMPOKKAN PRESTASI DOSEN MENGGUNAKAN METODE FUZZY C-MEANS

PEMODELAN PENGELOMPOKKAN PRESTASI DOSEN MENGGUNAKAN METODE FUZZY C-MEANS PEMODELAN PENGELOMPOKKAN PRESTASI DOSEN MENGGUNAKAN METODE FUZZY C-MEANS Sri Redjeki Teknik Informatika STMIK AKAKOM Jl. Raya Janti No 143 Yogyakarta e-mail: dzeky@akakom.ac.id ABSTRAK Sebuah perguruan

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

Pemilihan Minat Topik Tugas Akhir Menggunakan Metode Fuzzy C-Means

Pemilihan Minat Topik Tugas Akhir Menggunakan Metode Fuzzy C-Means ISSN: 2089-3787 527 Pemilihan Minat Topik Tugas Akhir Menggunakan Metode Fuzzy C-Means Yulia Yudihartanti, Sudiyanur Hidayatullah STMIK Banjarbaru Jl. A. Yani Km. 33 Banjarbaru, 0511(4782881) e-mail: yuliaydh@yahoo.co.id,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Customer Relationship Management (CRM) CRM adalah perpaduan antara teori, metode, teknik, kompetensi dan software enterprise untuk mengembangkan jangka panjang perusahaan dengan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling

Lebih terperinci

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) Nur Wakhidah Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang Abstract Classification is the process of organizing

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Peminatan siswa SMA Negeri 8 Bandung dilakukan di kelas X SMA setelah tahap daftar ulang. Hal tersebut berdasarkan aturan kurikulum 2013 [11]. Peminatan merupakan hal

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

PENGKLASIFIKASIAN MAHASISWA JURUSAN TEKNIK ELEKTRO YANG MENGIKUTI MATA KULIAH RANGKAIAN LISTRIK DENGAN METODE FUZZY CLUSTERING. M.

PENGKLASIFIKASIAN MAHASISWA JURUSAN TEKNIK ELEKTRO YANG MENGIKUTI MATA KULIAH RANGKAIAN LISTRIK DENGAN METODE FUZZY CLUSTERING. M. Rodhi Faiz, Pengklasifikasian Mahasiswa Jurusan Teknik Elektro Yang Mengikuti Mata Kuliah Rangkaian Listrik Dengan Metode Fuzzy Clustering PENGKLASIFIKASIAN MAHASISWA JURUSAN TEKNIK ELEKTRO YANG MENGIKUTI

Lebih terperinci

Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni

Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni 1 Seleksi Atribut Menggunakan Information Gain Untuk Clustering Penduduk Miskin Dengan Validity Index Xie Beni Femi Dwi Astuti Program Studi Teknik Informatika STMIK AKAKOM femi@akakom.ac.id Abstrak -

Lebih terperinci

KLASIFIKASI USAHA KECIL DAN MENENGAH (UKM) SEKTOR INDUSTRI DENGAN METODE FUZZY C-MEANS CLUSTERING WILAYAH KOTA CILEGON

KLASIFIKASI USAHA KECIL DAN MENENGAH (UKM) SEKTOR INDUSTRI DENGAN METODE FUZZY C-MEANS CLUSTERING WILAYAH KOTA CILEGON Seminar Nasional IENACO 213 ISSN: 2337-39 KLASIFIKASI USAHA KECIL DAN MENENGAH (UKM) SEKTOR INDUSTRI DENGAN METODE FUZZY C-MEANS CLUSTERING WILAYAH KOTA CILEGON Ratna Ekawati 1),Nurul Yulis 2) 1) Jurusan

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya. BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan

Lebih terperinci

REKAYASA SISTEM PENGELOMPOKAN MUSIK TERHADAP SUASANA HATI DENGAN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR DAN K-MEANS

REKAYASA SISTEM PENGELOMPOKAN MUSIK TERHADAP SUASANA HATI DENGAN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR DAN K-MEANS TESIS REKAYASA SISTEM PENGELOMPOKAN MUSIK TERHADAP SUASANA HATI DENGAN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR DAN K-MEANS I GEDE HARSEMADI NIM 1191761015 PROGRAM PASCA SARJANA UNIVERSITAS UDAYANA DENPASAR

Lebih terperinci

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING Moh Ahsan Universitas Kanjuruhan Malang ahsan@unikama.ac.id ABSTRAK. Universitas Kanjuruhan Malang

Lebih terperinci

Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A Kel : A

Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A Kel : A Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A11.2011.06038 Kel : A11.4812 CRISP-DM CRISP - DM adalah metodologi data mining komprehensif dan Model proses untuk

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING DATA ANGGARAN PENDAPATAN BELANJA DAERAH DI KABUPATEN XYZ SKRIPSI Diajukan untuk memenuhi salah satu syarat memperoleh Gelar Sarjana pada Program Studi Sistem

Lebih terperinci

ANALISIS KELOMPOK DENGAN ALGORITMA FUZZY C-MEANS DAN GUSTAFSON KESSEL CLUSTERING PADA INDEKS LQ45

ANALISIS KELOMPOK DENGAN ALGORITMA FUZZY C-MEANS DAN GUSTAFSON KESSEL CLUSTERING PADA INDEKS LQ45 ANALISIS KELOMPOK DENGAN ALGORITMA FUZZY C-MEANS DAN GUSTAFSON KESSEL CLUSTERING PADA INDEKS LQ45 SKRIPSI Disusun oleh: LAILLY RAHMATIKA J2E009007 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : 56601 / Data Warehouse dan Data Mng Revisi 1 Satuan Kredit Semester : 3 sks Tgl revisi : 1 September 2014 Jml Jam kuliah

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan Berdasarkan Peraturan Pemerintah Nomor 37 tahun 2009, dosen merupakan pendidik profesional dan ilmuwan dengan tugas utama mentransformasikan, mengembangkan,

Lebih terperinci

Segmentasi Pelanggan Menggunakan Metode Fuzzy C-Means dan Fuzzy Recency Frequency Monetary pada Perusahaan Furniture TUGAS AKHIR

Segmentasi Pelanggan Menggunakan Metode Fuzzy C-Means dan Fuzzy Recency Frequency Monetary pada Perusahaan Furniture TUGAS AKHIR Segmentasi Pelanggan Menggunakan Metode Fuzzy C-Means dan Fuzzy Recency Frequency Monetary pada Perusahaan Furniture TUGAS AKHIR Diajukan Guna Memenuhi Sebagian Persyaratan Dalam Rangka Menyelesaikan Pendidikan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

LAPORAN SKRIPSI SISTEM PENDUKUNG KEPUTUSAN UNTUK MENENTUKAN LOKASI MEBEL DAN PEMETAAN SIG DI KABUPATEN JEPARA

LAPORAN SKRIPSI SISTEM PENDUKUNG KEPUTUSAN UNTUK MENENTUKAN LOKASI MEBEL DAN PEMETAAN SIG DI KABUPATEN JEPARA LAPORAN SKRIPSI SISTEM PENDUKUNG KEPUTUSAN UNTUK MENENTUKAN LOKASI MEBEL DAN PEMETAAN SIG DI KABUPATEN JEPARA ABDUL GHOFUR NIM. 2012-51-146 DOSEN PEMBIMBING Rizkysari Meimaharani, M.Kom Ratih Nindya Sari,

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : D22.5411 / Healthcare Datamng Revisi 1 Satuan Kredit Semester : 2 sks Tgl revisi : 1 Agustus 2014 Jml Jam kuliah dalam seminggu

Lebih terperinci

IMPLEMENTASI PENGENALAN POLA UNTUK MENGEVALUASI HASIL PEMBELAJARAN DENGAN METODE FUZZY C-MEANS

IMPLEMENTASI PENGENALAN POLA UNTUK MENGEVALUASI HASIL PEMBELAJARAN DENGAN METODE FUZZY C-MEANS SYSTEMIC Vol. 02, No. 02, Desember 2016, 23-28 IMPLEMENTASI PENGENALAN POLA UNTUK MENGEVALUASI HASIL PEMBELAJARAN DENGAN METODE FUZZY C-MEANS Ilham Program Studi Sistem Informasi, Jurusan Teknologi, Fakultas

Lebih terperinci

LAPORAN SKRIPSI EKSTRAKSI CIRI PENGENALAN GENDER MENGGUNAKAN FITUR GEOMETRIS CITRA WAJAH DENGAN METODE FUZZY C-MEANS (FCM)

LAPORAN SKRIPSI EKSTRAKSI CIRI PENGENALAN GENDER MENGGUNAKAN FITUR GEOMETRIS CITRA WAJAH DENGAN METODE FUZZY C-MEANS (FCM) LAPORAN SKRIPSI EKSTRAKSI CIRI PENGENALAN GENDER MENGGUNAKAN FITUR GEOMETRIS CITRA WAJAH DENGAN METODE FUZZY C-MEANS (FCM) Oleh : NIHAYATUS SA ADAH 2010-51-206 SKRIPSI DIAJUKAN SEBAGAI SALAH SATU SYARAT

Lebih terperinci

TESIS PENERAPAN KOMBINASI FUZZY C-MEANS

TESIS PENERAPAN KOMBINASI FUZZY C-MEANS TESIS PENERAPAN KOMBINASI FUZZY C-MEANS DAN ELECTRE (ELLIMINATION AND CHOICE TRANSLATION REALITY) UNTUK SISTEM PENDUKUNG KEPUTUSAN PENENTUAN BESAR UANG KULIAH TUNGGAL MAHASISWA BARU ARIYADY KURNIAWAN MUCHSIN

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perguruan tinggi merupakan strata terakhir sebelum mahasiswa dapat bersaing didalam dunia kerja. Agar mampu bersaing didalam dunia kerja, mahasiswa dituntut

Lebih terperinci

HALAMAN SAMPUL SKRIPSI PENGENALAN POLA TELAPAK TANGAN DENGAN MENGGUNAKAN ALGORITMA BACK PROPAGATION NEURAL NETWORK

HALAMAN SAMPUL SKRIPSI PENGENALAN POLA TELAPAK TANGAN DENGAN MENGGUNAKAN ALGORITMA BACK PROPAGATION NEURAL NETWORK HALAMAN SAMPUL SKRIPSI PENGENALAN POLA TELAPAK TANGAN DENGAN MENGGUNAKAN ALGORITMA BACK PROPAGATION NEURAL NETWORK Oleh: MOH SHOCHWIL WIDAT 2011-51-034 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Tinjauan Studi Sebelum penelitian ini dilakukan, sudah terdapat beberapa penelitian yang menjadi dasar untuk menyelesaikan penelitian ini, penelitian tersebut diantaranya sebagai

Lebih terperinci

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi IJCCS, Vol.x, No.x, July xxxx, pp. 1~5 ISSN: 1978-1520 39 Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi Irwan

Lebih terperinci

BAB 1 PENDAHULUAN. Dengan kemajuan teknologi informasi sekarang ini, kebutuhan akan

BAB 1 PENDAHULUAN. Dengan kemajuan teknologi informasi sekarang ini, kebutuhan akan BAB 1 PENDAHULUAN A. Latar Belakang Dengan kemajuan teknologi informasi sekarang ini, kebutuhan akan informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari. Namun kebutuhan informasi yang

Lebih terperinci

APLIKASI DATA MINING UNTUK ANALISIS ASOSIASI POLA PEMBELIAN DENGAN ALGORITMA APRIORI

APLIKASI DATA MINING UNTUK ANALISIS ASOSIASI POLA PEMBELIAN DENGAN ALGORITMA APRIORI APLIKASI DATA MINING UNTUK ANALISIS ASOSIASI POLA PEMBELIAN DENGAN ALGORITMA APRIORI SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu Komputer/ Informatika

Lebih terperinci

SKRIPSI KLASIFIKASI CALON PEGAWAI DENGAN MENGGUNAKAN METODE K-MEANS CLASSIFICATION OF PROSPECTIVE EMPLOYEES BY USING THE K-MEANS METHOD

SKRIPSI KLASIFIKASI CALON PEGAWAI DENGAN MENGGUNAKAN METODE K-MEANS CLASSIFICATION OF PROSPECTIVE EMPLOYEES BY USING THE K-MEANS METHOD SKRIPSI KLASIFIKASI CALON PEGAWAI DENGAN MENGGUNAKAN METODE K-MEANS CLASSIFICATION OF PROSPECTIVE EMPLOYEES BY USING THE K-MEANS METHOD DONY ENDRIYONO 135610017 PROGRAM STUDI SISTEM INFORMASI SEKOLAH TINGGI

Lebih terperinci

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database 2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma

Lebih terperinci

BAB I PENDAHULUAN. informasi telah menjadi kebutuhan yang cukup penting dalam kehidupan manusia.

BAB I PENDAHULUAN. informasi telah menjadi kebutuhan yang cukup penting dalam kehidupan manusia. BAB I PENDAHULUAN 1.1 Latar Belakang Kebutuhan manusia akan informasi memacu pesatnya perkembangan teknologi di bidang informasi. Kemajuan teknologi yang semakin meningkat didukung dengan sarana dan prasarana

Lebih terperinci

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) Meriska Defriani 1, Noviyanti 2 1 STT Wastukancana 2 Teknik Informatika,

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI

Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI Analisis Data Mining Untuk Menentukan Daerah Keluarga Sejahtera Di Kecamatan Balong Dengan Metode Algoritma K-MEANS Clustering SKRIPSI Diajukan Sebagai Salah satu Syarat Untuk Memperoleh Gelar Sarjana

Lebih terperinci

PENERAPAN ALGORITMA FUZZY C-MEANS (FCM) PADA PENENTUAN LOKASI PENDIRIAN LOKET PEMBAYARAN AIR PDAM SALATIGA

PENERAPAN ALGORITMA FUZZY C-MEANS (FCM) PADA PENENTUAN LOKASI PENDIRIAN LOKET PEMBAYARAN AIR PDAM SALATIGA PENERAPAN ALGORITMA FUZZY C-MEANS (FCM) PADA PENENTUAN LOKASI PENDIRIAN LOKET PEMBAYARAN AIR PDAM SALATIGA Trevi Meri Andriyani 1, Lilik Linawati 2, Adi Setiawan 3 1 Mahasiswa Program Studi Matematika

Lebih terperinci

PERBANDINGAN METODE PEMULUSAN EKSPONENSIAL TUNGGAL DAN FUZZY TIME SERIES UNTUK MEMPREDIKSI INDEKS HARGA SAHAM GABUNGAN

PERBANDINGAN METODE PEMULUSAN EKSPONENSIAL TUNGGAL DAN FUZZY TIME SERIES UNTUK MEMPREDIKSI INDEKS HARGA SAHAM GABUNGAN PERBANDINGAN METODE PEMULUSAN EKSPONENSIAL TUNGGAL DAN FUZZY TIME SERIES UNTUK MEMPREDIKSI INDEKS HARGA SAHAM GABUNGAN SKRIPSI Oleh : TAUFAN FAHMI J2E008056 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA

Lebih terperinci

SISTEM INFORMASI GEOGRAFIS PEMETAAN JALAN DESA BERBASIS MOBILE ANDROID

SISTEM INFORMASI GEOGRAFIS PEMETAAN JALAN DESA BERBASIS MOBILE ANDROID SISTEM INFORMASI GEOGRAFIS PEMETAAN JALAN DESA BERBASIS MOBILE ANDROID TUGAS AKHIR Diajukan guna memenuhi sebagian persyaratan dalam rangka menyelesaikan Pendidikan Sarjana Strata Satu (S1) Program Studi

Lebih terperinci

ANALISIS CLUSTER DENGAN ALGORITMA K-MEANS DAN FUZZY C-MEANS CLUSTERING UNTUK PENGELOMPOKAN DATA OBLIGASI KORPORASI

ANALISIS CLUSTER DENGAN ALGORITMA K-MEANS DAN FUZZY C-MEANS CLUSTERING UNTUK PENGELOMPOKAN DATA OBLIGASI KORPORASI ANALISIS CLUSTER DENGAN ALGORITMA K-MEANS DAN FUZZY C-MEANS CLUSTERING UNTUK PENGELOMPOKAN DATA OBLIGASI KORPORASI SKRIPSI Disusun Oleh : DESY RAHMAWATI NINGRAT 24010212120009 DEPARTEMEN STATISTIKA FAKULTAS

Lebih terperinci

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Perkembangan teknologi informasi telah mampu mengubah persepsi manusia terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

Lebih terperinci

KLUSTERING BERBASIS PROTOTIPE DENGAN METODE FUZZY C-MEANS

KLUSTERING BERBASIS PROTOTIPE DENGAN METODE FUZZY C-MEANS JURNAL LOGIC. VOL.15. NO.1 MARET 015 51 KLUSTERING BERBASIS PROTOTIPE DENGAN METODE FUZZY C-MEANS Putu Manik Prihatini Jurusan Teknik Elektro, Politeknik Negeri Bali Bukit Jimbaran, P.O.Box 1064 Tuban

Lebih terperinci

LAPORAN SKRIPSI PENENTUAN MULTIPLE INTELEGENCE DENGAN ALGORITMA FUZZY C-MEANS. Oleh : NINIK RAHAYU

LAPORAN SKRIPSI PENENTUAN MULTIPLE INTELEGENCE DENGAN ALGORITMA FUZZY C-MEANS. Oleh : NINIK RAHAYU LAPORAN SKRIPSI PENENTUAN MULTIPLE INTELEGENCE DENGAN ALGORITMA FUZZY C-MEANS Oleh : NINIK RAHAYU 2010-51-182 SKRIPSI DIAJUKAN SEBAGAI SALAH SATU SYARAT UNTUK MEMPEROLEH GELAR SARJANA KOMPUTER PROGRAM

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

APLIKASI GEOGRAFIS PEMETAAN KUNJUNGAN WISATAWAN BERBASIS WEB DAN PERAMALAN KUNJUNGAN WISATAWAN MENGGUNAKAN METODE LEAST SQUARE

APLIKASI GEOGRAFIS PEMETAAN KUNJUNGAN WISATAWAN BERBASIS WEB DAN PERAMALAN KUNJUNGAN WISATAWAN MENGGUNAKAN METODE LEAST SQUARE APLIKASI GEOGRAFIS PEMETAAN KUNJUNGAN WISATAWAN BERBASIS WEB DAN PERAMALAN KUNJUNGAN WISATAWAN MENGGUNAKAN METODE LEAST SQUARE TUGAS AKHIR Diajukan guna memenuhi sebagian persyaratan dalam rangka menyelesaikan

Lebih terperinci

Analisa Data Mahasiswa Baru Terhadap Program Studi Yang. Dipilih Di Universitas Pembangunan Nasional Veteran Jawa

Analisa Data Mahasiswa Baru Terhadap Program Studi Yang. Dipilih Di Universitas Pembangunan Nasional Veteran Jawa Analisa Data Mahasiswa Baru Terhadap Program Studi Yang Dipilih Di Universitas Pembangunan Nasional Veteran Jawa Timur Menggunakan Teknik Data Mining SKRIPSI Disusun Oleh : Citra Arum Sari 1032010048 JURUSAN

Lebih terperinci

PERBEDAAN PENGARUH MODEL JIGSAW

PERBEDAAN PENGARUH MODEL JIGSAW PERBEDAAN PENGARUH MODEL JIGSAW DAN PROBLEM-BASED LEARNING (PBL) TERHADAP PRESTASI BELAJAR DITINJAU DARI MOTIVASI BELAJAR SISWA PADA MATA PELAJARAN BIOLOGI KELAS X SMA DI PURWODADI GROBOGAN Tesis Untuk

Lebih terperinci

IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR

IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR RIZKY NOVRIYEDI PUTRA 1132001001 PROGRAM STUDI INFORMATIKA FAKULTAS TEKNIK DAN ILMU KOMPUTER UNIVERSITAS

Lebih terperinci

Break Even Point Estimation Using Fuzzy Cluster(FCM)

Break Even Point Estimation Using Fuzzy Cluster(FCM) SNTIKI III 2011 ISSN : 2085-9902 1 Break Even Point Estimation Using Fuzzy Cluster(FCM) Stefant Cristian, Kartina Diah Kusuma W, S.T., Dadang Syarif SS, S.Si, M.Sc. Politeknik Caltex Riau Jl. Umban Sari

Lebih terperinci

SEGMENTASI PELANGGAN PERUSAHAAN PERHOTELAN MENGGUNAKAN METODE CLUSTERING DBSCAN DAN MODEL RFM TUGAS AKHIR

SEGMENTASI PELANGGAN PERUSAHAAN PERHOTELAN MENGGUNAKAN METODE CLUSTERING DBSCAN DAN MODEL RFM TUGAS AKHIR SEGMENTASI PELANGGAN PERUSAHAAN PERHOTELAN MENGGUNAKAN METODE CLUSTERING DBSCAN DAN MODEL RFM TUGAS AKHIR Diajukan Guna Memenuhi Sebagian Persyaratan Dalam Rangka Menyelesaikan Pendidikan Sarjana Strata

Lebih terperinci

RANCANG BANGUN APLIKASI EXTRACT, TRANSFORM, DAN LOAD UNTUK DATA WAREHOUSE BERBASIS WEB

RANCANG BANGUN APLIKASI EXTRACT, TRANSFORM, DAN LOAD UNTUK DATA WAREHOUSE BERBASIS WEB i TUGAS AKHIR RANCANG BANGUN APLIKASI EXTRACT, TRANSFORM, DAN LOAD UNTUK DATA WAREHOUSE BERBASIS WEB I KADEK SASTRAWAN JURUSAN TEKNIK ELEKTRO FAKULTAS TEKNIK UNIVERSITAS UDAYANA JIMBARAN BALI 2015 ii TUGAS

Lebih terperinci

TEKNIK DATA MINING DAN DECISION SUPPORT SYSTEM UNTUK KEUNGGULAN BERSAING (Study Kasus Perusahaan TV Kabel )

TEKNIK DATA MINING DAN DECISION SUPPORT SYSTEM UNTUK KEUNGGULAN BERSAING (Study Kasus Perusahaan TV Kabel ) TEKNIK DATA MINING DAN DECISION SUPPORT SYSTEM UNTUK KEUNGGULAN BERSAING (Study Kasus Perusahaan TV Kabel ) Ahlihi Masruro 1) 1) Teknik Informatika STMIK AMIKOM Yogyakarta Jl. Ring Road Utara Condong Catur

Lebih terperinci

LAPORAN SKRIPSI DETEKSI JENIS KULIT WAJAH BERDASARKAN WARNA YCBCR DENGAN ALGORITMA FUZZY SUBTRACTIVE CLUSTERING

LAPORAN SKRIPSI DETEKSI JENIS KULIT WAJAH BERDASARKAN WARNA YCBCR DENGAN ALGORITMA FUZZY SUBTRACTIVE CLUSTERING i LAPORAN SKRIPSI DETEKSI JENIS KULIT WAJAH BERDASARKAN WARNA YCBCR DENGAN ALGORITMA FUZZY SUBTRACTIVE CLUSTERING Oleh : Hilda Ilcham Handayani 2010-51-191 SKRIPSI DIAJUKAN SEBAGAI SALAH SATU SYARAT UNTUK

Lebih terperinci