BAB I PENDAHULUAN Bab ini berisi pembahasan mengenai gambaran umum penelitian dalam analisis spasial clustering pada data mahasiswa Universitas Mercu Buana. Pembahasan diawali dengan penjelasan mengenai latar belakang penelitian. Pembahasan dilanjutkan dengan penjelasan mengenai permasalahan yang akan diselesaikan, dan penjelasan mengenai tujuan dan manfaat penelitian. Selanjutnya, dijelaskan mengenai ruang lingkup penelitian dan metodologi yang dilakukan dalam penelitian. Bagian akhir dari bab ini berisi pembahasan mengenai sistematika penulisan dalam penelitian yang dilakukan. 1.1. Latar Belakang Perkembangan jenis-jenis data mengakibatkan proses clustering semakin bervariasi sesuai dengan jenis data yang akan diproses. Jenis data yang menjadi perhatian dalam penelitian saat ini adalah data-data yang memiliki unsur-unsur spasial. Ditinjau dari jenis data, sumber data dapat dibedakan menjadi sumber data yang mengandung data spasial, sumber data yang mengandung data temporal dan sumber data yang mengandung data spasial dan data temporal (Zhang, 2008). Basis data spasial berisi data-data yang berhubungan dengan tempat, sebaik lokasi geografis, data citra medis, maupun data-data lain yang mengandung unsur ruang (Zhang, 2008). Data temporal berisi data-data kejadian yang mengandung unsur waktu (Zhang, 2008). Data-data tersebut biasanya disimpan ke dalam basis data secara berurut dan periodik. Dengan kemajuan teknologi informasi seperti saat ini, masyarakat disuguhkan dengan banyaknya informasi yang mudah diakses dengan media yang tersedia. Banyak kemajuan dari pengolahan data yang ada untuk mengambil sebuah informasi secara cepat dan efektif. Karena banyaknya data yang ada maka akan sulit dalam mengambil suatu kesimpulan atau informasi jika tidak ada cara pengolahan data yang lebih baik. Maka dari itu, digunakanlah data mining untuk 1
mengolah data yang begitu besar, dan mengambil informasi yang terdapat didalamnya. Banyak organisasi atau instansi menggunakan data yang digunakan untuk memutuskan sebuah penyelesaian dari suatu masalah. Mereka mengambil sebuah kesimpulan dari data yang mereka miliki, tidak terkecuali dengan instansi pendidikan yaitu Universitas Mercu Buana. Mereka mengguanakan data sebagai dasar dalam pengambil keputusan, terutama dalam menentukan startegi pemasaran. Sebuah strategi pemasaran harus efektif dalam pelaksanannya. Maka dari itu, dalam penelitian ini kita akan membahas penggunaan data mining yaitu algoritma spasial clustering untuk menentukan strategi pemasaran yang lebih baik. Algoritma yang digunakan dalam penelitian ini adalah DBSCAN dengan data yang digunakan adalah data mahasiswa di Universitas Mercu Buana. Dari data terebut kita akan melihat bagaimana sebaran peminatan mahasiswa berdasarkan asal sekolah serta alamat mereka tinggal. Dan bagaimana kita bisa mengambil informasi dari kumpulan data tersebut. 1.2. Rumusan Masalah Penelitian ini akan terfokus kepada penerapan algoritma spasial clustering pada data mahasiswa. Adapun permasalahan-permasalahan spesifik yang hendak diselesaikan sebagai berikut: a. Bagaimana menggunakan algoritma spasial clustering untuk memetakan cluster daerah asal mahasiswa. b. Bagaimana menerapkan algoritma clustering spasial yang efektif untuk data yang akan digunakan dalam penelitian. 2
1.3. Tujuan Penelitian Dalam penelitian ini terdapat beberapa tujuan diantaranya adalah sebagai berikut : a. Mencari informasi dari sebuah data yang besar dengan menggunakan algoritma spasial clustering. b. Mengambil kesimpulan mengenai hasil dari penerapan algoritma DBSCAN yang digunakan dalam pengujian. 1.4. Manfaat Penelitian Dalam penelitian ini memiliki beberapa manfaat diantaranya adalah sebagai berikut : a. Membantu sebuah instansi dalam mengambil kesimpulan dari sebuah informasi yang dibutuhkan. b. Mengetahui pengujian algoritma DBSCAN yang efektif dalam mencari informasi. 1.5. Batasan Masalah Terdapat beberapa batasan masalah yang diangkat sebagai parameter pengerjaan tugas akhir ini, yaitu : a. Data yang digunakan untuk pengujian dalam penelitian ini adalah data mahasiswa Universitas Mercu Buana di Jakarta, yang berfokus kepada analisa domisili asal mahasiswa. b. Algoritma spasial clustering yang digunakan dalam penelitian ini yaitu algoritma Density-based Spatial Clustering of Application with Noise (DBSCAN). c. Penelitian dilakukan di Universitas Mercu Buana. d. Aplikasi yang digunakan adalah MATLAB. e. Perangkat keras yang digunakan dalam penelitian ini adalah satu buah laptop dengan spesifikasi sebagai berikut: Processor : i3-2310m CPU @ 2.10GHz RAM : 2.00 GB 3
Tipe Sistem Kapasitas Memori Fisik : Sistem operasi 64-bit : 500 GB 1.6. Metodologi Penelitian Penelitian mengenai aplikasi algoritma spasial clustering dilakukan dengan metodologi sebagai berikut: a. Studi Literatur Studi literatur dilakukan untuk memelajari algoritma-algoritma clustering yang akan digunakan. Sumber literatur berasal dari jurnal-jurnal ilmiah terkait implementasi algoritma clustering, buku teks dan laporan skripsi yang relevan dengan topik penelitian. b. Metode Penelitian Metode penelitian dilakukan untuk membuat tahapan-tahapan pengerjaan dalam penelitian. c. Implementasi Metode Penelitian Implementasi dilakukan untuk mengimplementasikan setiap tahapan metode penelitian. d. Pengujian Pengujian dilakukan dengan cara mencoba data terhadap hasil implementasi. Pengujian dilakukan untuk menganalisis performa hasil implementasi. e. Validasi hasil pengujian Validasi hasil pengujian dilakukan untuk mengecek apakah hasil pengujian yang dilakukan sebelumnya sudah baik atau belum. Hal ini dilihat apakah hasil dari proses memiliki nilai validasi yang baik. Pada prosses ini juga mencari waktu proses program berjalan dan nilai rata-rata hasil validasi. 1.7. Sistematika Penulisan Sistematika penulisan laporan penelitian mengenai aplikasi algoritma spasial clustering terdiri dari enam bab, yaitu bab pendahuluan, bab landasan teori, bab metode penelitian, bab implementasi, bab pengujian dan validasi hasil serta bab kesimpulan dan saran. Bab pendahuluan secara umum membahas latar belakang 4
dan tujuan dilakukan penelitian. Adapun bagian-bagian dalam bab ini meliputi pembahasan mengenai latar belakang penelitian, permasalahan dan tujuan penelitian, ruang lingkup penelitian, metodologi penelitian dan sistematika penulisan. Bab landasan teori secara umum membahas algoritma-algoritma yang digunakan dalam penelitian spasial clustering, metode validasi dan visualisasi hasil clustering. Adapun bagian-bagian dalam bab landasan teori meliputi pembahasan mengenai spasial data mining secara umum, pembahasan algoritma Density-based Spatial Clustering of Application with Noise (DBSCAN). Bab metode penelitian secara umum membahas tahapan-tahapan yang dilakukan dalam penelitian mengenai aplikasi algoritma spasial clustering. Tahapan-tahapan tersebut meliputi tahapan pengumpulan data, tahapan analisis spasial clustering, tahapan validasi hasil clustering dan tahapan visualisasi hasil clustering. Sementara itu, bab implementasi membahas proses implementasi tahapan-tahapan tersebut dengan menggunakan MATLAB. Bab pengujian dan validasi secara umum membahas proses pengujian terhadap hasil implementasi. Pembahasan dalam bab ini meliputi pembahasan mengenai proses pengujian tahap Scatterplot, pembahasan proses pengujian spasial clustering, pembahasan proses pengujian validasi hasil clustering, dan hasil dari prosess pengujian dan validasi spasial clustering. Bab kesimpulan dan saran membahas mengenai kesimpulan-kesimpulan yang didapat dari hasil implementasi dan hasil pengujian. Selain itu, bab ini juga berisi saran-saran untuk penelitian berikutnya. 5