APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES MASUK DENGAN TINGKAT KELULUSAN MAHASISWA (Studi Kasus: STMIK AMIKOM YOGYAKARTA) JUDUL NASKAH PUBLIKASI diajukan oleh Faundry Amrul Ma ruf 09.11.2997 kepada SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER AMIKOM YOGYAKARTA 2013
PENGESAHAN NASKAH
DATA MINING APPLICATION PROCESS IN RELATION TO SEE WITH STUDENTS GRADUATION RATE (Case Study: STMIK AMIKOM Yogyakarta) APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES MASUK DENGAN TINGKAT KELULUSAN MAHASISWA (Studi Kasus: STMIK AMIKOM YOGYAKARTA) Faundry Amrul Ma ruf Kusrini Jurusan Teknik Informatika STMIK AMIKOM YOGYAKARTA ABSTRACT With the existence of many data accumulated explosive data growth has created conditions that have a lot of data but minimal information. mining is the discovery of new information by looking for certain patterns or rules of a number of large amounts of data to get a relationship that may provide a useful indication. By utilizing data from AMIKOM students are expected to know the relationship between the entrance to the graduation rate of students through the use of data mining methods. Categories in the measure of graduation rates and IPK student study duration. The algorithm used is algorithm a priori, so that once the data is in the process it will display information in the form of support and confidence values of each category graduation rates, and will also display some reports, the reports suggestions, generated tables and summary report. AMIKOM campus parties will be given the right advice and accurate in getting his students more potential entry and print quality graduates. Keywords: A Priori Algorithm, Mining, Relationship Processes in Student
1. Pendahuluan Pemanfaatan data yang ada dalam sistem informasi untuk menunjang kegiatan pengambilan keputusan tidak cukup hanya mengandalkan data operasional saja, diperlukan suatu analisis data untuk menggali potensi-potensi informasi yang ada. Jadi, proses pengubahan data menjadi informasi dan dari informasi yang ada akan diambil polanya agar menjadi pengetahuan. Dalam mengambil keputusan, kebanyakan mereka hanya memanfaatkan data yang sudah di miliki untuk menggali informasi yang berguna. Hal ini mendorong munculnya cabang ilmu baru untuk mengatasi masalah penggalian informasi atau pola yang penting atau menarik dari data dalam jumlah besar, yang disebut dengan data mining. Penggunaan metode data mining diharapkan dapat menemukan hubungan antara proses masuk dengan tingkat kelulusan yang sebelumnya tersembunyi didalam gudang data sehingga menjadi informasi yang berharga dan bermanfaat bagi kampus STMIK AMIKOM yogyakarta supaya dapat mengetahui tingkat kelulusan mahasiswanya dan faktor yang mempengaruhi tingkat kelulusan. Dengan adanya informasi tersebut akan dapat diketahui potensial masuk mahasiswanya melalui tes tertulis atau wawancara dengan melihat nilai support dan confidence. 2. Landasan Teori 2.1 warehouse warehouse adalah sebuah koleksi data yang mempunyai karakteristik subject-oriented, integrated, nonvolatile, dan time variant, yang dapat mendukung keputusan ditingkat manajemen suatu organisasi (Inmon, 2002). warehouse adalah sebuah sistem yang mengambil dan menggabungkan data secara periodik dari sistem sumber data ke penyimpanan data bentuk dimensional atau normal (Rainardi, 2008). warehouse adalah sebuah database analitis yang hanya dapat dibaca dan digunakan sebagai dasar untuk sebuah sistem pendukung keputusan (Poe, 1998). Jadi, warehouse merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda. Dalam perancangan database tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik. 2.2 Karakteristik Warehouse Seperti yang telah disebutkan diatas bahwa data warehouse mempunyai empat karakteristik (Inmon, 2002), yaitu:
1. Subject oriented 2. Integrated 3. Time variant 4. Nonvolatile 2.3 Pengertian mining mining juga disebut sebagai serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual. (Pramudiono, 2006). Karakteristik data mining sebagai berikut: 1. mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui sebelumnya. 2. mining merupakan suatu proses otomatis terhadap daya yang sudah ada. 3. yang akan diproses berupa daya yang sangat besar. data yang besar digunakan untuk membuat hasil lebih dipercaya. 4. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat. Penemuan pola merupakan keluaran lain dari data mining. misalnya sebuah perusahaan yang akan meningkatkan fasilitas kartu kredit dari pelanggan, maka perusahaan akan mencari pola dari pelanggan-pelanggan yang ada untuk mengetahui pelanggan yang potensial dan pelanggan yang tidak potensial (Kusrini,2009). 2.4 Tahap-Tahap Mining Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa tahap, tahap-tahap data mining yaitu: 1. selection 2. cleaning 3. Transformation 4. mining 5. Evaluation 2.5 Metode mining Banyak metode-metode yang dapat digunakan dalam proses data mining diantaranya yaitu decision tree, clustering dan association rules. tetapi disini penulis hanya membahas association rules.
a. Association rules Association rules (aturan asosiasi) atau affinity analysis (analisis afinitas) berkenaan dengan studi tentang apa bersama apa. Sebagai contoh dapat berupa berupa studi transaksi di supermarket, misal seorang konsumen membeli (roti, mentega) => (susu) dan mempunyai nilai support = 40%, confidence = 50%. Aturan tersebut berarti seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari transaksi selama ini (Kusrini, 2009). Karena awalnya berasal dari studi tentang database transaksi pelanggan untuk menentukan kebiasaan suatu produk dibeli bersama produk apa, maka aturan asosiasi juga sering dinamakan market basket analysis. Analisis asosiasi dikenal juga sebagai salah satu metode data mining yang menjadi dasar dari berbagai metode data mining lainnya. Khususnya salah satu tahap dari analisis asosiasi yang disebut analisis pola frekuensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien adalah analisis pola frekuensi tinggi. 3. ANALISIS DAN PERANCANGAN APLIKASI DATA MINING 3.1 Tinjauan Umum 3.2.1 Analisis lingkungan sistem Dalam pembangunan aplikasi data mining ini menggunakan jenis arsitektur dengan sumber data warehouse fungsional yaitu sebuah data warehouse yang mengambil data dari sistem operasional terdekat. tiap data warehouse fungsional melayani kelompok yang berbeda dan terpisah, area fungsional yang berbeda dan terpisah, unit geografis yang berbeda dan terpisah atau kelompok pemasaran produk yang berbeda dan terpisah. Karena data mining membutuhkan data dalam jumlah besar untuk itu diperlukan suatu data warehouse yang dapat menampung dan menyatukan dari keenam sumber data tersebut. Selain itu penggunaan data warehouse juga bertujuan agar data transaksional dalam keenam database sumber tidak terganggu.
mhs data_gelombang agama Warehouse jurusan Aplikasi Mining daft_wisuda calonsiswa Gambar 3.2 Analisis lingkungan sistem 3.3 Analisis Kebutuhan Sistem Kebutuhan fungsional merupakan kemampuan sistem untuk melakukan proses dan dapat menampilkan informasi apa saja. kebutuhan fungsional pada Aplikasi mining ini merujuk pada kebutuhan akan perancangan data mining, seperti yang tertera berikut ini : 1. Dapat menggabungkan data yang akan diproses mining dari data kelulusan dan data mahasiswa (diambil dari kekuatan) 2. Dapat membersihkan data-data yang tidak relevan serta atribut yang tidak dipakai (diambil dari kekuatan) 3. Dapat merubah data menjadi data yang siap diproses (diambil dari ancaman) 4. Dapat memproses data untuk dimining meliputi (diambil dari kelemahan dan peluang) a. Hubungan antara proses masuk dengan tingkat kelulusan. b. Hubungan antara asal sekolah dan proses masuk dengan tingkat kelulusan. c. Hubungan antara kota asal sekolah dengan tingkat kelulusan. d. Hubungan jurusan dengan tingkat kelulusan e. Hubungan dari semua atribut agar di dapat hasil yang lebih spesifik 5. Dapat menampilkan hasil proses mining dengan nilai support dan confidence (diambil dari kekuatan) 6. Menggunakan database sql server yang telah di ubah menjadi microsoft access sehingga lebih mudah dalam mengoperasikannya. (diambil dari ancaman) 7. Aplikasi inimampumelakukanpembuatanlaporan berupa laporan tabel hasil proses mining, laporan rangkuman, laporan saran.(diambil dari kelemahan)
3.2 Pemodelan Dalam aplikasi ini dibangun data warehouse yang digunakan untuk menampung data dari data mahasiswa dan data kelulusan mahasiswa. Tujuan utama pembangunan data warehouse adalah agar database sumber tidak terganggu bila terjadi error, selain itu data warehouse memudahkan dalam menyatukan data dari beberapa database sumber. Proses ETL (Ekstrak Transform Load) dalam pembangunan data warehouse merupakan proses yang penting karena menentukan pembangunan data warehouse selanjutnya. Pada pembangunan data warehouse ini, terdapat enam source system yaitu dari data mahasiswa, data agama, data jurusan, data data_gelombang, data calonsiswa dan data daft_wisuda. Proses pemuatan data dari data source ke data warehouse melalui proses ETL. Diagram Proses ETL dapat digambarkan seperti pada gambar 3.4 mhs data_gelomb ang agama Proses ETL Warehouse jurusan daft_w isuda calonsisw a 3.4 Gambar 3.4 Proses ETL 3.4.1 Pemodelan Fungsi Pemodelan fungsi digambarkan dengan Flowchart, DCD ( Context Diagram), DFD ( Flow Diagram) dan kamus data ( Dictionary).
1. Flowchart yang diusulkan mhs mulai calonsiswa Form Utama data_gelom bang Muat daft_wisuda Gabungan Muat jurusan Tabel Gabungan agama Bersihkan Bersihkan Tabel yang sudah bersih Prodi Atribut Threshold Proses Proses Mining Tabel Hasil Gabungan Laporan Rangkuman Laporan Saran Untuk Amikom Yes Proses lagi? No selesai Gambar 3.6 Flowchart
2. Diagram konteks DFD menggambarkan arus data dari suatu sistem informasi logika tanpa mempertimbangkan lingkungan fisik dimana dara tersebut berada. Berikut gambaran DFD dari sistem yang akan dibuat. Login Akses Gabungan Input Jurusan Input Atribut Input Threshold Admin Aplikasi Mining Untuk Mencari Hubungan Proses Masuk dengan Tingkat Kelulusan Verifikasi Login Admin Tampil Gabungan Hasil Proses Mining Laporan Mining Proses Masuk Laporan Mining Asal Sekolah Laporan Mining Kota Asal Laporan Mining Program Studi Laporan Rangkuman Laporan Saran Untuk Amikom Gambar 3.7 Diagram Context
Warehouse Cleaning Selection 3. DFD Level 1 Petugas Login Verifikasi Login Petugas Hasil data warehouse mhs data_gelombang Laporan Hasil Mining Program Studi Laporan Hasil Mining Kota Asal Laporan Hasil Mining Asal Sekolah Laporan Hasil Mining Proses Masuk Gabungan Gabungan Bersih integration Transformation mahasiswa, gelombang, kelulusan, jurusan, wisuda, agama, test masuk Gabungan dengan proses masuk Gabungan dengan Asal sekolah Gabungan dengan kota asal Gabungan dengan Jurusan Proses Import agama jurusan daft_wisuda calonsiswa Sistem Akademik Amikom Mining Proses Masuk Mining Asal Sekolah Mining Kota Asal Mining Jurusan Gambar 3.8 DFD Level 1
4. IMPLEMENTASI PROGRAM DAN PEMBAHASAN 4.1 Implementasi Dalam bab ini menjelaskan tentang implementasi dari perancangan data mining, implementasi rancangan antar muka, uji coba sistem, implementasi pengujian, manual program, serta manual instalasi. Selain itu juga terdapat pengujian Aplikasi mining dengan pengujian black box testing. 4.2 Pembahasan 4.2.1 Pembahasan Tampilan 4.2.1.1 Tampilan halaman login 4.2.1.2. Tampilan halaman utama Gambar 4.15 Tampilan halaman login Gambar 4.16 Tampilan Halaman Utama 4.2.1.3. Tampilan data gabungan Pada saat menu berkas di pilih dan memilih sub menu ambil data maka akan tampil seperti gambar berikut:
Gambar 4.17 Tampilan data gabungan 4.2.1.4. Tampilan bersihkan data Setelah data mahasiswa berhasil diambil dan ditampilkan di datagrid proses selanjutnya yaitu membersihkan data yang tidak dibutuhkan dan memilih data yang akan ditampilkan dan akan diproses mining, selanjutnya staf memilih sub menu bersihkan data dan hasilnya bisa dilihat di gambar berikut ini: Gambar 4.18Tampilan Bersihkan 4.2.1.5. Tampilan data yang akan di proses mining Pada Gambar berikut menunjukan bahwa proses mining telah siap untuk diproses.
Gambar 4.19 Tampilan data yang akan di proses mining 4.2.1.6. Tampilan tabel gabungan setelah proses mining Gambar 4.20 Tampilan tabel gabungan setelah proses mining 4.2.1.7. Tampilan laporan rangkuman Gambar 4.21 Tampilan laporan rangkuman
4.2.1.8. Tampilan laporan saran untuk amikom 4.2.1.9. Tampilan rekam jejak Gambar 4.22 Tampilan laporan saran untuk amikom 4.2.1.10. Tampilan keamanan Gambar 4.23 Tampilan rekam jejak Gambar 4.24 Tampilan keamanan
4.2.1.11. Tampilan ubah nama pengguna dan kata sandi Gambar 4.25 Tampilan ubah nama pengguna dan kata sandi 4.2.1.12 Tampilan Logout Gambar 4.26 Tampilan Logout 5. PENUTUP 5. 1 Kesimpulan Kesimpulan yang dapat di ambil dalam pengerjaan skripsi ini adalah a. Membuat aplikasi yang dapat menampilkan informasi yang berguna dalam mengambil keputusan dalam menganalisa hubungan proses masuk dengan tingkat kelulusan dengan menggunakan metode data mining. b. Cara mengambil keputusan setelah proses mining selesai yaitu dengan melihat tingkat saran yang di anjurkan untuk AMIKOM yang dapat di jadikan acuan dalam memaksimalkan iklan pada daerah tertentu apabila yang di pilih berdasarkan asal sekolah ataupun kota asal.
c. Pada aplikasi data mining ini juga di beri pilihan untuk pihak kampus AMIKOM apabila ingin mendapatkan hasil kualitas lulusan yang lebih bagus dan dengan target yang akurat bisa menggunakan pilihan keseluruhan atribut di gabung jadi satu pilihan. d. Hasil dari proses data mining ini dapat digunakan sebagai pertimbangan dalam mengambil keputusan lebih lanjut tentang faktor yang mempengaruhi tingkat kelulusan khususnya faktor dalam data induk mahasiswa. dengan adanya aplikasi ini maka akan di dapat e. informasi tentang keberhasilan proses masuk mahasiswa itu berasal dari mana, dan juga dapat mengetahui asal sekolah, nama sekolah, program studi mahasiswa tersebut. dari atribut program studi dapat di ketahui program studi yang mana yang di unggulkan dan di anggap berhasil dalam mencetak kelulusan mahasiswa di STMIK AMIKOM yogyakarta. 5. 2 Saran Untuk pengembangan Aplikasi mining lebih lanjut dari segi algoritma yang digunakan yaitu dapat menggunakan algoritma lain, misal algoritma nearest neighbor, algoritma C4.5 ataupun menggunakan fuzzy C means
Daftar Pustaka Inmon, W.H.(2002). Building the Warehouse,edisi-3. Wiley Computer Publishing. Kusrini, dan Emha Taufik Luthfi, 2009. Algoritma mining. CV. Andi OFFSET. Yogyakarta. Kusrini, 2007. Strategi perancangan dan pengelolaan basis data. CV. Andi OFFSET. Yogyakarta. Poe, Vidette(1998). Building Warehouse for Decision Support, edisi-2. Prentice Hall. Pramudiono, I. 2007. Pengantar mining : Menambang Permata Pengetahuan di Gunung,http://www.ilmukomputer.org/wp-content/uploads/2006/08/ikodatamining.zip Pramudiono, I., 2007. Algoritma Apriori, http://datamining.japati.net/cgibin/indodm.cgi?bacaarsip&1172210143 Rainardi, Vincent, 2008, Building a Warehouse with Examples in SQL Server, Springer, New York.