DATA MINING INFORMASI TINGKAT KELULUSAN MAHASISWA STMIK PELITA NUSANTARA MEDAN. Anita Sindar RM Sinaga

DATA MINING INFORMASI TINGKAT KELULUSAN MAHASISWA STMIK PELITA NUSANTARA MEDAN Anita Sindar RM Sinaga Program Studi Teknik Informatika STIMIK Pelita Nusantara, Jl. Iskandar Muda No. 1 Medan, Indonesia haito_ita@yahoo.com Abstrak Kemampuan teknologi informasi untuk mengumpulkan dan menyimpan berbagai tipe data dalam jumlah besar mendorong untuk melakukan analisis, meringkas dan mengekstrak data. Pengolahan sistem informasi bagian kemahasiswaan dapat dikembangkan dengan penerapan teknik data mining. Data mining berguna sebagai data utama untuk diolah, menganalisa data awal sehingga menghasilkan informasi yang berguna. Dengan memanfaatkan Nomor Induk Mahasiswa (NIM) dan data kelulusan mahasiswa, diharapkan dapat menghasilkan informasi tingat kelulusan melalui teknik data mining yang diukur dari lama belajar dan nilai Indeks Prestasi Komulatif (IPK). Algoritma yang digunakan adalah Algoritma Apriori, informasi yang ditampilkan berupa nilai support dan confidence dari masing-masing kategori tingkat kelulusan. Tujuan dari penerapan teknik data mining adalah mengolah data awal untuk memperoleh informasi yang berguna yaitu mengetahui tingkat kelulusan Kata Kunci : Data Mining, Algoritma Aprior, NIM, IPK 1. PENDAHULUAN Pemanfaatan data mahasiswa sering hanya diarsipkan tanpa ada pengolahan yang efisien guna memperoleh pola, kebiasaan yang dapat ditemukan sebagai bahan analisa perguruan tinggi untuk meningkatkan kualitas mahasiswa dan kampus. Setiap semester data mahasiswa bertambah, data mahasiswa yang mendaftar dan data mahasiswa yang lulus. Latar belakang mahasiswa dari asal daerah, lama pembelajaran, bidang yang diminati mempengaruhi tingkat kelulusan Teknologi pengolahan data untuk menghasilkan informasi yang berguna bagi mahasiswa dan perguruan tinggi mendorong pemanfaatan teknologi informasi. Para pengambil keputusan dari manajemen membutuhkan data-data mahasiswa diolah secara komputerisasi sehingga memberikan tingkat informasi sebagai masukan dalam meningkatkan pelayanan pada Data dalam jumlah besar dikumpulkan, dibersihkan sehingga diperoleh data warehouse, yang menunjang pengolahan data mining. Data mining adalah kegiatan menemukan pola yang menarik dari data dalam jumlah besar, data dapat disimpan dalam database, data warehouse, atau penyimpanan informasi lainnya. Data mining berkaitan dengan bidang ilmu-ilmu lain, seperti database sistem, data warehousing, statistik, machine learning, information retrieval, dan komputasi tingkat tinggi. Data warehouse mendukung On-line Analitycal Processing (OLAP), sebuah kasus yang digunakan untuk menganalisis secara interaktif dari bentuk multidimensi yang mempunyai data yang rinci. Informasi yang ditampilkan merupakan hubungan antara tingkat kelulusan dengan data induk mahasiswa yaitu berupa nilai support dan confidence. 2. TINJAUAN PUSTAKA A. Data Mining Data warehouse merupakan penyimpanan data yang berorientasi objek, terintegrasi, mempunyai variant waktu, dan menyimpan data dalam bentuk non volatile sebagai pendukung manejemen dalam proses pengambilan keputusan (Han, 2006). Gambar 1. Arsitektur Data Warehouse Hoffer dan McFadden mengemukakan bahwa data mining adalah penemuan pengetahuan dengan menggunakan teknik teknik yang tergabung dari statistik, tradisional, kecerdasan dan grafik komputer. Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 27

Secara sederhana data mining merupakan penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu. Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan mesin learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait berbagai database besar (Turban dkk, 2005). Tahap-tahap data mining : 1. Pembersihan Data (Data Cleaning) Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. 2. Integrasi Data (Data Integration) Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru. 3. Seleksi Data (Data Selection) Data yang ada pada database sering tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database. 4. Transformasi Data (Data Transformation) Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. 5. Proses Mining Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data. 6. Evaluasi Pola (Pattern Evaluation) Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan. 7. Presentasi Pengetahuan (knowledge presentation), merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna. Tahap terakhir dari proses data mining adalah bagaimana memformulasikan keputusan atau aksi dari hasil analisis yang diperoleh. Gambar 2. Tahap-Tahap Data Mining Data mining, sering disebut knowledge discovery in database (KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Machine Learning adalah suatu area dalam artificial intelligence atau kecerdasan buatan yang berhubungan dengan pengembangan teknik-teknik yang bisa diprogramkan dan belajar dari data masa lalu. Pengenalan pola, data mining dan machine learning sering dipakai untuk menyebut sesuatu yang sama. Bidang ini bersinggungan dengan ilmu probabilitas dan statistik kadang juga optimasi. Machine learning menjadi alat analisis dalam data mining. Gambar 3. Data Mining merupakan irisan berbagai ilmu Istilah antecedent dan consequent, antecedent untuk mewakili bagian jika dan consequent untuk mewakili bagian maka. Dalam analisis ini, antecedent dan consequent adalah sekelompok item yang tidak punya hubungan secara bersama (Santoso, 2007). Untuk mengukur kekuatan aturan asosiasi ini, digunakan ukuran support dan confidence. Support adalah rasio antara jumlah transaksi yang memuat antecedent dan consequent dengan jumlah transaksi. Confidence adalah rasio antara jumlah transaksi yang meliputi semua item dalam antecedent dan consequent dengan jumlah transaksi yang meliputi semua item dalam antecedent. Analisis asosiasi dikenal juga sebagai salah satu metode data mining yang menjadi dasar dari berbagai metode data mining lainnya. Khususnya salah satu tahap dari analisis asosiasi yang disebut analisis pola frekuensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien. Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support (nilai penunjang) yaitu prosentase kombinasi item tersebut. dalam database dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif. Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence) (Pramudiono, 2007). B. Algoritma Apriori Dasar ide dari algoritma apriori adalah mengembangkan frequent itemset dengan Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 28

menggunakan satu item dan secara rekursif mengembangkan frequent itemset dengan dua item, tiga item dan seterusnya hingga frequent itemset dengan semua ukuran. Untuk mengembangkan frequent set dengan dua item, dapat menggunakan frequent set item. Alasannya adalah bila set satu item tidak melebihi support minimum, maka sembarang ukuran itemset yang lebih besar tidak akan melebihi support minimum tersebut. Secara umum, mengembangkan set dengan fc-item menggunakan frequent set dengan k 1 item yang dikembangkan dalam langkah sebelumnya. Setiap langkah memerlukan sekali pemeriksaan ke seluruh isi database. Dalam asosiasi terdapat istilah antecedent dan consequent, antecedent untuk mewakili bagian jika dan consequent untuk mewakili bagian maka. Dalam analisis ini, antecedent dan consequent adalah sekelompok item yang tidak punya hubungan secara bersama (Santoso, 2007). III. METODE PENELITIAN Tahap awal pelaksanaan penelitian ini yaitu menetukan rumusan permasalahan :. a. Tingkat kelulusan mahasiswa dapat dilihat dari lama studi dan IPK (Indeks Prestasi Kumulatif) yang terdapat pada data kelulusan b. Permasalahan yang dibahas yaitu bagaimana menghasilkan informasi yang berguna tentang hubungan tingkat kelulusan dengan data induk mahasiswa dengan teknik data mining. c. Informasi yang ditampilkan berupa nilai support dan confidence hubungan antara tingkat kelulusan dengan data induk mahasiswa Dari rumusan permasalahan selanjutnya mengembangkan metode penelitian terdiri yaitu sebagai berikut : Tidak semua data induk siswa akan dicari hubungannya dengan data kelulusan, hanya beberapa atribut yang kira-kira berguna dan sebarannya tidak terlalu acak. Karena data yang terlalu acak akan membuat proses mining memakan waktu lama dan tingkat hubungannya pun rendah. Data induk mahasiswa yang akan dicari hubungannya meliputi proses masuk, asal sekolah, kota asal sekolah, dan program studi. Sumber data dalam penentuan tingkat kelulusan dipengaruhi : 1. Proses Pendaftaran Dari proses pendaftaran mahasiswa dapat diperoleh tingkat kelulusan Pendaftaran melalui jalur ujian saringan masuk dan beasiswa. 2. Asal sekolah dan proses masuk 3. Kota asal sekolah 4. Program Studi Data mahasiswa yang dikumpulkan yaitu data masuk tahun 2012-2015 dan data lulus tahun 2013-2015, Program Studi Teknik Informatika di STMIK Pelita Nusantara Medan. Sumber data pengolahan teknik data mining yaitu : 1. Data Induk Mahasiswa Atribut data induk mahasiswa terdiri yaitu NIM, Jenis Kelamin, Nama Mahasiswa, Tempat Lahir, Tanggal Lahir, Agama, Proses Masuk, Nama Wali, Alamat Wali, Pendidikan Terakgir Wali, Nama Sekolah, Nama Asal Sekolah, Kota Asal Sekolah, Jurusan, Tahun Lulus. 2. Data Kelulusan Atribut data kelulusan yaitu NIM, Nama Mahasiswa, Tempat Lahir, Tanggal Lahir, Program Studi, Tanggal Lulus, IPK. B. Penggunaan Algoritma Apriori Untuk mengukur kekuatan aturan asosiasi ini, digunakan ukuran support dan confidence. Analisis Sumber Data Pengolahan Data Mining Penggunaan Algoritma Aprion Rancangan dan Implementasi Analisis Hasil Uji Gambar 4. Metode Penelitian A. Analisis Sumber Data Gambar 5. Ukuran Support dan Confidence Langkah pertama algoritma apriori adalah, support dari setiap item dihitung dengan menscan database. Setelah support dari setiap item didapat, item yang memiliki support lebih besar dari minimum support dipilih sebagai pola Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 29

frekuensi tinggi dengan panjang 1 atau sering disingkat 1-itemset. Singkatan k-itemset berarti satu set yang terdiri dari k item. Untuk selanjutnya iterasi iterasi ke-k dapat dibagi lagi menjadi beberapa bagian : 1. Pembentukan kandidat itemset Kandidat k-itemset dibentuk dari kombinasi (k-1)-itemset yang didapat dari iterasi sebelumnya. Satu ciri dari algoritma apriori adalah adanya pemangkasan kandidat k- itemset yang subset-nya yang berisi k-1 item tidak termasuk dalam pola frekuensi tinggi dengan panjang k-1. 2. Penghitungan support dari tiap kandidat k- itemset Support dari tiap kandidat k-itemset didapat dengan men-scan database untuk menghitung jumlah transaksi yang memuat semua item di dalam kandidat k-itemset tersebut. Ini adalah juga ciri dari algoritma apriori yaitu diperlukan penghitungan dengan scan seluruh database sebanyak k- itemset terpanjang. 3. Tetapkan pola frekuensi tinggi Pola frekuensi tinggi yang memuat k item atau k-itemset ditetapkan dari kandidat k- itemset yang support-nya lebih besar dari minimum support. Kemudian dihitung confidence masing-masing kombinasi item. C. Rancangan dan Implementasi Proses perancangan sistem membagi persyaratan dalam sistem perangkat keras atau perangkat lunak. Kegiatan ini menentukan arsitektur sistem secara keseluruhan. Perancangan perangkat lunak melibatkan identifikasi dan deskripsi abstraksi sistem perangkat lunak yang mendasar dan hubunganhubungannya (Sommerville, 2003). Sebagaimana persyaratan, desain didokumentasikan dan menjadi bagian dari konfigurasi software (Pressman, 1997). Antarmuka perangkat lunak yang digunakan adalah Visual Studio, DBMS SQL Server, Script Editor, Notepad,.Net Framework Tahap desain meliputi perancangan data, perancangan fungsional, dan perancangan antar muka. 1. Perancangan data Perancangan data mentransformasikan model data yang dihasilkan oleh proses analisis menjadi struktur data yang dibutuhkan pada saat pembuatan program (coding). Selain itu juga akan dilakukan desain terhadap struktur database yang akan dipakai. 2. Perancangan fungsional Perancangan fungsional mendeskripsikan kebutuhan fungsi-fungsi utama perangkat lunak. 3. Perancangan antar muka Perancangan antar muka mendefinisikan bagaimana pengguna (user) dan perangkat lunak berkomunikasi dalam menjalankan fungsionalitas perangkat lunak. D. Analisis Hasil Uji Pengujian unit melibatkan verifikasi bahwa setiap unit program telah memenuhi spesifikasinya (Sommerville, 2003). Program sebaiknya dirilis setelah dikembangkan, diuji untuk memperbaiki kesalahan yang ditemukan pada pengujian untuk menjamin kualitasnya (Padmini, 2005). Terdapat dua metode pengujian yaitu : 1. Metode white box yaitu pengujian yang berfokus pada logika internal software (source code program). 2. Metode black box yaitu mengarahkan pengujian untuk menemukan kesalahankesalahan dan memastikan bahwa input yang dibatasi akan memberikan hasil aktual yang sesuai dengan hasil yang dibutuhkan. IV. HASIL DAN PEMBAHASAN Hubungan beberapa atribut dari data induk mahasiswa dengan tingkat kelulusan. Karena tidak semua tabel digunakan maka perlu dilakukan pembersihan data agar data yang akan diolah benar-benar relevan dengan yang dibutuhkan. Atribut yang digunakan dalam data induk mahasiswa meliputi : 1. Atribut NIM digunakan sebagai primary key untuk menghubungkan dengan data kelulusan 2. Atribut proses masuk digunakan untuk proses mining guna mengetahui hubungan antara tingkat kelulusan dengan jalur masuk yang digunakan 3. Atribut nama asal sekolah digunakan untuk proses mining guna mengetahui hubungan antara tingkat kelulusan dengan asal sekolah. 4. Atribut kota asal sekolah digunakan untuk proses mining guna mengetahui hubungan tingkat kelulusan dengan kota asal mahasiswa Atribut yang digunakan dalam data kelulusan meliputi : 1. NIM digunakan sebagai primary key untuk menghubungkan dengan data induk 2. Indeks Prestasi Kumulatif (IPK) digunakan sebagai ukuran tingkat kelulusan mahasiswa 3. Lama studi digunakan sebagai ukuran tingkat kelulusan Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 30

4. Program studi digunakan untuk proses mining guna mengetahui hubungan tingkat kelulusan dengan program studi. Untuk proses mining, data kelulusan dan data induk mahasiswa digabungkan dengan primary key NIM, setelah itu dilakukan proses mining. Proses pengolahan data mining : A. Integrasi Data Proses integrasi data dilakukan ketika proses ETL (ekstract, transform, and Load) ketika membangun data warehouse, dalam proses ETL data dalam data source digabungkan menjadi satu dalam data warehouse dengan key NIM. B. Transformasi Data Data kelulusan berdasarkan IPK dapat dikategorikan menjadi tiga yaitu : 1. IPK memuaskan : IPK 2,00 2,75 2. IPK sangat memuaskan : IPK 2,76 3,50 C. IPK tipe dengan pujian : IPK 3,51 4,00 Pengkategorian data kelulusan berdasarkan lama studi yaitu : 1. Sesuai jadwal, bila lama studi 4 tahun atau kurang dari 4 tahun. 2. Tidak sesuai jadwal, bila lama studi lebih dari 4 tahun. Hasil transformasi data dari 2 kategori di atas, Tabel 4.1. Transformasi Data, terdapat enam tingkatan untuk mengukur tingkat kelulusan Tabel 4.1 Transformasi Data Kategori Keterangan A1 Lama Studi 4 tahun atau kurang 4 tahun dengan IPK 3,51 4,00 A2 Lama Studi 4 tahun atau kurang 4 tahun dengan IPK 2,76 3,50 A3 Lama Studi 4 tahun atau kurang 4 tahun dengan IPK 2,00 2,75 B1 Lama Studi lebih 4 tahun atau kurang 4 tahun dengan IPK 3,51 4,00 B2 Lama Studi lebih 4 tahun dengan IPK 2,76 3,50 B3 Lama Studi lebih 4 tahun dengan IPK 2,00 2,75 C. Algoritma Apriori Algoritma apriori dibagi menjadi beberapa tahap yang disebut iterasi. Tiap iterasi menghasilkan pola frekuensi tinggi dengan panjang yang sama dimulai dari pass pertama yang menghasilkan pola frekuensi tinggi dengan panjang satu. Di iterasi pertama ini, support dari setiap item dihitung dengan men-scan database. Setelah support dari setiap item didapat, item yang memiliki support lebih besar dari minimum support dipilih sebagai pola frekuensi tinggi dengan panjang 1 atau sering disingkat 1- itemset. Singkatan k-itemset berarti satu set yang terdiri dari k item. Iterasi kedua menghasilkan 2-itemset yang tiap set-nya memiliki dua item. Pertama dibuat kandidat 2- itemset dari kombinasi semua 1-itemset. Lalu untuk tiap kandidat 2-itemset ini dihitung support-nya dengan men-scan database. Support artinya jumlah transaksi dalam database yang mengandung kedua item dalam kandidat 2-itemset. Setelah support dari semua kandidat 2-itemset didapatkan, kandidat 2- itemset yang memenuhi syarat minimum support dapat ditetapkan sebagai 2-itemset yang juga merupakan pola frekuensi tinggi dengan panjang 2. Contoh proses mining untuk mengetahui hubungan tingkat kelulusan dengan proses masuk. Tabel 4.2 Data Awal NIM Kategori Lulus Proses Masuk 1101153 A1 Ujian 1101154 A2 Ujian 1101109 A1 Ujian 1101115 A3 Beasiswa 1101157 B1 Beasiswa 1101158 A2 Ujian 1101167 A2 Beasiswa 1101190 A2 Beasiswa 1101143 A2 Beasiswa Tabel 4.3 Kandidat Pertama Itemset Count A1 2 A2 5 A3 1 B1 2 Ujian 4 Beasiswa 5 Tabel 4.4 Hasil Treshold Itemset Count A2 4 A1 2 Ujian 4 Beasiswa 5 Ditetapkan threshold = 3, maka kandidat yang nilainya kurang dari 3 akan dihapus. Sehingga, didapat hasil seperti pada tabel 4.5 Tabel 4.5 Kandidat Dua Itemset Count A2, Ujian 2 A2, Beasiswa 3 A1, Ujian 2 A1, Beasiswa 0 Tabel 4.6 Hasil Treshold Kedua Itemset Count A2, Beasiswa 3 A1, Ujian 2 Dari pada tabel 4.6 dapat diambil hasil sebagai berikut : Support A2, Beasiswa = Count (A2,Besiswa)/jumlah transaksi = 3/9 Support A1, Ujian = Count (A1,Ujian) /jumlah transaksi Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 31

= 2/9 Confidence A2, Beasiswa = Count(A2,Beasiswa)/Count (A2) = 3/4 Confidence A3, Ujian = Count(A3,Ujian)/Count(A3) = 3/3 Dapat dilihat bahwa proses mining hubungan tingkat kelulusan. D. Proses Load Setelah proses mining akan disajikan hasil dari data mining berupa tabel hubungan kekuatan dengan nilai support dan confidence masing-masing atribut serta threshold yang digunakan. Semakin tinggi nilai confidence dan support maka semakin kuat nilai hubungan antar atribut. Database Induk mahasiswa dan database kelulusan merupakan data source dalam pembangunan data warehouse. Dalam proses ETL kedua data source tersebut di load kedalam data warehouse. Proses ETL mencangkup proses integrasi data dari data induk dan data kelulusan menjadi data gabungan dengan key NIM. Gambar 4.1 Proses Load Dari skema tersebut dapat dibangun database baru untuk menampung data-data dari database induk mahasiswa dan database kelulusan Karena hanya terdapat satu entitas maka tidak ada relasi antar entitas, sehingga hanya terbentuk satu tabel. Tabel 4.7 Gabungan Atribut E. Fungsi Mining Proses-proses yang terdapat pada Aplikasi Data Mining : 1. Import Data Proses import data adalah proses load data dari database kelulusan dan database induk mahasiswa ke data warehouse. Semua data akan dimasukkan tanpa ada penyaringan. 2. Cleaning, Integrasi, Selection, dan transformasi. a) Cleaning data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data yang tidak relevan. Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar salah ketik. Dalam tahap ini semua data yang akan digunakan baik data kelulusan, data induk mahasiswa maupun data nilai semester dibersihkan dari record data yang tidak mempunyai atribut lengkap. Selain pembersihan record data yang tidak valid, juga dilakukan penghapusan atribut yang tidak dipakai, misalnya atribut gaji orang tua, nama orang tua dan lain-lain. Pembersihan data juga akan mempengaruhi performasi dari sistem data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya. b) Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru. Data induk mahasiswa, data nilai dan data kelulusan tidak disimpan dalam satu database, Integrasi data dilakukan pada atribut-aribut yang mengidentifikasikan entitas-entitas dengan satu atribut unik yaitu NIM c) Selection data adalah proses menyeleksi atribut apa yang akan diproses pada mining selanjutnya. d) Transformasi data merupakan proses mengubah data atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Dalam pengolahan teknik data mining, data yang diubah yaitu : 1) Fungsi Ambil Data Lama studi dan IPK untuk mengukur tingkat kelulusan. Atribut lama studi dan IPK dibagi menjadi beberapa interval. Nama fungsi : Ambil Data Deskripsi isi : Digunakan untuk mengambil data kelulusan dan data induk mahasiswa kemudian Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 32

menggabungkannya dengan key NIM dan disimpan dalam tabel data gabungan. Initial State (IS) : tabel data gabungan kosong Final State (FS) : tabel data gabungan terisi Spesifikasi Proses/algoritma: Ambil data kelulusan dan data induk gabungkan dengan key NIM Simpan dalam tabel data gabungan 2) Fungsi Bersihkan Data Nama fungsi : Bersihkan data Deskripsi isi : Digunakan untuk membersihkan data yang tidak sesuai dan tidak lengkap isiannya dari data gabungan dan ditampilkan dalam view data gabungan bersih untuk diolah lebih lanjut. Initial State (IS) : view data gabungan bersih kosong Final State (FS) : view data gabungan bersih terisi data gabungan yang telah dibersihkan Spesifikasi Proses/algoritma: Pemilihan atribut Ambil data gabungan seleksi atribut yang dipakai dan buang atribut yang tidak lengkap isiannya 3) Fungsi Mining Proses Masuk Proses mining proses masuk merupakan proses mining untuk mengetahui hubungan tingkat kelulusan dengan proses masuk Nama fungsi : Mining Proses Masuk Deskripsi isi : Digunakan untuk proses mining atribut proses masuk Initial State (IS) : view data gabungan bersih terisi data bersih Final State (FS): Keluar report hasil proses mining proses masuk Spesifikasi Proses/algoritma: Hitung masing masing item dalam Kategori Hitung masing-masing item dalam proses masuk IF jumlah masing masing item > threshold THEN Hitung kombinasi masing-masing item kategori dan proses masuk Hitung nilai support dan confidence END IF 4) Fungsi Mining Asal Sekolah Proses mining asal sekolah merupakan proses mining untuk mengetahui hubungan tingkat kelulusan dengan asal sekolah yang melalui jalur beasiswa. Nama fungsi : Mining Asal Sekolah Deskripsi isi : Digunakan untuk proses mining atribut Asal Sekolah Initial State (IS): view data gabungan bersih terisi data bersih Final State (FS): Keluar report hasil proses mining asal sekolah Spesifikasi Proses/algoritma: Hitung masing masing item dalam Kategori Hitung masing-masing item dalam asal sekolah dengan proses masuk Beasiswa IF jumlah masing-masing item > threshold THEN Hitung kombinasi masing-masing item kategori dan asal sekolah Hitung nilai support dan confidence END IF 5) Fungsi Mining Kota Asal Proses mining asal kota merupakan proses mining untuk mengetahui hubungan tingkat kelulusan dengan asal kota mahasiswa, digunakan data kota asal sekolah dengan asumsi kota asal sekolah merupakan kota asal Nama fungsi : Mining Kota Asal Deskripsi isi : Digunakan untuk proses mining atribut Kota Asal Initial State (IS) : view data gabungan bersih terisi data bersih Hitung kombinasi masing-masing item kategori dan Kota Asal Hitung nilai support dan confidence END IF 6) Fungsi Mining Program Studi Proses mining program studi merupakan proses mining untuk mengetahui hubungan tingkat kelulusan dengan program studi. Nama fungsi : Mining Program Studi Deskripsi isi : Digunakan untuk proses mining atribut Program Studi Initial State (IS) : view data gabungan bersih terisi data bersih Final State (FS): Keluar report hasil proses mining program studi Spesifikasi Proses/algoritma: Hitung masing masing item dalam Kategori Hitung masing-masing item dalam Program Studi IF jumlah masing-masing item > threshold THEN Hitung kombinasi masingmasing item kategori dan Program Studi Hitung nilai support dan confidence END IF D. Implementasi Interface Dalam lembaran aplikasi Data Mining ini terdapat dua buah form : 1. Form pertama Halaman awal yang berisi perintah pengambilan data pemilihan atribut data induk mahasiswa, input threshold, perintah proses mining dan tombol keluar aplikasi. 2. Form kedua Halaman report data mining yang berisi hasil proses data mining yaitu tabel nilai support dan confidence. Gambar 4.2 Tampilan Form Data Mining Perintah-perintah dalam form pertama berupa tombol ambil data untuk melakukan proses pengambilan data, inputan teks threshold untuk memasukkan nilai threshold, inputan combo box untuk memilih jurusan, inputan combo box untuk memilih atribut yang akan diproses mining, tombol proses untuk perintah Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 33

proses mining dan tombol keluar untuk perintah keluar aplikasi. Hasil keluaran dari proses data mining disajikan dalam form report Aplikasi Data Mining. Form ini terdiri dari dua informasi utama, yaitu informasi atribut dengan confidence tertinggi masing-masing kategori kelulusan dan tabel yang berisi nilai confidence dan support masing-masing kombinasi tingkat kelulusan dan Atribut. Selain itu terdapat dua tombol perintah yaitu tombol kembali ke menu utama dan tombol untuk keluar aplikasi. Pengujian Sistem No Butir Uji Kelas Uji Tingkat Pengujian 1 Fungsi Tombol Pengujian pengambi ambil data sistem lan data 2 Fungsi bersihkan data 3 Fungsi mining data Tombol Brsihkan data Tombol mining data Pengujian sistem Pengujian sistem Jenis Uji Black Box Black Box Black Box H. Hasil Uji Hasil uji dianggap sukses jika pada tabel pengujian, hasil yang didapat sesuai dengan kriteria evaluasi hasil dan hasil yang diharapkan. Tabel 4.9 Hasil Uji Teknik Data Mining Gambar 4.2 Tampilan Report Data Mining Implementasi rancangan data merupakan transformasi rancangan data yang dihasilkan dari proses perancangan data menjadi suatu database. Database merupakan suatu data warehouse dengan nama data Mining yang dibangun untuk menyimpan data kelulusan mahasiswa dan data induk mahasiswa yang disatukan dengan key NIM dan disimpan dalam tabel data gabungan. Hasil rancangan antarmuka Aplikasi Data Mining diimplementasikan dalam dua form. Form pertama merupakan halaman awal yang berisi perintah pengambilan data pemilihan atribut data induk mahasiswa, input threshold, perintah proses mining dan tombol keluar aplikasi. Sedangkan form kedua berupa informasi hasil proses data mining yaitu tabel nilai support dan confidence. Tombol dan inputan dalam form awal disusun secara berurutan dan hanya bisa diakses secara terurut. Karena dalam data mining proses tersebut bersifat sekuensial. G. Pengujian Aplikasi Data Mining Dalam pengujian Aplikasi Data Mining ini digunakan teknik pengujian Black Box. Teknik yang digunakan dalam pengujian Black Box antara lain : 1. Digunakan untuk menguji fungsi-fungsi khusus dari perangkat lunak yang dirancang. 2. Kebenaran perangkat lunak yang diuji hanya dilihat berdasarkan keluaran yang dihasilkan dari data atau kondisi masukan yang diberikan untuk fungsi yang ada tanpa melihat bagaimana proses untuk mendapatkan keluaran tersebut dan bagaimana hasil dari proses mining. 3. Dari keluaran yang dihasilkan, kemampuan program dalam memenuhi kebutuhan pemakai dapat diukur sekaligus dapat diketahui kesalahan-kesalahannya. Tabel 4.8 V. SIMPULAN DAN SARAN Kesimpulan yang dapat diperoleh dari penerapan teknik data mining dalam menentukan tingkat kelulusan yaitu : 1. Informasi yang ditampilkan berupa nilai support dan confidence yaitu hubungan antara tingkat kelulusan dengan data induk Semakin tinggi nilai confidence dan support maka semakin kuat nilai hubungan antar atribut. 2. Data induk mahasiswa yang diproses mining meliputi data proses masuk, data asal sekolah, data kota mahasiswa, dan data program studi. 3. Hasil dari proses data mining ini dapat digunakan sebagai pertimbangan dalam mengambil keputusan lebih lanjut tentang faktor yang mempengaruhi tingkat kelulusan khususnya faktor dalam data induk 4. Berdasarkan pengujian, dapat disimpulkan bahwa pengolahan data dengan Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 34

menggunakan teknik data Mining dapat digunakan untuk mengetahui hubungan data kelulusan dengan data induk Saran dari penerapan teknik data mining dalam pemanfaatan data awal mahaiswa yaitu : 1. Untuk pengembangan Aplikasi Data Mining lebih lanjut, dapat menggunakan algoritma lain, misal algoritma FP-Growth. Perbedaannya adalah algoritma apriori harus melakukan scan database setiap kali iterasi, sedangkan algoritma FP-Growth hanya melakukan satu kali scan database diawal. 2. Pengolahan data besar dan tidak beraturan bila diolah dengan teknik data mining akan memberikan informasi yang sangat bermanfaat dalam meningkatkan pelayanan manajemen pendidikan. VI. REFERENSI Anonim, 2009 Peraturan Akademik Universitas Diponegoro Bidang Pendidikan, Semarang. Bramer, Max, 2007, Principles of Data Mining, Springer, London. Chintakayala, Padmini. 2005. Beginners Guide for Software Testing : Symbiosys Technologies. Davies, and Paul Beynon, 2004, Database Systems Third Edition, Palgrave Macmillan, New York. Elmasri, Ramez and Shamkant B. Navathe, 2000, Fundamentals of Database Systems. Third Edition, Addison Wesley Publishing Company, New York. Han, J. and Kamber, M, 2006, Data Mining Concepts and Techniques Second Edition. Morgan Kauffman, San Francisco. Kadir, Abdul, 1999, Konsep dan Tuntunan Praktis Basis Data, Penerbit Andi, Yogyakarta. Kusrini, dan Emha Taufik Luthfi, 2009, Algoritma Data Mining, Penerbit Andi, Yogyakarta. Pramudiono, I. 2007. Pengantar Data Mining : Menambang Permata Pengetahuan di Gunung Data. Rainardi, Vincent, 2008, Building a Data Warehouse with Examples in SQL Server, Springer, New York. Pressman, Roger S, 1997, Software Engineering:A Practitioner s Approch. The McGraw-Hill Companies, Inc., New York Santosa, Budi, 2007, Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis, Graha Ilmu, Yogyakarta. Sommerville, Ian, 2003, Software Engineering (Rekayasa Perangkat Lunak)/Edisi 6/Jilid 1 Erlangga. Witten, I. H and Frank, E. 2005. Data Mining : Practical Machine Learning Tools and Techniques Second Edition. Morgan Kauffman : San Francisco. Jurnal Manajemen dan Informatika Komputer Pelita Nusantara 35