ANALISIS PEMANFAATAN DATA MINING DALAM PENENTUAN VARIABEL UNTUK PREDIKSI INDEKS PRESTASI MAHASISWA MENGGUNAKAN METODE BACK-PROPAGATION NEURAL NETWORK TESIS Oleh FRIENDLY 087034030/TE FAKULTAS TEKNIK UNIVERSITAS SUMATERA UTARA MEDAN 2011
ANALISIS PEMANFAATAN DATA MINING DALAM PENENTUAN VARIABEL UNTUK PREDIKSI INDEKS PRESTASI MAHASISWA MENGGUNAKAN METODE BACK-PROPAGATION NEURAL NETWORK TESIS Untuk Memperoleh Gelar Magister Teknik dalam Program Studi Magister Teknik Elektro pada Fakultas Teknik Oleh: FRIENDLY 087034030/TE FAKULTAS TEKNIK UNIVERSITAS SUMATERA UTARA MEDAN 2011
Telah Diuji pada Tanggal: 18 November 2011 PANITIA PENGUJI TESIS Ketua : Prof. Dr. Ir. Usman Baafai Anggota : 1. Dr. Benny B. Nasution, Dipl.Ing, M.Eng 2. Fakhruddin Rizal Batubara, ST. MT 3. Prof. Dr. Opim S. Sitompul, M.Si 4. Prof. Dr. Tulus, M.Si 5. Soeharwinto, ST, MT
ABSTRAK Penggunaan pengolahan data akademik secara elektronik memberikan kemudahan dalam administrasi. Data akademik ini juga sudah digunakan sebagai dasar pengambilan keputusan dan juga digunakan dalam penelitian. Penelitian ditujukan untuk dapat menganalisa informasi yang ada pada sehingga dapat diperoleh informasi yang baru dari data akademik yang ada. Salah satu penelitian yang memanfaatkan data akademik ini adalah penelitian mengenai prediksi indeks prestasi mahasiswa. Namun dengan beragamnya data sebagai variabel masukan prediksi indeks prestasi yang tersedia pada data akademik, prediksi indeks prestasi yang sudah dilakukan sebelumnya belum tentu dapat digunakan dengan data akademik yang lain dan menghasilkan prediksi yang baik. Hal utama yang ingin dicapai adalah untuk mendapatkan suatu model dengan teknik data mining dengan menggunakan back propagation neural network yang dapat melakukan pembelajaran terhadap data yang ada dan menentukan variabel yang dapat dipergunakan dalam prediksi indeks prestasi mahasiswa. Model ini akan melakukan penentuan variabel dari data yang ada dan melakukan pengujian data variabel hasil penentuan. Data yang digunakan adalah data mahasiswa Fakultas MIPA, Fakultas Hukum dan Fakultas Teknik. Hasil pengujian menunjukkan bahwa variabel yang dihasilkan berbeda berdasarkan data yang digunakan dan dari hasil pengujian diperoleh peningkatan persentasi prediksi dengan menggunakan penentuan variabel ini walaupun data mahasiswa pada Fakultas Teknik memiliki jumlah variabel yang lebih sedikit dibandingkan data Mahasiswa Fakultas MIPA dan Hukum. Kata-kata kunci: data mining, prediksi, jaringan syaraf tiruan, back propagation i
ABSTRACT The use of electronic academic data processing makes the administrative job easy. These academic data has also been used as the basis of decision making and when doing a research. The purpose of this study was to analyze existing information that the academic data available can result in new information. One of the researches using these academic data is a study on prediction of students achievement index. Yet, with the various data used as the input variables for prediction of achievement index found in the available academic data, the previously done prediction of achievement index cannot always be used together with the other academic data and produces good prediction. The main thing to be achieved is to find out a model with data mining technique by using the back propagation neural network that can learn the data available and determine the variables that can be used in predicting students achievement index. This model will determine the variables from the available data and test the determined data variables. The data used in this study were the data of the students of Faculty of Mathematics and Natural Science, Faculty of Law and Faculty of Engineering. The result of this study showed that the variables produced were different. Based on the data used and the result of the test done, it was found out that by using the determination of these variables, the percentage of prediction increased even though the data of students of Faculty of Engineering had less variables compared to the data of students of Faculty of Mathematics and Natural Science and Faculty of Law. Keywords: Data Mining, Prediction, Artificial Neural Network, Back Propagation ii
KATA PENGANTAR Puji dan syukur kehadirat Tuhan Yang Maha Esa, atas berkat rahmat dan karunia-nya sehinga penulis dapat menyelesaikan proposal tesis yang berjudul: Analisis Pemanfaatan Data Mining Dalam Penentuan Variabel Untuk Prediksi Indeks Prestasi Mahasiswa Menggunakan Metode Back Propagation Neural Network. Pada kesempatan ini, penulis mengucapkan terima kasih kepada Bapak Prof. Dr. Ir. Usman Baafai, selaku ketua komisi pembimbing, Bapak Dr. Benny B. Nasution, Dipl. Ing, M.Eng dan Bapak Fakhruddin Rizal Batubara, ST. MT selaku anggota komisi pembimbing yang dengan penuh sabar, arif dan bijaksana memberikan bimbingan, dorongan, petunjuk serta arahan kepada penulis. Bapak Prof. Dr. Opim S. Sitompul, M.Sc, Bapak Prof. Dr. Tulus, M.Si, dan Bapak Soeharwinto ST, MT. selaku Pembanding utama yang telah memberikan kritik dan masukan terhadap tesis. Penulis juga mengucapkan terima kasih kepada orang tua penulis, Ibu Meriana, Ibu Losmora, Bapak Hadiyanto atas doa dan dukungannya. Keluarga dan teman penulis yang telah banyak memberikan semangat dan perhatian serta toleransi sehingga tesis ini selesai. Terselesaikannya penelitian tesis ini juga melibatkan berbagai pihak yaitu: Ketua Program Studi dan Sekretaris Program Studi Magister Teknik Elektro, serta seluruh staf pengajar dan karyawan Program Studi Magister iii
Teknik Elektro, untuk itu penulis mengucapkan terima kasih atas kontribusi dan bantuannya. Penulis menyadari masih ada kekurangan dalam tulisan ini, namun penulis mengharapkan tulisan ini dapat memenuhi persyaratan yang diperlukan untuk suatu tesis dalam Program Studi Magister Teknik Elektro Fakultas Teknik Universitas Sumatera Utara. Akhir kata penulis mengucapkan banyak terima kasih dan semoga tesis ini dapat berguna bagi kita semua. Medan, November 2011 Hormat saya, Friendly iv
DAFTAR RIWAYAT HIDUP Saya yang bertanda tangan di bawah ini, Nama : Friendly Tempat/Tanggal Lahir : Kisaran, 24 Agustus 1981 Jenis Kelamin Agama Bangsa : Laki-laki : Katolik : Indonesia Alamat : Jl. Armada No. 2 Medan 20124 Menerangkan dengan sesungguhnya, bahwa: PENDIDIKAN 1. Tamatan Teknik Elektro USU Tahun 2006 2. Tamatan SMK Negeri 2 Yogyakarta Tahun 1999 3. Tamatan SMP Swasta Panti Budaya Kisaran Tahun 1996 4. Tamatan SD Swasta Panti Budaya Kisaran Tahun 1993 PEKERJAAN 1. Pegawai Pusat Sistem Informasi USU sejak tahun 2007 hingga sekarang v
Demikian riwayat hidup ini saya buat dengan sebenarnya untuk dapat dipergunakan sebagaimana mestinya. Medan, 18 November 2011 Tertanda, Friendly vi
DAFTAR ISI Halaman ABSTRAK... i ABSTRACT... ii KATA PENGANTAR... iii DAFTAR ISI... vii DAFTAR TABEL... ix DAFTAR GAMBAR... x BAB 1 PENDAHULUAN... 1 1.1. Latar Belakang... 1 1.2. Rumusan Masalah... 5 1.3. Tujuan Penelitian... 5 1.4. Manfaat Penelitian... 5 1.5. Batasan Masalah... 6 1.6. Metode Penelitian... 6 1.7. Sistematika Pembahasan... 7 BAB 2 TINJAUAN PUSTAKA... 8 2.1. Data Mining... 8 2.2. Neural Network... 12 vii
2.3. Mengaktifkan Jaringan Saraf Tiruan... 13 2.4. Jaringan Syaraf Tiruan Back Propagation... 15 BAB 3 METODE PENELITIAN... 20 3.1. Rancangan Penelitian... 20 3.2. Sumber Data... 20 3.3. Instrumen Penelitian... 21 3.4. Database SIA... 21 3.5. Data mining... 22 3.6. Perancangan Pengumpul Data... 23 3.7. Pembobotan Data... 25 3.8. Klasifikasi Data... 28 BAB 4 HASIL DAN ANALISIS... 46 4.1. Data Mining... 46 4.2. Analisa Pengujian Dengan Data Mining... 49 4.3. Pengujian Variabel... 51 4.4. Analisa Hasil Pengujian Variabel... 53 BAB 5 KESIMPULAN DAN SARAN... 57 5.1. Kesimpulan... 57 5.2. Saran... 58 DAFTAR PUSTAKA... 59 viii
DAFTAR TABEL Nomor Judul Halaman 1.1 Daftar Penelitian Terkait... 4 3.1 Hasil Pembobotan... 27 3.2 Penyusunan Kelas Dengan N=300... 33 3.3 Penyusunan Kelas Dengan N=500... 33 3.4 Penyusunan Kelas Dengan N=700... 33 3.5 Spesifikasi Daftar Hasil Pelatihan... 40 3.6 Spesifikasi Tabel Daftar Hasil Pengujian... 41 3.7 Hasil Penelitian Berdasarkan Nilai Pembelajaran [32]... 43 4.1 Jumlah Neuron Rata-Rata Hasil Pelatihan Jaringan... 47 4.2 Rangkuman Hasil Pelatihan... 48 4.3 Hasil Pengujian Pelatihan Data VA... 52 4.4 Hasil Pengujian Pelatihan Data VB... 52 4.5 Hasil Pengujian Pelatihan Data VC... 53 4.6 Hasil Pengujian Pelatihan Data VD... 53 ix
DAFTAR GAMBAR Nomor Judul Halaman 2.1 Proses Data Mining [17]... 9 2.2 Proses Pada Metode CRISP-DM [19]... 11 2.3 Sebuah Jaringan Syaraf Tiruan Dengan 1 Lapisan Tersembunyi [23]... 13 2.4 Fungsi Pengaktif... 14 2.5 Pengaruh Pengaturan σ Pada Karakteristik Fungsi Sigmoid... 15 2.6 Arsitektur JST Back Propagation... 16 2.7 Hubungan Antara Bobot Pada JST... 16 3.1 Diagram Aktivitas Pembobotan Data... 26 3.2 Diagram Aktivitas Klasifikasi... 28 3.3 Diagram Aktivitas Penyusunan Kelompok Variabel... 30 3.4 Diagram Aktivitas Penyusunan Kelas... 32 3.5 Diagram Aktivitas Pemanggilan Data... 35 3.6 Arsitektur Jaringan Syaraf Tiruan... 36 3.7 Diagram Aktivitas Penentuan Jumlah Neuron... 39 3.8 Diagram Aktivitas Proses Prediksi Indeks Prestasi... 42 x