PEMODELAN ATURAN DALAM MEMPREDIKSI PRESTASI AKADEMIK MAHASISWA POLITEKNIK NEGERI MEDAN DENGAN KERNEL K-MEANS CLUSTERING TESIS Oleh HIKMAH ADWIN ADAM 097038004/TINF PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA M E D A N 2011
PEMODELAN ATURAN DALAM MEMPREDIKSI PRESTASI AKADEMIK MAHASISWA POLITEKNIK NEGERI MEDAN DENGAN KERNEL K-MEANS CLUSTERING TESIS Oleh HIKMAH ADWIN ADAM 097038004/TINF PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA M E D A N 2011
PEMODELAN ATURAN DALAM MEMPREDIKSI PRESTASI AKADEMIK MAHASISWA POLITEKNIK NEGERI MEDAN DENGAN KERNEL K-MEANS CLUSTERING TESIS Diajukan sebagai salah satu syarat untuk memperoleh gelar Magister Komputer dalam Program Studi Magister Teknik Informatika pada Program Pascasarjana Fakultas MIPA Oleh HIKMAH ADWIN ADAM 097038004/TINF PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA M E D A N 2011
PENGESAHAN TESIS Judul Tesis : PEMODELAN ATURAN DALAM MEMPREDIKSI PRESTASI AKADEMIK MAHASISWA POLITEKNIK NEGERI MEDAN DENGAN KERNEL K-MEANS CLUSTERING Nama Mahasiswa : Hikmah Adwin Adam Nomor Induk Mahasiswa : 097038004 Program studi Fakultas : Teknik Informatika : Matematika dan Ilmu Pengetahuan Alam Menyetujui Komisi Pembimbing Prof. Dr. Muhammad Zarlis Ketua Ketua Program Studi, D e k a n, Prof. Dr. Muhammad Zarlis Dr. Sutarman, M.Sc. NIP 19570701 198601 1 003 NIP 19631026 199003 1 001
PERNYATAAN ORISINALITAS PEMODELAN ATURAN DALAM MEMPREDIKSI PRESTASI AKADEMIK MAHASISWA POLITEKNIK NEGERI MEDAN DENGAN KERNEL K-MEANS CLUSTERING TESIS Dengan ini saya nyatakan bahwa saya mengakui semua karya tesis ini adalah hasil kerja saya sendiri kecuali kutipan dan ringkasan yang tiap bagiannya telah di jelaskan sumbernya dengan benar. Medan, 27 Juli 2011 Hikmah Adwin Adam NIM. 097038004
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS Sebagai sivitas akademika, saya yang bertanda tangan di bawah ini: Nama : Hikmah Adwin Adam NIM : 097038004 Program Studi : Magister (S2) Teknik Informatika Jenis Karya Ilmiah : Tesis Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty Free Right) atas Tesis saya yang berjudul: PEMODELAN ATURAN DALAM MEMPREDIKSI PRESTASI AKADEMIK MAHASISWA POLITEKNIK NEGERI MEDAN DENGAN KERNEL K-MEANS CLUSTERING Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non- Eksklusif ini, berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk data-base, merawat dan mempublikasikan Tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta. Demikian pernyataan ini dibuat dengan sebenarnya. Medan, 27 Juli 2011 Hikmah Adwin Adam
Telah diuji pada Tanggal : 27 Juli 2011 PANITIA PENGUJI TESIS Ketua : Prof. Dr. Herman Mawengkang Anggota : 1. Prof. Dr. Muhammad Zarlis 2. Amer Sharif, S.SI, M.Kom 3. M. Andri Budiman, ST, M. Comp.Sc,MEM
RIWAYAT HIDUP DATA PRIBADI Nama Lengkap : Hikmah Adwin Adam, S.Kom Tempat dan Tanggal Lahir : Medan / 23 Maret 1970 Alamat Rumah : Jl. Amaliun Gg. Rajabatu 9/239 Medan - 20215 Telepon / HP : (061) 7364357 / 08196017879 e-mail : hikmah_adwin@yahoo.com Instansi : Politeknik Negeri Medan Alamat Kantor : Jl. Almamater No. 1 Kampus USU Medan - 20155 Telepon / Faks : (061) 8213071, 8211235 / (061) 8215845 DATA PENDIDIKAN SD : Kartini Medan Tamat : 1982 SMP : Harapan II Medan Tamat : 1985 SMA : Kesatria Medan Tamat : 1988 D3 : Amik Kesatria Medan Tamat : 1994 S1 : STMIK Budidarma Medan Tamat : 1999 S2 : PSMTIF FMIPA USU Tamat : 2011
KATA PENGANTAR Segala puji dan syukur bagi Allah SWT karena dengan rahmat dan karunianya sehingga tesis ini dapat diselesaikan melalui bimbingan, arahan dan bantuan yang diberikan berbagai pihak khususnya pembimbing, pembanding, para dosen, teman-teman mahasiswa Program Studi Magister (S2) Teknik Informatika FMIPA. Dengan selesainya tesis ini, perkenankanlah penulis mengucapkan banyak terima kasih kepada: Direktur Politeknik Negeri Medan Ir. Zulkifli Lubis, M.I.Komp yang telah memberi izin, bantuan dan kesempatan kepada penulis untuk mengikuti pendidikan lanjutan pada Program Pascasarjana FMIPA USU. Rektor, Prof. Dr. dr. Syahril Pasaribu, DTM&H, M.Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada penulis untuk mengikuti dan menyelesaikan pendidikan Program Magister (S2). Dekan Fakultas MIPA, Dr. Sutarman, MSc atas kesempatan yang diberikan kepada penulis untuk menjadi mahasiswa Program Magister (S2) pada Program Pascasarjana FMIPA. Ketua Program Studi Magister (S2) Teknik Informatika, Prof. Dr. Muhammad Zarlis, Sekretaris Program Studi Magister (S2) Teknik Informatika, M. Andri Budiman, ST, M.Comp. Sc, M.EM beserta seluruh Staf Pengajar pada Program Studi Magister (S2) Teknik Informatika FMIPA. Terima kasih yang tak terhingga dan penghargaan yang setinggi-tingginya penulis ucapkan kepada Prof. Dr. Muhammad Zarlis selaku Pembimbing Utama yang
dengan penuh perhatian telah memberikan dorongan, bimbingan, kritik dan saran sehingga penulis dapat menyelesaikan tesis ini. Terimakasih yang tak terhingga penulis ucapkan kepada Sajadin Sembiring, S.Si, MSc.Comp yang dengan penuh perhatian telah memberikan dorongan, bimbingan, kritik dan saran serta memberikan bahan-bahan yang berkaitan dengan penyusunan tesis ini sehingga penulis dapat menyelesaikan tesis ini dengan baik. Terima kasih yang tak terhingga penulis ucapkan kepada Prof. Dr. Herman Mawengkang, M. Andri Budiman, ST, M.Comp.Sc,MEM dan Amer Sharif, S. SI, M.Kom sebagai Pembanding yang telah memberikan saran, masukan dan arahan yang baik demi penyelesaian tesis ini. Seluruh Staf Pengajar dan Administrasi Program Studi Magister (S2) Teknik Informatika FMIPA yang telah memberikan bantuan dan pelayanan yang baik kepada penulis selama mengikuti perkuliahan. Orang tua tercinta Ayahanda (alm) H. Adwin Adam dan Ibunda Hj. Nurhayati, yang senantiasa memberikan curahan kasih sayang, dukungan, doa yang tiada henti kepada penulis, budi baik ini tidak dapat dibalas hanya diserahkan kepada Allah SWT. Rekan mahasiswa Angkatan Pertama Program Studi Magister (S2) Teknik Informatika FMIPA yang telah banyak membantu penulis selama mengikuti perkuliahan. Kepada semua pihak yang tidak dapat penulis sebutkan satu persatu, terima kasih atas segala bantuan dan dukungan yang diberikan. Sekecil apapun bantuan yang penulis terima turut menghantarkan penulis untuk menyelesaikan pendidikan yang ditempuh selama ini. Dengan segala kekurangan dan kerendahan hati, semoga kiranya Allah SWT membalas segala bantuan dan kebaikan yang telah diberikan. Amin. Medan, Juli 2011 Hikmah Adwin Adam
PEMODELAN ATURAN DALAM MEMPREDIKSI PRESTASI AKADEMIK MAHASISWA POLITEKNIK NEGERI MEDAN DENGAN KERNEL K-MEANS CLUSTERING ABSTRAK Tesis ini mengusulkan sebuah model aturan dalam memprediksi prestasi akademik mahasiswa di Jurusan Teknik Elektro Politeknik Negeri Medan. Hingga saat ini memprediksi prestasi akademik mahasiswa masih menjadi perdebataan yang hangat di institusi-institusi pendidikan tinggi. Faktor-faktor yang berpengaruh secara dominan terhadap prestasi akademik mahasiswa masih belum dapat ditentukan secara pasti. Saat ini manajemen Politeknik Negeri Medan masih menggunakan cara manual dalam memprediksi prestasi akademik mahasiswa. Sehingga sangat mungkin terjadi kesalahan dalam memprediksi prestasi akademik. Hal ini akan berpengaruh terhadap hasil keputusan yang akan diambil oleh pihak manajemen Politeknik Negeri Medan. Untuk itu sangat penting dibuat sebuah model aturan untuk memprediksi prestasi akademik mahasiswa yang dapat digunakan pihak manajemen sebagai sistem pendukung dalam pengambilan keputusan. Data yang digunakan dalam penelitian ini berasal dari database akademik mahasiswa jurusan Teknik Elektro Politeknik Negeri Medan tahun ajaran 2008-2009. Dalam tesis ini algoritma Kernel K-Means Clustering telah digunakan untuk mendapatkan suatu model aturan prediksi prestasi akademik mahasiswa di jurusan Teknik Elektro Politeknik Negeri Medan. Model aturan yang diperoleh menunjukkan bahwa predikat dengan pujian dapat diperoleh jika nilai ratarata teori, nilai rata-rata praktek dan kehadiran semakin tinggi. Katakunci: kernel k-means clustering, model aturan, prediksi
RULE MODELING IN PREDICTING ACADEMIC ACHIEVEMENT OF STUDENTS IN STATE POLYTECHNIC OF MEDAN WITH KERNEL K-MEANS CLUSTERING ABSTRACT This thesis addresses a model of rule to predict students academic achievement in the Department of Electrical Engineering Polytechnic of Medan. Up till now predicting students' academic achievement is still a warm debate in institutions of higher education. Factors that affect predominantly on academic achievement of students still can not be determined exactly. Currently management of polytechnic of Medan is still using manual method in predicting students' academic achievement. So errors in predicting academic achievement are very probable. This will affect the result of decisions taken by the management of the Polytechnic of Medan. Because of this, it is very important to create a model to predict the academic achievement of students that can be used as a management support system in decision making. The data used in this study is based on a database of academic student majoring in Electrical Engineering Polytechnic Medan academic year 2008-2009. In this thesis algorithm Kernel K- Means Clustering has been used to obtain a prediction rule model of academic achievement of students in the Department of Electrical Engineering Polytechnic of Medan. Model rules obtained shows that the predicate with a compliment can be obtained if the average values of theory, practice and attendance are higher. Keywords: Kernel K-Means Clustering, model rules, prediction.
DAFTAR ISI Halaman KATA PENGANTAR ABSTRAK ABSTRACT DAFTAR ISI DAFTAR GAMBAR DAFTAR TABEL DAFTAR LAMPIRAN i iii iv v viii ix x BAB 1 PENDAHULUAN 1 1.1 Latar Belakang 1 1.2 Perumusan Masalah 5 1.3 Batasan Masalah 5 1.4 Tujuan Penelitian 5 1.5 Manfaat Penelitian 6 BAB 2 TINJAUAN PUSTAKA 7 2.1 Pendahuluan 7 2.2 Data Mining : Knowledge Discovery Databases (KDD) 7 2.3 Tahapan Data Mining 9 2.4 Pengelompokan Data Mining 11 2.5 Algoritma Clustering (Clustering Algorithm) 13 2.5.1 Clustering Hirarkhi (Hierarchical Clustering) 16 2.5.2 Clustering Partisional (Partitional Clustering) 18 2.6 Analisis Cluster 20 2.7 Metode Kernel (Kernel Methods) 21 2.7.1 Pendahuluan 21
2.7.2 Fungsi Kernel (Kernel Function) 22 2.7.3 Kernel Trick 24 2.7.4 Algoritma-algoritma Representatif 25 2.7.4.1 Pendahuluan 25 2.7.4.2 Algoritma K-Means Clustering (K-Means Clustering Algorithm) 25 2.7.4.3 Kernel K-Means Clustering 27 2.8 Riset riset Terkait 31 2.9 Persamaan dengan Riset-riset Lain 31 2.10 Perbedaan dengan Riset riset Lain 32 2.11 Kontribusi Riset 32 BAB 3 METODOLOGI PENELITIAN 34 3.1 Pendahuluan 34 3.2 Lokasi dan Waktu Penelitian 34 3.3 Rancangan Penelitian 34 3.4 Pra Pemrosesan Data (Preprocessing Data) 35 3.5 Tools Analisis Rapidminer 5.1 38 3.6 Prosedur Penelitian 40 3.7 Diagram Aktivitas Penelitian 41 BAB 4 HASIL DAN PEMBAHASAN 42 4.1 Pendahuluan 42 4.2 Hasil Transformasi Data 42 4.3 Cluster Model 43 4.4 Cluster Data Berdasarkan Predikat Prestasi Akademik 46 4.5 Analisis Cluster 47 4.5.1 Anggota Cluster (Cluster Membership) Berdasarkan Predikat 47
4.5.2 Interpretasi Cluster 49 BAB 5 KESIMPULAN DAN SARAN 51 5.1 Kesimpulan 51 5.2 Saran 51 DAFTAR PUSTAKA 53 LAMPIRAN
Nomor Gambar DAFTAR GAMBAR J u d u l Halaman 2.1 Data Mining : Proses KDD 9 3.1 Tampilan RapidMiner 5.1 39 3.2 Prosedur Penelitian 40 3.3 Diagram Aktivitas Kerja Penelitian 41 4.1 Cluster Model 44 4.2 Tampilan Membership masing-masing Cluster 45 4.3 Distribusi data antara IPK dengan PRAKTEK, TEORI dan KEHADIRAN 47 4.4 Anggota Cluster berdasarkan Predikat 48
Nomor Tabel DAFTAR TABEL J u d u l Halaman 3.1 Tampilan Data 35 3.2 Kategorisasi IPK 36 3.3 Kategorisasi Nilai Praktek dan Teori 36 3.4 Kategorisasi Prodi 36 3.5 Kategorisasi Agama 37 3.6 Kategorisasi Gender 37 3.7 Kategorisasi Kehadiran 37 3.8 Tampilan Kategorisasi Data 38 4.1 Hasil Transformasi Data 43 4.2 Tabel Cluster Model 45 4.3 Hasil Clustering dalam Data View 46 4.4 Jumlah Anggota Cluster terhadap Predikat 48 4.5 Model Aturan (Model Rule) 49
Nomor Lampiran DAFTAR LAMPIRAN J u d u l Surat Pengumpulan Data Riset Halaman A Data Numerik Lamp A 1 B Data Kategorisasi Lamp B 1 C Gabungan Data Numerik dan Kategorisasi Lamp C 1