MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI PINDAH DENGAN METODE DECISION TREE TESIS AFEN PRANA UTAMA SEMBIRING 097038029/TIF PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013
MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI PINDAH DENGAN METODE DECISION TREE TESIS Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika AFEN PRANA UTAMA SEMBIRING 097038029/TIF PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2013
PERSETUJUAN Judul : MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI PINDAH DENGAN METODE DECISION TREE Kategori : Tesis Nama : Afen Prana Utama Sembiring Nomor Induk Mahasiswa : 097038029 Program Studi : S2 Teknik Informatika Fakultas : ILMUKOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA Komisi Pembimbing : Pembimbing 2 Pembimbing 1 Dr. ZakariasSitumorang Prof. Dr. Muhammad Zarlis Diketahui/disetujui oleh Program Studi S2 Teknik Informatika Ketua Prof. Dr. Muhammad Zarlis NIP : 195707011986011003
PERNYATAAN MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI PINDAH DENGAN METODE DECISION TREE TESIS Saya mengakui bahwa tesis ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya. Medan, 10 Juli 2013 Afen Prana Utama Sembiring 097038029
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS Sebagai sivitas akademika, saya yang bertanda tangan di bawah ini: Nama : AFEN PRANA UTAMA SEMBIRING Nim : 097038029 Program Studi : Magister (S2) TeknikInformatika JenisKaryaIlmiah : TESIS Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty free Right) atas tesis saya yang berjudul: MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI PINDAH DENGAN METODE DECISION TREE Beserta perangkat yang ada (jika diperlukan).dengan Hak Bebas Royalti Non-Eksklusif ini, berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta. Demikian pernyataan ini dibuat dengan sebenarnya. Medan, 10 Juli 2013 Afen Prana Utama Sembiring. 097038029
Telah diuji pada Tanggal :10 Juli 2013 PANITIA PENGUJI TESIS Ketua : Prof. Dr. Muhammad Zarlis. Anggota : 1. Dr. ZakariasSitumorang, M.T. 2. Prof. Dr. Opim Salim Sitompul. 3. Prof. Dr.Herman Mawengkang. 4. Prof. Dr. Tulus, VorDipl.Math., M.Si.
RIWAYAT HIDUP DATA PRIBADI Nama lengkap : AfenPranaUtama Sembiring, S.T., M.Kom. TempatdanTanggalLahir : Medan, 27 April 1974 AlamatRumah : Jl. Sei Batanghari No. 58 A Medan - 20121 Telepon / HP : (061)4155410 / +628126088893 Email : afen366@yahoo.com InstansiTempatBekerja : STMIK-STIE MIKROSKIL Alamat Kantor : Jl. Thamrin No 122, 124, 140 Medan - 20212 Telepon : (061) 4573767 DATA PENDIDIKAN SD : SD NEGERI No. 060831 TAMAT : 1987 SMP : SMP TUNAS KARTIKA-1 TAMAT : 1990 SMU : SMA TUNAS KARTIKA-2 TAMAT : 1993 S1 : STT Mandala Bandung TAMAT : 2001 S2 : Teknik Informatika USU TAMAT : 2013
KATA PENGANTAR Pertama-tama kami panjatkan puji syukur kehadirat Tuhan Yang Maha Esa atas segala limpahan rakhmad dan karunia-nya sehingga Tesis ini dapat diselesaikan melalui bimbingan, arahan dan bantuan yang diberikan berbagai pihak khususnya pembimbing, pembanding, para dosen, khususnya mahasiswa Program Studi S2 Teknik Informatika di Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara. Tesis dengan judul: Model Rule Penyebab Mahasiswa Perguruan Tinggi Pindah Dengan Metode Decision Tree adalah merupakan Tesis dan syarat untuk memperoleh ijazah magister pada Program Studi S2 Teknik Informatika Fakultas Ilmu Komputer dan Teknologi Informasi. Dengan selesainya tesis ini, perkenankanlah penulis mengucapkan terima kasih yang sebesar-besarnya kepada: Ketua STMIK Mikroskil Dr. Mimpin Ginting, M.S, beserta jajarannya yang telah memberikan izin, dukungan dan kesempatan kepada penulis untuk mengikuti pendidikan lanjutan pada Program Studi S2 Teknik Informatika Universitas Sumatera Utara. Rektor, Prof. Dr. dr. Syahril Pasaribu, DTM&H, M,Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada penulis untuk mengikuti dan menyelesaikan pendidikan Program Studi S2 Teknik Informatika. Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, Prof. Dr. Muhammad Zarlis yang juga sebagai Ketua Program Studi S2 Teknik Informatika atas kesempatan yang diberikan kepada penulis menjadi mahasiswa Program Studi S2 Teknik Informatika Fakultas Ilmu Komputer dan Teknologi Informasi. Sekretaris Program Studi S2 Teknik Informatika M. Andri Budiman, ST, M. Comp. Sc, M.EM. beserta seluruh Staff Pengajar dan Staff Administrasi yang telah memberikan bantuan dan pelayanan yang baik selama mengikuti perkuliahan. Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kami ucapkan kepada Prof. Dr. Muhammad Zarlis selaku Pembimbing Utama dan Dr.
ii Zakarias Situmorang, M.T selaku Pembimbing Anggota yang dengan penuh kesabaran membimbing dan memotivasi, serta memberi saran yang berkaitan dengan penyusunan tesis ini sehingga penulis dapat menyelesaikan tesis ini dengan baik. Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kepada Prof. Dr. Herman Mawengkang, Prof. Dr. Opim Salim Sitompul, Prof. Dr. Tulus sebagai pembanding, yang telah memberikan saran, masukan dan arahan yang baik demi penyelesaian tesis ini. Orangtua tercinta Ibunda M Br Ginting, serta Ibu Mertua K Br Sitepu (+) serta semua keluarga yang senantiasa mendoakan, dan memberikan dorongan kepada penulis. Istri tercinta, Helen Morina Ginting, A.Md, beserta anak anakku terkasih Deryl Aditya, Jessica Nadine Regina dan Shelly Christine yang selalu mendoakan, memberikan semangat, dengan kasih dan sabar selama penulis mengikuti pendidikan, budi baik ini tidak dapat dibalas hanya diserahkan kepada Tuhan Yang Maha Esa. Sekali lagi terima kasih. Kepada semua pihak yang tidak dapat penulis sebutkan satu persatu dalam tesis ini, terima kasih atas segala bantuan yang diberikan. Sekecil apapun yang Anda berikan untuk penulis turut menghantarkan penulis untuk menyelesaikan pendidikan yang ditempuh selama ini. Dengan segala kekurangan dan kerendahan hati, semoga kiranya Tuhan Yang Maha Kuasa membalas segala bantuan, kebaikan yang telah diberikan. Medan, 10 Juli 2013 Penulis, Afen Prana Utama Sembiring
iii ABSTRAK Faktor-faktor yang mempengaruhi potensi mahasiswa mengundurkan diri/pindah masih belum dapat diketahui dengan pasti. Data mahasiswa diperoleh dari database mahasiswa STMIK Mikroskil dan hasil survei terhadap mahasiswa tahun ajaran 2011 dan 2012 yang dilakukan melalui website. Algoritma teknik data mining yang digunakan adalah algoritma C 4.5 untuk mendapatkan decision tree sehingga mendapatkan suatu model aturan/rule yang dapat memperlihatkan keterhubungan IPK antara data ekonomi orang tua, dukungan keluarga, fasilitas, motivasi, confidence, dan kualitas pelayanan terhadap faktor-faktor mahasiswa yang diprediksi berpotensi mengundurkan diri/pindah dan memerlukan perhatian ekstra. Model aturan yang diperoleh menunjukkan bahwa keenam variable predictor memberikan kontribusi 80.2 %. Sedangkan variabel terbaik dari prediktor yang digunakan adalah faktor ekonomi yang memberikan kontribusi sebesar 58.3% terhadap mahasiswa yang berpotensi mengundurkan diri/pindah. Key Word : Algoritma C4.5, decision tree, model rule.
iv MODEL RULE THE CAUSE OF COLLEGE STUDENT MOVING WITH A METHOD OF DECISION TREE ABSTRACT Factors that influence students' potential resigned still not be known with certainty. Student data obtained from the database of students STMIK Mikroskil and the results of a survey of student academic year 2011 and 2012 were carried out through the website. Algorithms data mining technique used is the algorithm C 4.5 to get the decision tree so getting a model rule that can demonstrate a grade point average connectedness between economic data of parents, family support, facilities, motivation, confidence, and quality of service to the factors students potentially predictable resigned and require extra attention. Model rules showed that six predictor variables contribute 80.2%. While the best of predictor variables used are economic factors which contributed 58.3% of the students who could potentially resigned. Key Word : Algorithms C 4.5, decision tree, model rule.
v DAFTAR ISI Halaman KATA PENGANTAR i ABSTRAK iii ABSTRACT iv DAFTAR ISI v DAFTAR TABEL viii DAFTAR GAMBAR x DAFTAR LAMPIRAN xi BAB I PENDAHULUAN 1 1.1 Latar Belakang 1 1.2 Perumusan Masalah 2 1.3. Batasan Masalah 2 1.4 Tujuan Penelitian 3 1.5 Manfaat Penelitian 3 BAB II TINJAUAN PUSTAKA 4 2.1 Pengunduran Diri Mahasiswa 4 2.2 Pengertian Data Mining 5 2.3 Pengelompokan Data Mining 10 2.4 Pengertian Decision Tree 12 2.5 Algoritma C 4.5 13 2.6 Ekstraksi Rule dari Decision Tree 20 2.7 Riset- riset Terkait 23 2.8 Persamaan dengan Riset riset lain 23 2.9 Perbedaan dengan Riset-riset lain 24 2.10 Kontribusi Riset 24 BAB III METODE PENELITIAN 26 3.1. Pendahuluan 26 3.2 Lokasi dan Waktu Penelitian 26 3.3 Rancangan Penelitian 26
vi 3.4 Prosedur Pengumpulan Data 27 3.4.1 Mahasiswa Mengundurkan Diri 27 3.4.2 Mahasiswa Berpotensi Mengundurkan Diri 27 3.5 Validitas dan Reabilitas (Keakuratan Data) 30 3.6 Preprocessing Data 30 3.6.1 Preprocessing Database Akademik 30 3.6.2 Preprocessing Data Kuesioner 33 3.7 Alat Analisis Data 34 3.7.1 Paket Statitik Untuk Ilmu Sosial 34 3.7.2 Komunitas Rapid Miner 34 3.8 Instrument Penelitian 35 3.9 Diagram Aktifitas Kerja Penelitian 37 BAB IV HASIL DAN PEMBAHASAN 40 4.1. Pendahuluan 40 4.2 Hasil Transformasi Data Set Pengunduran Diri Mahasiswa 40 4.3 Hasil Transformasi Data Set 42 4.3.1 Hasil Percobaan Sampel Data 42 4.3.2 Hasil Percobaan Descriptive Data 45 4.3.3 Hasil Percobaan Frekuensi Data 46 4.3.3.1 Statistik Frekuensi Faktor Ekonomi 46 4.3.3.2 Statistik Frekuensi Faktor Dukungan Keluarga 47 4.3.3.3 Statistik Frekuensi Faktor Fasilitas Belajar 47 4.3.3.4 Statistik Frekuensi Faktor Motivasi 48 4.3.3.5 Statistik Frekuensi Faktor Confidence 49 4.3.3.6 Statistik Frekuensi Faktor Kualitas Pelayanan 50 4.3.4 Signifikan 51 4.4.4 Hasil Percobaan Decision Tree 53 BAB V KESIMPULAN DAN SARAN 70 5.1. Kesimpulan 70 5.2 Saran 70
vii DAFTAR PUSTAKA 72 LAMPIRAN 74
viii DAFTAR TABEL Halaman Tabel 2.1 Keputusan Bermain Tenis 15 Tabel 2.2 Perhitungan Node 1 17 Tabel 2.3 Perhitungan Node 1.1 18 Tabel 2.4 Perhitungan Node 1.1.2 19 Tabel 3.1 Tampilan Data Set Pertama Pengunduran Diri 27 Tabel 3.2 Tampilan Data Set Pertama Potensi Mengundurkan Diri 28 Tabel 3.3 Tampilan Data Set Kedua 28 Tabel 3.4 Tampilan Data Set Pertama dan Kedua 29 Tabel 3.5 Mahasiswa Pindah 31 Tabel 3.6 Biodata Mahasiswa 32 Tabel 3.7 Sks Lulus Mahasiswa 32 Tabel 3.8 Data Penelitian 33 Tabel 3.9 Data Kuesioner 33 Tabel 4.1 Korelasi Signifikan IPK dan Pendidikan Orang Tua 41 Tabel 4.2 Signifikan dan Reliabilitas Statistik Faktor Ekonomi Orang Tua 42 Tabel 4.3 Signifikan dan Reliabilitas Statistik Faktor Dukungan Keluarga 42 Tabel 4.4 Signifikan dan Reliabilitas Statistik Faktor Fasilitas Belajar 43 Tabel 4.5 Signifikan dan Reliabilitas Statistik Faktor Motivasi 43 Tabel 4.6 Signifikan dan Reliabilitas Statistik Faktor Confidence 43 Tabel 4.7 Signifikan dan Reliabilitas Statistik Faktor Kualitas Pelayanan 44 Tabel 4.8 Signifikan dan Reliabilitas Statistic Data 44 Tabel 4.9 Descriptive Statistik Testing Data 45 Tabel 4.10 Hasil Uji Frekuensi Faktor Ekonomi Orang Tua 46 Tabel 4.11 Hasil Uji Frekuensi Faktor Dukungan Keluarga 47 Tabel 4.12 Hasil Uji Frekuensi Faktor Fasilitas Belajar 48 Tabel 4.13 Hasil Uji Frekuensi Faktor Motivasi 48
ix Tabel 4.14 Hasil Uji Frekuensi Faktor Confidence 49 Tabel 4.15 Hasil Uji Frekuensi Faktor Kualitas Pelayanan 50 Tabel 4.16 Statistik Frekuensi Enam Faktor Pendukung 51 Tabel 4.17 Korelasi Signifikan dari Enam Prediktor Variable Predikat 52 Tabel 4.18 Signifikan Dari Enam Variable Prediktor 53 Tabel 4.19 Keterangan Rule Grafik 54 Tabel 4.20 Keterangan Rule Text dengan Gain Rasio 59 Tabel 4.21 Model Aturan Penyederhanaan Induction Rule 64
x DAFTAR GAMBAR Halaman Gambar 2.1 Bidang Ilmu Data Mining 6 Gambar 2.2 Taksonomi Data Mining 7 Gambar 2.3 Tahap-tahap Data Mining 8 Gambar 2.4 Pohon Keputusan Hasil Perhitungan Node 1 18 Gambar 2.5 Pohon Keputusan Hasil Perhitungan Node 1.1 19 Gambar 2.6 Pohon Keputusan Hasil Perhitungan Node 1.1.2 20 Gambar 3.1 Proses Percobaan 35 Gambar 3.2 Diagram Aktivitas Kerja Penelitian 38 Gambar 4.1 Grafik Decision Tree 53 Gambar 4.2 Model Aturan Text Decision Tree 58 Gambar 4.3 Model Aturan Induction Rule 64 Gambar 4.4 Hubungan Antara Predikat Dengan Ekonomi Orang Tua 66 Gambar 4.5 Hubungan Antara Predikat Dengan Dukungan Keluarga 67 Gambar 4.6 Hubungan Antara Predikat Dengan Fasilitas 67 Gambar 4.7 Hubungan Antara Predikat Dengan Motivasi 68 Gambar 4.8 Hubungan Antara Predikat Confidence 68 Gambar 4.9 Hubungan Antara Predikat Kualitas Pelayanan 69
xi DAFTAR LAMPIRAN Halaman Lampiran A Bentuk Kuesioner Mahasiswa 74 Lampiran B Jawaban Kuesioner Mahasiswa 77 Lampiran C Database Mahasiswa SIPT 78 Lampiran D Output Korelasi Signifikan 82 Lampiran E Output Reliabilitas Keenam Faktor 84 Lampiran F Output Descriptive Statistik Pengujian 96 Lampiran G Output Statistik Frekuensi Enam Faktor 98 Lampiran H Output Regresi 105