ANALISIS DAN PREDIKSI PADA PERILAKU MAHASISWA DIPLOMA UNTUK MELANJUTKAN STUDI KE JENJANG SARJANA MENGGUNAKAN TEKNIK DECISION TREE DAN SUPPORT VEKTOR MACHINE TESIS Oleh HERI SANTOSO 097038017/TINF PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2012
ANALISIS DAN PREDIKSI PADA PERILAKU MAHASISWA DIPLOMA UNTUK MELANJUTKAN STUDI KE JENJANG SARJANA MENGGUNAKAN TEKNIK DECISION TREE DAN SUPPORT VEKTOR MACHINE TESIS Diajukan sebagai salah satu syarat untuk memperoleh gelar Magister Komputer dalam Program Studi Magister Teknik Informatika pada Program Pascasarjana Fakultas Ilmu Komputer dan Teknologi Informasi Oleh HERI SANTOSO 097038017/TINF PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2012
PENGESAHAN TESIS Judul Tesis : ANALISIS DAN PREDIKSI PADA PERI LAKU MAHASISWA DIPLOMA UNTUK MELANJUTKAN STUDI KE JENJANG SARJANA MENGGUNAKAN TEKNIK DECISION TREE DAN SUPPORT VEKTOR MACHINE Nama Mahasiswa : HERI SANTOSO Nomor Induk Mahasiswa : 097038017 Program Studi : MAGISTER TEKNIK INFORMATIKA Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA Menyetujui Komisi Pembimbing Dr. Marwan Ramli Anggota Prof. Dr. Muhammad Zarlis Ketua Ketua Program Studi Dekan Prof. Dr. Muhammad Zarlis Prof. Dr. Muhammad Zarlis NIP : 195707011986011003 NIP : 195707011986011003
PERNYATAAN ORISINALITAS ANALISIS DAN PREDIKSI PADA PERILAKU MAHASISWA DIPLOMA UNTUK MELANJUTKAN STUDI KE JENJANG SARJANA MENGGUNAKAN TEKNIK DECISION TREE DAN SUPPORT VEKTOR MACHINE TESIS Dengan ini saya nyatakan bahwa saya mengakui semua karya tesis ini adalah hasil kerja saya sendiri kecuali kutipan dan ringkasan yang tiap bagiannya telah di jelaskan sumbernya dengan benar. Medan, Juli 2012 HERI SANTOSO. NIM : 097038017
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS Sebagai sivitas akademika, saya yang bertanda tangan di bawah ini: Nama : HERI SANTOSO Nim : 097038017 Program Studi : Magister ( S2) Teknik Informatika Jenis Karya Ilmiah : TESIS Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty free Right) atas Tesis saya yang berjudul: ANALISIS DAN PREDIKSI PADA PERILAKU MAHASISWA DIPLOMA UNTUK MELANJUTKAN STUDI KE JENJANG SARJANA MENGGUNAKAN TEKNIK DECISION TREE DAN SUPPORT VEKTOR MACHINE Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non- Eksklusif ini, berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta. Demikian pernyataan ini dibuat dengan sebenarnya. Medan, Juli 2012 HERI SANTOSO NIM : 097038017
Telah diuji pada Tanggal : 10 Juli 2012 PANITIA PENGUJI TESIS Ketua : Prof. Dr. Muhammad Zarlis Anggota : 1. Prof. Dr. Herman Mawengkang 2. Prof. Dr. Tulus 3. Dr. Zakarias Situmorang 4. Dr. Marwan Ramli
RIWAYAT HIDUP DATA PRIBADI Nama lengkap berikut gelar : Heri Santoso, SKom Tempat dan Tanggal Lahir : Medan, 19 Nopember 1967 Alamat Rumah : Jl. Besitang No. 54 P. Brandan Telepon / HP : 0821 6700 5000 Email : Herisantoso67@gmail.com Instansi Tempat Bekerja : AMIK Tunas Bangsa Alamat Kantor : Jl. Jendral Sudirman Blok A No. 1,2,3 Pematangsiantar Telepon : (0622) 22431 DATA PENDIDIKAN SD : SD NEGERI No. 050747 Tamat : 1980 SMP : SMP BABALAN Tamat : 1983 SMA : SMU NEGERI 1 Tamat : 1986 D3 : AMIK LOGIKA MEDAN Tamat : 2005 Strata-1 : STMIK LOGIKA Medan Tamat : 2006 Strata-2 : FASILKOM - TI USU Tamat : 2012
KATA PENGANTAR Pertama-tama kami panjatkan puji syukur kehadirat Allah SWT Tuhan Yang Maha Esa atas segala limpahan rakhmad dan karunia-nya sehingga Tesis ini dapat diselesaikan melalui bimbingan, arahan dan bantuan yang diberikan berbagai pihak khususnya pembimbing, pembanding, para dosen, teman teman mahasiswa, khususnya mahasiswa Program Studi Magister (S2) Teknik Informatika di Fasilkom-TI. Tesis dengan judul: Analisis dan prediksi pada perilaku mahasiswa diploma untuk melanjutkan studi ke jenjang sarjana menggunakan teknik decision tree dan support vektor machine adalah merupakan Tesis dan syarat untuk memperoleh gelar Magister Komputer dalam Program Studi Magister (S2) Teknik Informatika pada Program Pascasarjana Fasilkom-TI Dengan selesainya tesis ini, perkenankanlah penulis mengucapkan terima kasih yang sebesar-besarnya kepada: Ketua Yayasan Muhammad Nasir AMIK Tunas Bangsa Pematangsiantar H. Maulia Ahmad Ridwan Syah, Direktur AMIK Tunas Bangsa Pematangsiantar Dedi Hartama yang telah memberikan izin, bantuan moril dan materil dan kesempatan kepada penulis untuk mengikuti pendidikan lanjutan pada Program Pascasarjana Fasilkom-TI USU. Rektor, Prof. Dr. dr. Syahril Pasaribu, DTM&H, M,Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada penulis untuk mengikuti dan menyelesaikan pendidikan Program Magister (S2). Dekan Fasilkom-TI, Ketua Program Studi Magister (S2) Teknik Informatika, Prof. Dr. Muhammad Zarlis, Sekretaris
Program Studi Magister (S2) Teknik Informatika M. Andri Budiman, ST, M. Comp. Sc, M.EM beserta seluruh Staff dan Staff Pengajar pada Program Studi Magister (S2) Teknik Informatika Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara, yang telah bersedia membimbing penulis, sehingga dapat menyelesaikan pendidikan tepat pada waktunya. Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kami ucapkan kepada Prof. Dr. Muhammad Zarlis selaku Pembimbing Utama dan Dr. Marwan Ramli selaku Pembimbing Anggota yang dengan penuh kesabaran membimbing, memotivasi, memberikan dukungan moril, kritik dan saran serta memberikan bahan-bahan yang berkaitan dengan penyusunan tesis ini sehingga penulis dapat menyelesaikan tesis ini dengan baik. Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kami ucapkan kepada Prof. Dr. Herman Mawengkang, Prof. Dr. Tulus, dan Dr. Zakarias Situmorang sebagai pembanding, yang telah memberikan saran, masukan dan arahan yang baik demi penyelesaian tesis ini. Orangtua tercinta Ibunda, serta Bapak dan Ibu Mertua dan semua keluarga yang senantiasa mendoakan, dan memberikan dorongan kepada penulis. Istri tercinta, Marina Artha, Amd yang selalu mendoakan, memberikan semangat, dengan kasih, sabar dan bantuan selama penulis mengikuti pendidikan, budi baik ini tidak dapat dibalas hanya diserahkan kepada Allah SWT, Tuhan Yang maha Esa. Sekali lagi terima kasih. Rekan Mahasiswa Angkatan Kedua Program Studi Magister (S2) Teknik Informatika Komputer Fasilkom-TI dan Rekan Sejawat di AMIK Tunas Bangsa Pematangsiantar yang telah banyak membantu penulis selama mengikuti perkuliahan.
Dengan segala kekurangan dan kerendahan hati, semoga kiranya Allah SWT Tuhan Yang Maha Kuasa membalas segala bantuan, kebaikan yang telah diberikan. Medan, Juli 2012 Penulis, Heri Santoso
ANALISIS DAN PREDIKSI PADA PERILAKU MAHASISWA DIPLOMA UNTUK MELANJUTKAN STUDI KE JENJANG SARJANA MENGGUNAKAN TEKNIK DECISION TREE DAN SUPPORT VEKTOR MACHINE ABSTRAK Tesis ini mengusulkan sebuah model prediksi keinginan mahasiswa diploma untuk melanjutkan studi ke jenjang sarjana di perguruan tinggi swasta. Faktor-faktor mana yang lebih dominan yang mempengaruhi keinginan mahasiswa belum dapat diketahui dengan pasti. Data diperoleh dari database Akademik AMIK Tunas Bangsa dan hasil survei terhadap mahasiswa semester IV tahun ajaran 2009 dan 2010. Dalam tesis ini algoritma C 4.5 decision tree diaplikasikan agar mendapatkan suatu model prediksi yang dapat memperlihatkan keinginan mahasiswa diploma melanjutkan kejenjang sarjana dengan jurusan yang sama atau jurusan yang berbeda dan bahkan tidak ada keinginan untuk melanjutkan studinya. Faktor-faktor yang mempengaruhi adalah kepercayaan diri, dukungan orang tua, minat belajar, perilaku belajar dan waktu belajar terhadap mahasiswa. Model prediksi yang diperoleh menunjukkan bahwa variabel terbaik dari prediktor yang digunakan adalah faktor kepercayaan diri yang memberikan kontribusi sebesar 79,8% terhadap keinginan mahasiswa melanjutkan studi ke jenjang sarjana. Key Word : decision tree, model prediksi, prediktor
Prediction Analysis on Diploma Student Behaviour In Pursuing Bachelor Degree Using DecisionTree Technique And Support Vector Machine ABSTRACT This thesis proposes a model to predict the desire of diploma student to pursue education to bachelor degree in private college. The more dominant factors which influence this desire are not known yet. Data was obtained from Academy of Management and Information Tunas Bangsa in Pematangsiantar database and of survey result of 2009 and 2010 fourth semester students.. In this thesis The C 4.5 algorithm decision tree was applied to obtain a prediction model which may indicate the desire of diploma degree students to pursue a bachelor s degree whether in the same department or in a different one, or no desire at all. Influencing factoris include self confidence, parental support, study interest, study behavior, and study duration. The prediction model obtained indicated that the best variable from the predictors used was self confidence which contributed 79,8 % to the desire of students to pursue the bachelor degree. Key Word : decision tree, model prediction, predictor
DAFTAR ISI Halaman KATA PENGANTAR i ABSTRAK ii ABSTRACT iii DAFTAR ISI iv BAB I PENDAHULUAN 1 1.1 Latar Belakang 1 1.2 Perumusan Masalah 4 1.3 Batasan Masalah 4 1.4 Tujuan Penelitian 5 1.5 Manfaat Penelitian 5 BAB II TINJAUAN PUSTAKA 6 2.1 Pengertian Data Mining 6 2.2 Pengelompokan Data Mining 13 2.3 Decision Tree 15 2.4 Algoritma C 4.5 16 2.5 Ekstraksi Rule dari Decision Tree 24 2.6 Support Vektor Machine 25 2.7 Riset- riset Terkait 26 2.8 Kontribusi Riset 27 BAB III METODE PENELITIAN 29 3.1. Pendahuluan 29 3.2 Lokasi dan Waktu Penelitian 29 3.3 Rancangan Penelitian 30 3.4 Prosedur Pengumpulan Data 31 3.5 Validitas dan Reabilitas (Keakuratan Data) 31 3.6 Preprocessing Data 32 3.6.1 Preprocessing Data Kuesioner 32 3.7 Alat Analisis Data 33
3.7.1 Paket Statitik Untuk Ilmu Sosial 33 3.7.2 Komunitas Rapid Miner 34 3.8 Instrument Penelitian 34 3.9 Diagram Aktifitas Kerja Penelitian 35 3.10 Model Decision Tree 36 3.11 Model Support Vektor Machine 38 BAB IV HASIL DAN PEMBAHASAN 40 4.1. Pendahuluan 40 4.2 Hasil Percobaan 40 4.2.1 Hasil Percobaan Sampel Data 40 4.2.2 Hasil Percobaan Descriptive Data 42 4.2.3 Hasil Percobaan Frekuensi Data 43 4.2.3.1 Statistik Frekuensi Faktor Kepercayaan Diri 43 4.2.3.2 Statistik Frekuensi Faktor DukunganOrang Tua 44 4.2.3.3 Statistik Frekuensi Faktor Minat Belajar 44 4.2.4 Signifikan dan Multicollinearity 46 4.2.4.1 Signifikan 46 4.2.4.2 Multicollinearity 48 4.2.5 Hasil Percobaan Decision Tree 49 4.2.6.Validasi Decision Tree 51 4.2.7.Hasil Percobaan Support Vektor Machine 52 BAB V KESIMPULAN DAN SARAN 56 5.1. Kesimpulan 56 5.2 Saran 57 DAFTAR PUSTAKA 58 LAMPIRAN