Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa

dokumen-dokumen yang mirip
PENCARIAM JURUSAN SUBANG DENGAN ALGORITMA C 4.5 DAN DATA MINING STMIK SUBANG Timbo Faritcan Parlaungan Siallagan

Tekno Efisiensi Jurnal Ilmiah KORPRI Kopertis Wilayah IV, Vol 1, No. 1, Mei 2016

Model Penentuan Potensi Status Gizi Bermasalah Menggunakan Decision Tree

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

ALGORITMA DECISION TREE (C4.5) UNTUK MEMPREDIKSI KEPUASAN MAHASISWA TERHADAP KINERJA DOSEN POLITEKNIK TEDC BANDUNG

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

Educational Data Mining untuk Mengetahui Pola Minat Kerja Mahasiswa

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

Versi Online tersedia di : JURNAL TECH-E (Online)

Pemanfaatan Educational Data Mining (EDM)...

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

Penerapan Data Mining dalam Memprediksi Pembelian cat

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

KAJIAN PERANCANGAN RULE KENAIKAN JABATAN PADA PT. ABC

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

PENGAMBILAN KEPUTUSAN UNTUK PENENTUAN BEASISWA TEPAT SASARAN MENGGUNAKAN METODE DECISION TREE DI SMK TARUNA BAKTI KERTOSONO

PREDIKSI KETEPATAN KELULUSAN MAHASISWA MENGGUNAKAN METODE DECISION TREE BERBASIS PARTICLE SWARM OPTIMATION (PSO)

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

PERBANDINGAN DECISION TREE

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK SELEKSI CALON PENERIMA BEASISWA TINGKAT UNIVERSITAS

PENGELOMPOKAN MAHASISWA BERDASARKAN NILAI UJIAN NASIONAL DAN IPK MENGGUNAKAN METODE K-MEANS

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

PENENTUAN TINGKAT KELULUSAN TEPAT WAKTU MAHASISWA STMIK SUBANG MENGGUNAKAN ALGORITMA C4.5

SNIPTEK 2014 ISBN:

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

BAB I PENDAHULUAN. jurusan ditentukan berdasarkan standar kriteria tiap jurusan.

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0

PREDIKSI CALON MAHASISWA BARU MENGUNAKAN METODE KLASIFIKASI DECISION TREE

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN Latar Belakang

Komparasi Algoritma Data Mining Untuk Akurasi Penentuan Beasiswa Kurang Mampu IAIN Syekh Nurjati Cirebon

PENGEMBANGAN PERANGKAT LUNAK DIAGNOSA PENYAKIT DIABETES MELLITUS TIPE II BERBASIS TEKNIK KLASIFIKASI DATA ABSTRACT

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA

Penerapan Algoritma Cart Untuk Memprediksi Status Kelulusan Mahasiswa

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB II LANDASAN TEORI

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

Manfaat Pohon Keputusan

PREDIKSI NILAI PROYEK AKHIR MAHASISWA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING

PENERAPAN K-MEANS CLUSTER UNTUK PENGARUH KECERDASAN EMOSI DAN STRES TERHADAP PRESTASI BELAJAR MAHASISWA

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

BAB I PENDAHULUAN. 1.1 Latar Belakang

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB III METODE PENELITIAN

KAJIAN ALGORITMA NAÏVE BAYES DALAM PEMILIHAN PENERIMAAN BEASISWA TINGKAT SMA

IMPLEMENTASI KLASIFIKASI DATA KEMACETAN ANGSURAN LEASING MOBIL DENGAN ALGORITMA C4.5

BAB 2 LANDASAN TEORI

TINJAUAN PUSTAKA. Definisi Data Mining

DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.

BAB III METODE PENELITIAN

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

KLASIFIKASI TINGKAT PENGETAHUAN IBU DALAM PEMBERIAN ASI EKSLUSIF DENGAN METODE DECISION TREE

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

APPLICATION OF DATA MINING ALGORITHM TO RECIPIENT OF MOTORCYCLE INSTALLMENT

BAB I PENDAHULUAN 1.1 Latar Belakang

Perancangan Pemilihan ISP Dengan Algoritma C 4.5 Studi Kasus STMIK STIKOM BALI

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

BAB II TINJAUAN PUSTAKA

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE

KAJIAN PENERAPAN ALGORITMA C4.5, NAIVE BAYES, DAN NEURAL NETWORK DALAM PEMILIHAN DOSEN TELADAN: STUDI KASUS UNIVERSITAS INDRAPRASTA

Technologia Vol 7, No.3, Juli September OPTIMASI KLASIFIKASI PENILAIAN AKREDITASI LEMBAGA KURSUS MENGGUNAKAN METODE K-NN DAN NAIVE BAYES

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

PREDIKSI NILAI PROYEK AKHIR MAHASISWA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING

Analisa Data Mining Menggunakan Metode Bayes Untuk Mengukur Tingkat Kerusakan Mesin Motor (Studi Kasus Pada AHASS Astra Motor Kudus)

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

ALGORITMA NAÏVE BAYES UNTUK PENENTUAN JURUSAN PADA SISWA MADRASAH ALIYAH

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

Educational Data Mining (EDM) untuk Memprediksi Keterlambatan Masa Studi Mahasiswa Menggunakan Algoritma C4.5

Prediksi Tingkat Kelulusan Mahasiswa Tepat Waktu Menggunakan Naïve Bayes: Studi Kasus UIN Syarif Hidayatullah Jakarta

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN

Pengolahan Data. Algoritma C4.5 Menghitung entropi : Data Training (75%) = 220 data Data Testing (25%) = 73 data

PENERAPAN ALGORITMA ID3 UNTUK PREDIKSI MINAT STUDI MAHASISWA TEKNIK INFORMATIKA PADA UNIVERSITAS DIAN NUSWANTORO. Abstrak

Transkripsi:

Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa Liliana Swastina Program Studi Sistem Informasi Sekolah Tinggi Manajemen Informatika dan Komputer (STMIK) Indonesia Banjarmasin, Indonesia lilisera@gmail.com Abstrak Banyak kasus dijumpai bahwa pemilihan jurusan yang tidak sesuai dengan kemampuan, kepribadian, minat dan bakat dapat mempengaruhi mahasiswa dalam mengikuti perkuliahan. Penggunaan pendekatan algoritma klasifikasi data mining akan diterapkan untuk menentukan jurusan dalam bidang studi yang akan diambil oleh mahasiswa, sehingga mahasiswa tidak salah dalam memilih jurusan yang akan di tempuh selama belajar pada perguruan tinggi. Algoritma C4.5 digunakan untuk menentukan jurusan yang akan diambil oleh mahasiswa sesuai dengan latar belakang, minat dan kemampuannya sendiri. Parameter pemilihan jurusan adalah Indeks Prestasi Kumulatif Semester 1 dan 2. Hasil eksperimen dan evaluasi menunjukan bahwa Algoritma Decision Tree C4.5 akurat diterapkan untuk penentuan kesesuaian jurusan mahasiswa dengan tingkat akurasi 93,31 % dan akurasi rekomendasi jurusan sebesar 82,64%. Kata kunci Klasifikasi, Penentuan Jurusan Mahasiswa, Algoritma C4.5. I. PENDAHULUAN Kecenderungan yang terjadi saat ini, banyak siswa kelas XII yang tidak tahu minatnya dan bakatnya serta akan memilih jurusan apa selepas SMU nanti [1]. Akibat yang buruk terjadi setelah itu, yaitu keengganan belajar dan menurunnya kualitas serta prestasi akademik karena siswa merasa salah dalam memilih jurusan [2]. Banyak kasus dijumpai bahwa pemilihan jurusan yang tidak sesuai dengan kemampuan, kepribadian, minat dan bakat dapat mempengaruhi mahasiswa dalam mengikuti perkuliahan. Dalam beberapa penelitian psikologi pendidikan, minat dan bakat siswa diketahui cukup terkait dengan prestasi akademiknya [3]. Sementara itu, data mining adalah proses yang menggunakan statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar [4]. Data mining disisi lain adalah kegiatan meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari data mining ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan. Untuk penentuan semacam ini, Zhiwu Liu, dkk [5] telah menggunakan datamining untuk melakukannya. Mereka memanfaatkan sifat prediksi yang dimiliki pohon keputusan. Dalam datamining banyak algoritma yang dapat dipakai dalam pembentukan pohon keputusan, antara lain: Algoritma ID3, CART, dan C4.5. Algoritma C4.5 merupakan pengembangan dari algoritma ID3 [6]. Rong Cao dan Lizhen Xu [7] menggunakan Algoritma C4.5 untuk menganalisa penjualan. Sementara itu, dalam bidang pendidikan, Ossy N [8] melakukan penelitian mengenai bagaimana sebuah model fuzzy dapat digunakan juga untuk membuat klasifikasi siswa yang mengikuti suatu kelas dengan kemungkinan berhasil atau gagal. Lebih jauh, Wen-Chih Chang, dkk [9], telah melakukan penelitian untuk mengukur kemampuan belajar siswa. Mereka menggunakan algoritma K-Means untuk membentuk klasterklaster kemampuan. Bahar melakukan penelitian tentang kurang akuratnya proses pemilihan jurusan dengan sistem manual pada SMA, sehingga perlu suatu penggunaan metode untuk mengelompokan siswa dalam proses pemilihan jurusan. Bahar menggunakan algoritma Fuzzy C-Means untuk mengelompokkan data siswa SMA berdasarkan Nilai mata pelajaran inti untuk proses penjurusan [10]. Sumanto, melakukan penelitian tentang kurang akuratnya mahasiswa dalam pemilihan peminatan Tugas Akhir [11] yang sesuai dengan 93

ilmu yang dikuasai oleh mahasiswa sangat berpengaruh dengan nilai tugas akhir dengan menerapkan Fuzzy C-Means untuk memudahkan mahasiswa dalam pemilihan peminatan tugas akhir dengan baik, sesuai dengan kemampuan mahasiswa dengan tingkat akurasi sebesar 82 %. Berdasarkan pertimbangan diatas, pendekatan datamining dengan penerapan algoritma Decision Tree C4.5 akan dilakukan untuk menentukan jurusan yang akan diambil oleh mahasiswa sesuai dengan latar belakang, minat dan kemampuannya sendiri. Dengan demikian peluang untuk sukses dalam studi di perguruaan tinggi semakin besar. Dengan demikian diharapkan algoritma Decision Tree C4.5 mampu menjadi alat pendukung keputusan yang digunakan oleh pihak Perguruan Tinggi dalam proses penentuan jurusan mahasiswa. II. METODOLOGI PENELITIAN Metode yang digunakan dalam paper ini adalah metode penelitian eksperimen, yang terdiri dari: (1) Pengumpulan data, (2) Pengolahan data awal, (3) Model yang diusulkan, (4) Pengujian model dan (5) Evaluasi dan validasi model. A. Pengumpulan Data Data sekunder adalah data yang diperoleh secara tidak langsung bersumber dari dokumentasi, literatur, buku, jurnal dan informasi lainnya yang ada hubungannya dengan masalah yang diteliti. Data sekunder pada penelitian ini adalah : buku-buku, jurnal tentang algoritma Decision Tree C4.5 dan data mining serta data mahasiswa baru STMIK Indonesia Banjarmasin tahun 2008 s.d 2009. Sedangkan Data primer adalah data yang diperoleh dari hasil penelitian. Data primer dalam penelitian ini adalah data hasil uji dengan menggunakan algoritma Decision Tree C4.5 B. Pengolahan Awal Data Data yang didapatkan dari BAA STMIK Indonesia Banjarmasin yaitu data mahasiswa dengan atribut NIM, Nama, Tanggal Lahir, Asal Sekolah, Nilai UN, Jurusan yang dipilih. Data lain yang akan diolah adalah Indeks Prestasi Kumulatif Semester 1 dan Indeks Prestasi Kumulatif Semester 2. C. Model Yang Diusulkan Gartner Group dalam [6] menyebutkan bahwa data mining adalah: 1. Proses menelusuri pengetahuan baru 2. Pola dan tren yang dipilah dari jumlah data yang besar yang disimpan dalam repositori atau tempat penyimpanan dengan menggunakan teknik pengenalan pola serta statistik dan tehnik matematika Di sisi lain, Data mining adalah proses yang menggunakan statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar [4]. Sehingga Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual [12]. Model yang diusulkan untuk menentukan jurusan mahasiswa adalah algoritma Decision Tree C4.5. Model ini akan dibandingkan dengan Model Naïve Bayes. Tahapan Algoritma Decision Tree C4.5: 1) Menyiapkan data training 2) Menentukan akar dari pohon. 3) Hitung nilai Gain: Entropy( S) n i 1 pi *log 2 pi (1) 4) Ulangi langkah ke-2 hingga semua tupel terpartisi n i Gain ( S, A) S * i 1 S S (2) 5) Proses partisi pohon keputusan akan berhenti saat semua tupel dalam node N mendapat kelas yang sama dan atau tidak ada atribut di dalam tupel yang dipartisi lagi dan atau tidak ada tupel di dalam cabang yang kosong Sedangkan Naïve Bayes merupakan salah satu metode machine learning yang menggunakan perhitungan probabilitas. Gambaran proses klasifikasi dengan algoritma Naïve Bayes: GAMBAR 1. Tahapan Proses Klasifikasi dengan S i 94

D. Pengujian Model Algoritma Naïve Bayes Model yang telah dikembangkan dalam penelitian ini akan diterapkan pada data mahasiswa baru STMIK Indonesia Banjarmasin tahun 2008 s.d 2009 melalui suatu simulasi menggunakan RapidMiner. Data Sampel terdiri dari atribut Nama, Jenis Kelamin, Umur, Asal Sekolah, Jurusan Asal Sekolah, Nilai UAN, IPK Semester 1, IPK Semester 2. Sebanyak 90 % data akan digunakan untuk membangun struktur pohon keputusan melalui metode C4.5. Sedangkan 10 % lainnya digunakan sebagai data uji. E. Evaluasi dan Validasi Hasil Evaluasi dilakukan dengan menganalisa hasil klasifikasi. Pengukuran data dilakukan dengan confusion matrix [13] dan ROC Curve (AUC) [14] untuk mengevaluasi hasil dari algoritma Decision Tree C4.5. Confusion matrix merupakan sebuah table yang terdiri dari banyaknya baris data uji yang diprediksi benar dan tidak benar oleh model klasifikasi. Tabel ini diperlukan untuk mengukur kinerja suatu model klasifikasi [15] ACTUAL CLASS TABEL 1. Confusion Matrix PREDICTED CLASS CLASS = 1 CLASS = 0 CLASS = 1 F11 F10 CLASS = 0 F01 F00 Bentuk tabel confusion matrix dapat dilihat pada Tabel 1. Perhitungan akurasi dengan tabel confusion matrix adalah sebagai berikut: Akurasi = (3) Penjelasan tentang pengukuran Precision dan recall dapat di lihat pada Tabel 2 dan perhitungan di berikut: TABEL 2 Perhitungan Precision dan Recall Relevant Not Relevant Retrieved A B Not Retrieved C D terpilih. Precision merupakan probabilitas bahwa sebuah item yang dipilih adalah relevan. Dapat diartikan sebagai kecocokan antara permintaan informasi dengan jawaban terhadap permintaan itu. Precision dihitung dengan rumus: A/(A+B) (4) Sedangkan Recall didefinisikan sebagai rasio dari item relevan yang dipilih terhadap total jumlah item relevan yang tersedia. Recall merupakan probabilitas bahwa suatu item yang relevan akan dipilih. Recall dapat dihitung dengan jumlah rekomendasi yang relevan yang dipilih oleh user dibagi dengan jumlah semua rekomendasi yang relevan baik dipilih maupun rekomendasi yang tidak terpilih. Recall dapat dihitung dengan rumus: A/(A+C) (5) Precision and Recall dapat diberi nilai dalam bentuk angka dengan menggunakan perhitungan presentase (1-100%) atau dengan menggunakan bilangan antara 0-1. Sistem rekomendasi akan dianggap baik jika nilai precision and recallnya tinggi. Sedangkan F1 digunakan untuk representasi dari penggabungan antara Precision dan Recal. F1 dapat dihitung menggunakan rumus dibawah ini: F1 = 2PR / (P + R) (6) Nilai F1 merupakan tingkat akurasi terhadap sistem dalam memberikan rekomendasi yang diinginkan. Sistem akan diaanggap baik jika memiliki tingkat akurasi (F1) yang tinggi. ROC (Receivier Operating Characteristic) Curve adalah grafik antara sensitifitas (true positive rate) pada sumbu Y dengan 1-spesifisitas pada sumbu X (false positive rate), seakan-akan menggambarkan tawar menawar antara sensitivitas dan spesifisitas, yang tujuannya adalah untuk menentukan cut off point pada uji diagnostic yang bersifat kontinyu [14] Evaluasi pengukuran RapidMiner yaitu membandingkan nilai akurasi, nilai precision, dan nilai recall antara algoritma Decision Tree C4.5 dengan Algoritma Naive Bayes. Validasi hasil penelitian dilakukan dengan mengambil sampel secara acak sebanyak 100 data mahasiswa. Data diuji dengan algoritma Decision Tree C4.5 dan Algoritma Naive Bayes, hasilnya akan dibandingkan. Precision didefinisikan sebagai rasio item relevan yang dipilih terhadap semua item yang 95

III. HASIL Uji pertama melalui data sample yaitu data angkatan 2008, Field data NRP, NAMA, Tempat Lahir dan Tanggal Lahir dihilangkan untuk mendapatkan akurasi yang lebih tinggi. Selain itu, Untuk membentuk pohon keputusan maka atribut IPK Semester 1 dan IPK Semester 2 perlu di klasifikasi menjadi: TABEL 3. Klasifikasi Nilai NO IPK SEMESTER KLASIFIKASI 1 IPK>= 3,00 A 2 IPK>= 2,75 B 3 IPK< 2,75 C Menghasilkan performance vector seperti terlihat dalam tabel 4. Menghasilkan akurasi yang di dapat pada uji pertama 93,31%. Nilai precision dan recall berturut-turut: 94,23% dan 92, 45% Pred. Sesuai 8 91 91,92 Class Recall 92,23% 85,85% Dari hasil eksperimen didapatkan hasil sebagaimana tabel 6: TABEL 6 Perbandingan Validasi Hasil Prediksi Kesesuai Jurusan C4.5 (%) Naive Bayes (%) Akurasi 93,31 89,02 Presisi 94,23 91,92 Recall 92,45 85,85 TABEL 4. Perfomance Vector C4.5 Tidak sesuai Sesuai Class Precision Pred. Tidak sesuai 97 8 92,38% Pred. Sesuai 6 98 94,23% Class Recall 94,17% 92,45% Pada perhitungan nilai AUC didapatkan sebesar 0,961 (Gambar 2) dengan demikian maka klasifikasi keakuratan tes diagnostiknya termasuk dalam kategori sangat baik. Sedangkan data yang menghasilkan output tidak sesuai, akan direkomendasikan jurusan baru. Hasil perhitungan rekomendasi tanpa melibatkan field Umur, menunjukan hasil akurasi 76,64%. Sedangkan dengan melibatkan field Umur, didapatkan bentuk pohon (Gambar 3) dengan akurasi 82,64%. (Gambar 4) Hasil Algoritma Decision Tree C4.5 dievaluasi dan dibandingkan dengan Algoritma Naive Bayes. TABEL 5. Perfomance Vector Naïve Bayes Tidak sesuai Sesuai Class Precision Pred. Tidak sesuai 95 15 96,36% GAMBAR 5. Grafik Perbandingan Hasil Prediksi Kesesuaian Jurusan Kemudian pada model dilewatkan data uji untuk mendapatkan hasil Akurasi Rekomendasi. Algoritma Decision Tree C4.5 dievaluasi dan dibandingkan dengan Algoritma Naive Bayes. Hasilnya ditampilkan pada tabel 7: IV. TABEL 7 Perbandingan Hasil Validasi Prediksi Rekomendasi C4.5 (%) Naive Bayes (%) Akurasi 82,64 66,36 KESIMPULAN Dari hail uji, Algoritma Decision Tree C4.5 memprediksi lebih akurat dari pada Algoritma Naive Bayes dalam penentuan kesesuaian jurusan dan rekomendasi jurusan mahasiswa. Dengan demikian dapat disiimpulkan bahwa Algoritma Decision Tree C4.5 akurat diterapkan untuk penentuan kesesuaian jurusan mahasiswa 96

dengan tingkat keakuratan 93,31 % dan akurasi rekomendasi jurusan sebesar 82,64%. Dengan adanya penerapan Decision Tree C4.5 diharapkan mampu memberikan solusi bagi mahasiswa dan dapat membantu STMIK Indonesia dalam menentukan jurusan yang sesuai yang akan ditempuh oleh mahasiswa selama studi sehingga peluang untuk sukses dalam studi di perguruaan tinggi semakin besar Namun terdapat beberapa hal yang perlu penulis sarankan bagi pengembangan penelitian ini antara lain, seperti dilakukan pengujian data dengan menambahkan beberapa kolom yang data yang baru. Dapat juga dilakukan perbandingan dengan metode algoritma lain yang mendukung pengujian data yang ada, sehingga bisa didapat tingkat akurasi yang lebih baik lagi. REFERENSI [1] Indri Savitri, M.Psi, Sekolahkan Anak Tanpa Memaksa, - Lembaga Psikologi Terapan Universitas Indonesia, 2006. [2] Drs. H. Mulyadi, Diagnosis Kesulitan Belajar. Yogyakarta: Nuha Litera, 2010. [3] Musrofi M, Melesatkan Prestasi Akademik Siswa. Yogyakarta: Pedagogia, 2010. [4] Turban Efraim, Aronson Jay E, and Liang, Decision Support Systems and Intelligent Systems, 7th ed.: Prentice Hall, Upper Saddle River, NJ, 2005. [5] Zhiwu Liu and Xiuzhi Zhang, "Prediction and Analysis for Students Marks Based on Decision Tree Algorithm," in 2010 Third International Conference on Intelligent Networks and Intelligent Systems, 2010. [6] Larose Daniel T, Discovering knowledge in data: An Introduction to Data Mining.: Wiley Interscience, 2005. [7] Rong Cao and Lizhen Xu, "Improved C4.5 Algorithm for the Analysis of Sales," in 2009 Sixth Web Information Systems and Applications Conference, 2009. [8] Nykänen Ossi, "Inducing Fuzzy Models for Student Classification," Educational Technology & Society, vol. 9(2), pp. 223-234, 2006. [9] Chang Wen-Chih, "Integrating IRT to Clustering Student s Ability with K-Means," in 2009 Fourth International Conference on Innovative Computing, Information and Control, 2009. [10] Bahar, Penentuan Jurusan Sekolah Menengah Atas Dengan Algoritma Fuzzy C- Means. Semarang, Indonesia, 2011. [11] Sumanto, Penerapan Fuzzy C-Means dalam Pemilihan Peminatan Tugas Akhir. Jakarta, Indonesia, 2010. [12] Kusrini and Emha Taufiq Lutfhfi, Algoritma Data Mining.: ANDI Yogyakarta, 2009. [13] Tan Pang-Ning, Michael Stienbach, and Vivin Kumar, Introduction To Data Mining, J. Taylor, Ed. Stanford, 2005. [14] Florin Gorunescu, Data Mining Concept Model Technique., 2011. [15] Iwan Ariawan. (2011, Juni) Catatan materi kuliah dr Iwan Ariawan, MS. [Online]. http://www.scribd.com/doc/15123416/kurva- Receiver-Operating-Characteristic [16] Meller Thomas and all et, "New Classification Algorithms for Developing Online Program Recommendation Systems," in 2009 International Conference on Mobile, Hybrid, and On-line Learning, 2009. [17] Witten Ian H. and Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2nd ed. San Francisco: Morgan Kaufmann Publishers is an imprint of Elsevier, 2005. [18] Jiawei Han, Data Mining : Concepts and Techniques., 2006. [19] Tom M. Mitchell, Machine Learning, McGraw Hill, Ed., 2005. 97

GAMBAR 2 Curva ROC GAMBAR 3 Pohon keputusan rekomendasi jurusan dengan melibatkan 'Umur' GAMBAR 4 Hasil perhitungan akurasi pohon keputusan rekomendasi jurusan dengan melibatkan 'Umur' 98