PERBANDINGAN DECISION TREE

dokumen-dokumen yang mirip
Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

Versi Online tersedia di : JURNAL TECH-E (Online)

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

BAB III METODE PENELITIAN

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB III METODE PENELITIAN

Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes (Studi Kasus: Fasilkom Unilak)

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK SELEKSI CALON PENERIMA BEASISWA TINGKAT UNIVERSITAS

SNIPTEK 2014 ISBN:

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

APPLICATION OF DATA MINING ALGORITHM TO RECIPIENT OF MOTORCYCLE INSTALLMENT

Triuli Novianti 1) Abdul Aziz 2) Program Studi D3 Teknik Komputer UMSurabaya, Surabaya ),

KAJIAN PENERAPAN MODEL C45, SUPPORT VECTOR MACHINE (SVM), DAN NEURAL NETWORK DALAM PREDIKSI KENAIKAN KELAS

KAJIAN PERANCANGAN RULE KENAIKAN JABATAN PADA PT. ABC

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE

KAJIAN PENERAPAN ALGORITMA C4.5, NAIVE BAYES, DAN NEURAL NETWORK DALAM PEMILIHAN DOSEN TELADAN: STUDI KASUS UNIVERSITAS INDRAPRASTA

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

KLASIFIKASI PENERIMA BEASISWA KOPERTIS DENGAN MENGGUNAKAN ALGORITMA C.45

ANALISIS PENENTUAN KARYAWAN TERBAIK MENGGUNAKAN METODE ALGORITMA NAIVE BAYES (STUDI KASUS PT. XYZ)

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 3 METODE PENELITIAN

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

ALGORITMA DECISION TREE (C4.5) UNTUK MEMPREDIKSI KEPUASAN MAHASISWA TERHADAP KINERJA DOSEN POLITEKNIK TEDC BANDUNG

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PERANCANGAN SISTEM PAKAR UNTUK MENENTUKAN ALAT KONTRASEPSI MENGGUNAKAN ALGORITMA C4.5

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

KAJIAN ALGORITMA NAÏVE BAYES DALAM PEMILIHAN PENERIMAAN BEASISWA TINGKAT SMA

BAB II LANDASAN TEORI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

Student Clustering Based on Academic Using K-Means Algoritms

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

KOMPARASI ALGORITMA BERBASIS NEURAL NETWORK DALAM MENDETEKSI PENYAKIT HEPATITIS

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012 ISSN: X

SISTEM PENDUKUNG KEPUTUSAN PENEMPATAN JURUSAN MAHASISWA BARU MENGGUNAKAN METODE K-NEAREST NEIGHBOR

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Pemanfaatan Educational Data Mining (EDM)...

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING DALAM PENENTUAN PEMBERIAN PINJAMAN KOPERASI

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

ii

PENERAPAN ALGORITMA C4.5 PADA PROGRAM KLASIFIKASI MAHASISWA DROPOUT. Anik Andriani AMIK BSI Jakarta

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

BAB III METODE PENELITIAN

BAB IV HASIL DAN PEMBAHASAN

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

Prediksi Tingkat Kelulusan Mahasiswa Tepat Waktu Menggunakan Naïve Bayes: Studi Kasus UIN Syarif Hidayatullah Jakarta

PENERAPAN DATA MINING UNTUK MEMPREDIKSI PERILAKU NASABAH KREDIT: STUDI KASUS BPR MARCORINDO PERDANA CIPUTAT

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENERAPAN ALGORTIMA C4.5 UNTUK PENENTUAN KELAYAKAN KREDIT

BAB I PENDAHULUAN 1.1 Latar Belakang

MODEL ALGORITMA K-NEAREST NEIGHBOR

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI

PEMODELAN DAN PROTOTIPE SISTEM INFORMASI UNTUK PREDIKSI PEMBAHARUAN POLIS ASURANSI MOBIL MENGGUNAKAN ALGORITMA C.45

DATA MINING UNTUK REKOMENDASI KERJA BAGI ALUMI DENGAN ALGORITMA GARC(GAIN BASED ASSOCIATION RULE CLASSIFICTION)

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN BERBASIS DECISION TREE

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

PREDIKSI KETEPATAN KELULUSAN MAHASISWA MENGGUNAKAN METODE DECISION TREE BERBASIS PARTICLE SWARM OPTIMATION (PSO)

Penerapan Data Mining dalam Memprediksi Pembelian cat

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

SKRIPSI TI S1 FIK UDINUS 1

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1 Abstract

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.

SILABUS MATAKULIAH. Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA

PENERAPANK-NEAREST NEIGHBOR BERBASIS GENETIC ALGORITHM UNTUKPENENTUAN PEMBERIAN KREDIT

KOMPARASI ALGORITMA NAÏVE BAYES DAN K- NEAREST NEIGHBOR UNTUK DETEKSI KANKER PAYUDARA

PREDIKSI NILAI PROYEK AKHIR MAHASISWA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING

Application Determination Of Credit Feasibility in Sharia Cooperative

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh :

Abidah Elcholiqi, Beta Noranita, Indra Waspada

KAJIAN PENERAPAN ALGORITMAC4.5, NEURAL NETWORK DAN NAÏVE BAYES UNTUK KLASIFIKASI MAHASISWA YANG BERMASALAH DALAM REGISTRASI

Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah

PERBANDINGAN 3 METODE DALAM DATA MINING UNTUK PREDIKSI PENERIMA BEASISWA BERDASARKAN PRESTASI DI SMA NEGERI 6 SURAKARTA

Transkripsi:

84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang) Jejen Jaenudin, Prabowo Pudjo Widodo Unversitas Ibn Khaldun Bogor Jln. K.H Sholeh Iskandar Km. 2 Bogor zen@ft.uika-bogor.ac.id, prabowo_pw@yahoo.com Abstract- This study applied a data mining model of student s grade point classification at the department of information technology on computer science faculty singaperbangsa university karawang. The objective of the study is to comprehend the description of rule models which are obtained to produce a decision based on satisfied and dissatisfied predicates. The decision tree algorithm on this study are the C 4.5 and ID3 algorithms. For data analysis, this study uses supporting software of RapidMiner 5.1. In designing data mining process, this research uses Cross- Industry Standard Process for Data Mining (CRISP-DM) model. The resulting output is C 4.5 decision tree algorithm might support the computer science faculty of singaperbangsa university karawang on decision-making in teaching and learning process as the basic reference for future improvements. Keywords: Data Mining, Decision Tree, Precision, Recall, Accuracy A. Latar Belakang I. PENDAHULUAN Pada saat ini, informasi telah menjadi kebutuhan pokok bagi kehidupan manusia. Hampir di setiap tempat, informasi selalu berguna mendukung aktivitas manusia, demikian halnya dengan usaha-usaha manusia untuk melakukan pengelolaan sumber daya organisasi. Pengelolaan suatu obyek seperti sumber daya organisasi memerlukan informasi untuk suatu analisis perencanaan, pengambilan keputusan, dan pelaksanaan. Ketidaktersediaan informasi akan menyebabkan suatu perencanaan menjadi tidak fokus pada obyek yang ditangani, sehingga akan menyebabkan suatu keputusan atau kebijakan yang diambil tidak dapat menyelesaikan masalahmasalah yang ada. Guna mendapatkan informasi yang akurat dan mudah dalam pengaksesannya, maka informasi dapat dikemas dalam sebuah sistem yang berbasis komputer. Data mining semakin hari semakin penting, karena semakin dibutuhkan dalam menyelesaikan masalah-masalah nyata baik di dalam dunia sains, rekayasa, industri, pemerintahan maupun pendidikan. Apalagi dengan perkembangan teknologi pengumpulan

2015 Jurnal Krea-TIF Vol: 03 No: 02 85 data saat ini, di mana jumlah data yang dikumpulkan per unit waktu semakin bertambah banyak dengan kecepatan yang berlipat. Hal ini menambah volume data yang tersimpan dan harus diolah semakin membesar. Peningkatan volume data yang besar memerlukan metode yang bisa bekerja cepat dan terotomatisasi untuk mengolah dan mengambil kesimpulan dari data tersebut. Dalam penelitian ini mengaplikasikan teknik data mining dengan algoritma C 4.5 dan algoritma iterative dichotomiser 3 (ID3) dalam membuat model aturan decision tree untuk mendukung peningkatan indeks prestasi mahasiswa pada Fasilkom UNSIKA. Model aturan tersebut diperoleh dari pengklasifikasian indeks prestasi mahasiswa berdasarkan predikat puas dan tidak puas. Kemudian membandingkan kedua algoritma tersebut dan memilih mana di antara kedua yang lebih unggul kinerjanya serta diharapkan dapat memberikan kontribusi terhadap Fasilkom UNSIKA sebagai acuan dalam proses kegiatan belajar dan mengajar terhadap bidang ilmu komputer yang akan diambil pada angkatan berikutnya. B. Tujuan Tujuan yang ingin dicapai dengan adanya penelitian ini adalah: 1. Untuk mendapatkan sebuah model aturan dalam mendukung peningkatan indeks prestasi mahasiswa pada Fasilkom UNSIKA. 2. Untuk membantu Fasilkom UNSIKA dalam mengambil tindakan prepentif terhadap atribut dari indeks prestasi mahasiswa yang tidak memuaskan. II. METODOLOGI Seperti yang telah dijelaskan sebelumnya, bahwa metode yang penulis gunakan dalam penelitian ini menggunakan model Cross-Standard Industry for Data Mining (CRISP-DM). Dalam CRISP-DM ini, sebuah proyek data mining memiliki siklus hidup yang terbagi dalam enam fase, yaitu: 1. Fase Pemahaman Bisnis Dari laporan panitia penerimaan mahasiswa baru, Fasilkom UNSIKA dari tahun ke tahun minat calon mahasiswa yang mendaftar terhadap program studi yang ada di Fasilkom selalu bertambah bahkan dari beberapa tahun ini, fakultas ini merupakan satu di antara fakultasfakultas lain yang paling banyak diminati. Dengan semakin banyaknya minat calon mahasiswa maka perlu adanya pembenahan KBM yang lebih bagus lagi, maka Fasikom UNSIKA mempunyai

86 2015 Jurnal Krea-TIF Vol: 03 No: 02 tujuan dan tekad untuk menghasilkan lulusan yang mampu menggunakan komputer dalam proses rekayasa, menguasai teknik dan metode penyelesaian masalah dengan bantuan komputer serta mampu mengembangkan kegiatan penelitian dan mampu meneruskan studi lanjutan dalam hal bidang keilmuan dan teknologi komputer. Oleh karena itu, untuk mempersiapkan itu semua perlu kiranya untuk melihat kemampuan belajar dan kemajuan mahasiswa yang dilakukan pada evaluasi hasil belajar pada setiap semesternya yang kemudian dinyatakan dengan indeks prestasi mahasiswa. Berdasarkan data yang diperoleh penulis dari bagian akademik Fasilkom, sampai saat ini belum diketahui kriteria model decision tree untuk algoritma dalam melakukan pengklasifikasian indeks prestasi mahasiswa untuk mendapatkan hasil aturan yang akurat. Oleh karena itu, maka dalam penelitian ini akan dilakukan pengujian model serta perbandingan antara algoritma decision tree tersebut. 2. Fase Pemahaman Data Untuk menentukan klasifikasi indeks prestasi mahasiswa, enam atribut predictor dan satu atribut class. Atribut- atribut yang menjadi parameter terlihat pada Tabel berikut ini. Tabel 1: Atribut dan Nilai Kategori No Atribut Nilai 1 Algoritma & Pemrograman Lanjutan < 70 2 Metode Numerik < 70 3 Organisasi Komputer < 70 4 Statistik 1 < 70 5 Struktur Data < 70 6 Teknik Pemrograman Terstruktur < 70 3. Fase Pengolahan Data Data yang diperoleh untuk penelitian ini sebanyak 485 data record mahasiswa. Untuk mendapatkan data yang berkualitas, beberapa teknik preprocessing digunakan [6], yaitu: 1. Data validation, untuk mengidentifikasi dan menghapus data yang ganjil (outlier/ noise), data yang tidak konsisten dan data yang tidak lengkap (missing value).

2015 Jurnal Krea-TIF Vol: 03 No: 02 87 2. Data integration and transformation, untuk meningkatkan akurasi dan efisiensi algoritma. Data yang digunakan dalam penulisan ini bernilai kategorikal. 3. Data size reduction and dicretization, untuk memperoleh data set dengan jumlah atribut dan record yang lebih sedikit tetapi bersifat informatif. Di dalam data training yang digunakan dalam penelitian ini, dilakukan seleksi atribut dan penghapusan data duplikasi menggunakan software RapidMiner 5.1. 5. Fase Evaluasi Pada tahap ini dilakukan pengujian terhadap model-model yang dibandingkan untuk mendapatkan informasi model yang paling akurat. Evaluasi dan validasi menggunakan confusion matrix dan kurva ROC. 6. Fase Penyebaran Setelah pembentukan model dilakukan analisa dan pengukuran pada tahap sebelumnya, selanjutnya pada tahap ini diterapkan model yang paling akurat untuk pengklasifikasian indeks prestasi mahasiswa. Setelah dilakukan preprocessing data yang didapat dari data mahasiswa sebanyak 485 record direduksi dengan menghilangkan duplikasi menjadi 211 record. 4. Fase Pemodelan Tahap ini juga dapat disebut tahap learning karena pada tahap ini, data training diklasifikasikan oleh model dan kemudian menghasilkan sejumlah aturan. Pada penelitian ini, pembuatan model menggunakan dua algoritma yaitu algoritma C 4.5 dan ID3. III. HASIL DAN BAHASAN A. Hasil Pada langkah awal dari proses perhitungan algoritma C 4.5 ini adalah menentukan terlebih dahulu atribut sebagai akarnya yaitu Algoritma & Pemrograman 2, Metode Numerik, Organisasi Komputer, Statistik 1, Struktur Data dan Pemrograman Terstruktur. Atribut yang terpilih adalah yang mempunyai nilai gain tertinggi dari nilai gain-gain atribut lainnya, kemudian dijadikan akar dari pohon. Dari hasil yang didapat untuk data training pada lampiran 3, dengan menggunakan tools RapidMiner 5.1

88 2015 Jurnal Krea-TIF Vol: 03 No: 02 model pohon keputusan yang didapatkan dapat dilihat sebagai berikut. Gambar 1 Pohon Keputusan C 4.5 dengan RapidMiner 5.1 Berdasarkan pohon keputusan yang terlihat pada gambar 4.6 di atas, dapat dibentuk aturan-aturan untuk model pohon keputusan dari algoritma C 4.5 sebagai berikut: 1. R1: If Struktur Data AND Algoritma 2 THEN Puas 2. R2: If Struktur Data AND THEN Puas 3. R3: If Struktur Data AND <70 THEN Tidak Puas 4. R4: If Struktur Data AND AND Metode Numerik <70 THEN Tidak Puas 5. R5: If Struktur Data AND Pemrograman Terstruktur <70 THEN Tidak Puas 6. R6: If Struktur Data <70 THEN Tidak Puas

2015 Jurnal Krea-TIF Vol: 03 No: 02 89 Pada langkah selanjutnya dalam membentuk suatu model pohon keputusan dengan menggunakan model algoritma ID3 adalah seperti halnya pada langkah dalam penentuan model algoritma C 4.5. Tahap awal dalam pembuatan suatu model dalam algoritma ID3 ditentukan terlebih dahulu atribut sebagai akarnya yaitu Algoritma & Pemrograman 2, Metode Numerik, Organisasi Komputer, Statistik 1, Struktur Data dan Pemrograman Terstruktur. Atribut yang terpilih adalah yang mempunyai nilai gain tertinggi dari nilai gain-gain atribut yang lainnya, kemudian dijadikan akar dari pohon. Dari hasil yang didapat untuk data training pada lampiran 3 dengan menggunakan tools RapidMiner 5.1, model pohon keputusan untuk algoritma ID3 yang didapatkan dapat dilihat sebagai berikut. Gambar 2 Pohon Keputusan ID3 dengan RapidMiner 5.1

90 2015 Jurnal Krea-TIF Vol: 03 No: 02 Berdasarkan pohon keputusan yang terlihat pada gambar di atas, dapat dibentuk aturan-aturan untuk model pohon keputusan pada algoritma ID3 adalah sebagai berikut: 1. R1: If Struktur Data AND Algoritma 2 AND Organisasi Komputer THEN Puas 2. R2: If Struktur Data AND Algoritma 2 AND Organisasi Komputer <70 AND Statistik 1 THEN Puas 3. R3: If Struktur Data AND Algoritma 2 AND Organisasi Komputer <70 AND Statistik 1 < 70 THEN Puas 4. R4: If Struktur Data AND AND Organisasi Komputer THEN Puas 5. R5: If Struktur Data AND AND Organisasi Komputer <70 THEN Puas 6. R6: If Struktur Data AND <70 AND Organisasi Komputer THEN Tidak Puas 7. R7: If Struktur Data AND <70 AND Organisasi Komputer <70 THEN Tidak Puas 8. R8: If Struktur Data AND AND Metode Numerik <70 THEN Tidak Puas 9. R9: If Struktur Data AND Pemrograman Terstruktur <70 THEN Tidak Puas 10. R10: If Struktur Data <70 AND Statistik 1 AND Organisasi Komputer AND Metode Numerik THEN Puas 11. R11: If Struktur Data <70 AND Statistik 1 AND Organisasi Komputer AND Metode Numerik <70 THEN Tidak Puas 12. R12: If Struktur Data <70 AND Statistik 1 AND Organisasi Komputer <70 THEN Tidak Puas

2015 Jurnal Krea-TIF Vol: 03 No: 02 91 13. R13: If Struktur Data <70 AND Statistik 1 <70 THEN Tidak Puas Proses data mining yang penulis gunakan dalam penelitian ini dilakukan dengan bantuan software data mining yaitu RapidMiner 5.1. Algoritma yang akan diujikan dalam penulisan ini adalah algoritma ID3 dan C4.5 yang berada pada modul classify. Kemudian dilakukan komparasi di antara keduanya dan mengukur metode mana yang paling tinggi tingkat akurasinya dengan menggunakan confussion matrix dan kurva ROC/AUC (Area Under Cover). Hasil dari pengujian model yang telah dikembangkan akan diuji tingkat keakuratannya dengan memasukkan sejumlah data uji (data testing) ke dalam model. Menurut Han dan Kamber (2006), untuk mengukur kekakuratan model dengan baik, data uji seharusnya bukan data yang berasal dari data training. Data uji yang penulis gunakan dalam penelitian ini berasal dari data indeks prestasi mahasiswa Fasilkom UNSIKA tahun 2008-2011. Ada 35 sampel yang diambil untuk mendapatkan tingkat akurasi data dari data keseluruhan dengan jumlah total data sebanyak 211 dengan tingkat kesalahan 2,5 secara acak (simple random sampling). Berdasarkan hasil pengujian tingkat akurasi dari beberapa Tabel confusion matrix di atas, selanjutnya didapatkan hasil perhitungan nilai accuracy, precision dan recall. Nilai accuracy, precision dan recall yang telah dihitung untuk algoritma C 4.5 dan ID3 tersebut dapat dilihat pada Tabel berikut. Tabel 1 Nilai Accuracy, Precision, dan Recall Data Training Data Testing C 4.5 ID3 C 4.5 ID3 Accura cy 96.67 96.11 95.00 91.67 Precisi on 95.00 90.00 96.67 95.00 Recall 85.00 85.00 96.67 86.67 Berdasarkan hasil pengujian tingkat akurasi dari beberapa gambar ROC di atas, selanjutnya didapatkan hasil perhitungan nilai ROC. Nilai ROC yang telah dihitung untuk algoritma C 4.5 dan ID3 tersebut dapat dilihat pada Tabel berikut.

92 2015 Jurnal Krea-TIF Vol: 03 No: 02 Tabel 2: Nilai ROC Confusion Matrix ROC Algoritma Training Testing Training Testing C 4.5 96.67 95.00 0.968 0.950 ID3 96.11 91.67 0.930 0.500 Berikut hasil komparasi nilai accuracy dan nilai ROC yang ditampilkan pada Tabel di bawah sebagai berikut: Tabel 3 Komparasi nilai accuracy dan ROC Selanjutnya berdasarkan kolom ROC pada Tabel 3, pada training algoritma C 4.5 memiliki tingkat ROC paling tinggi, yaitu 0.968 dan pada testing algoritma C 4.5 juga memiliki tingkat ROC yang paling tinggi, yaitu 0.950 termasuk dalam katagori klasifikasi sangat baik. Dengan mengunakan perbandingan data training dengan data testing, yaitu 80 berbanding 20, maka untuk akurasi dapat dilihat dalam Tabel 4 sebagai berikut: Tabel 4 Perbandingan Akurasi Data Training Data Testing Algoritma Confusion Matrix Training Testing Perbandingan Komparasi C 4.5 ID3 C 4.5 ID3 0.968 0.930 0.950 0.500 C 4.5 96.67 95.00 96.34 ID3 96.11 91.67 95.22 Dari hasil pengujian di atas, dengan dilakukan evaluasi. Pada Tabel 3 dengan memperhatikan kolom training pada akurasi, algoritma C 4.5 memiliki tingkat akurasi yang paling tinggi dengan tingkat akurasi 96.67, demikian pula pada kolom testing algoritma C 4.5 memiliki nilai akurasi paling tinggi yaitu 95.00. Oleh karena itu, berdasarkan Tabel 4.25 algoritma C 4.5 memiliki tingkat akurasi yang paling tinggi dibandingkan dengan algortima ID3, sehingga baik digunakan untuk pengklasifikasian indeks prestasi mahasiswa dengan persentase 96.34. B. Implikasi Penelitian Berdasarkan hasil penelitian yang telah dilakukan ini, diharapkan dapat memberikan inspirasi dan masukan bagi pihak Fasilkom UNSIKA untuk dapat memanfaatkan teknik data mining,

2015 Jurnal Krea-TIF Vol: 03 No: 02 93 khususnya metode klasifikasi yang dapat membantu dalam pengambilan keputusan pada indeks prestasi mahasiswa. Dari hasil evaluasi dari perhitungan kedua algoritma di atas, ternyata algoritma C4.5 terbukti paling akurat dibanding algoritma ID3. IV. PENUTUP Dari pengukuran kinerja kedua algoritma yang telah dilakukan berdasarkan jumlah data maka dapat disimpulkan bahwa algoritma C 4.5 memiliki kinerja yang lebih baik. Maka hasil penelitian dari percobaan yang telah dilakukan dapat disimpulkan bahwa algoritma C 4.5 mempunyai kinerja yang lebih baik dibandingkan algoritma ID3. Berdasarkan hasil penelitian yang diperoleh penulis, kiranya perlu pengembangan riset lebih lanjut demi kesempurnaan dan keakurasian data yang telah dikembangkan. Oleh karena itu, untuk melihat tingkat akurasi dari algoritma, akan lebih baik lagi kedua algoritma C 4.5 dan ID3 dibandingkan atau dikomparasi dengan model algoritma lain seperti Support Vector Machine, Naive Bayes, K-NN, Linear Regression ataupun algoritma lainnya. V. DAFTAR PUSTAKA [1] Han, J., & Kamber, M. 2006. Data Mining: Consepts, Models, and Techniques. Fransisco: Morgan kauffman. [2] Kadir, Pengenalan Teknologi Informasi, Andi Offset, Yogyakarta, 2003. [3] Kusrini & Luthfi, E. T. 2009. Algoritma Data Mining. Yogyakarta: Andi Publishing. [4] Larose, D. T. 2005. Discovering Knowledge in Data. New Jersey: John Willey & Sons, inc. [5] Munir, Buku Teks Ilmu Komputer Matematika Diskrit, Informatika, Bandung, 2001. [6] Vercellis, 2009, Business Intelligence: Data Mining and Optimization for Decision making.