PENERAPAN ALGORITMA ID3 DAN C45 DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK MAHASISWA DENGAN PRESTASI AKADEMIK

dokumen-dokumen yang mirip
ANALISIS KETERHUBUNGAN REKAM JEJAK AKADEMIK MAHASISWA TERHADAP PRESTASI BELAJAR MENGGUNAKAN ALGORITMA C4.5 DAN ID3,

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3)

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE

BAB II TINJAUAN PUSTAKA

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

IMPLEMENTASI ALGORITMA C4.5 UNTUK MENENTUKAN PENERIMA BEASISWA DI STT HARAPAN MEDAN

IDENTIFIKASI LAMA STUDI BERDASARKAN KARAKTERISTIK MAHASISWA MENGGUNAKAN ALGORITMA C4.5

Versi Online tersedia di : JURNAL TECH-E (Online)

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

MENGIDENTIFIKASI DATA REKAM MEDIS. (Studi Kasus Penyakit Diabetes Mellitus di Balai Kesehatan Kementerian. Perindustrian, Jakarta) SKRIPSI

APLIKASI DATA MINING DENGAN METODE CLASSIFICATION BERBASIS ALGORITMA C4.5

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

Decision Tree Penentuan Masa Studi Mahasiswa Prodi Teknik Informatika (Studi Kasus: Fakultas Teknik dan Komputer Universitas Harapan Medan)

BAB 1 PENDAHULUAN 1-1

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

BAB 1 PENDAHULUAN Latar Belakang

JURNAL IMPLEMENTASI ALGORITMA C4.5 DALAM PENENTUAN JURUSAN DI SMK PEMUDA PAPAR KEDIRI

BAB 2 LANDASAN TEORI

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman Online di:

Algoritma Iterative Dichotomizer 3 (ID3) Pengambilan Keputusan

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

SISTEM REKOMENDASI PENENTUAN JUDUL SKRIPSI MENGGUNAKAN ALGORITMA DECISION TREE

Educational Data Mining untuk Mengetahui Pola Minat Kerja Mahasiswa

IMPLEMENTASI DATA MINING PADA PENENTUAN JUMLAH SKS MENGGUNAKAN DECISION TREE

Membangun Rule Dengan Algoritma Iterative Dichotomiser 3 (Id3) Untuk Penjurusan Siswa SMA

Algoritma Iterative Dichotomizer 3 ( ID3 ) Pengambilan Keputusan

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

BAB I PENDAHULUAN. 1.1 Latar Belakang

SISTEM KLASIFIKASI PENYEBARAN PENYAKIT MATA DI JAWA BARAT DENGAN ALGORITMA ITERATIVE DICHOTOMISER 3 DAN NAÏVE BAYES CLASSIFIER

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom

Penerapan Algoritma Cart Untuk Memprediksi Status Kelulusan Mahasiswa

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

PENERAPAN ALGORITMA DECISION TREE PADA PENENTUAN KEBERHASILAN AKADEMIK MAHASISWA

PENERAPAN DATA MINING UNTUK KLASIFIKASI PREDIKSI PENYAKIT ISPA (Infeksi Saluran Pernapasan Akut) DENGAN ALGORITMA DECISION TREE (ID3)

KLASIFIKASI PADANG LAMUN DENGAN METODE C4.5 (PEMETAAN DIGITAL DI KABUPATEN BINTAN

PENERAPAN ALGORITMA C4.5 DALAM PENERIMAAN CALON KARYAWAN PT. TELKOM AKSES AREA LAMPUNG BERBASIS WEBSITE

SATIN Sains dan Teknologi Informasi

PEMANFAATAN ALGORITMA ID3 UNTUK KLASIFIKASI IPK MAHASISWA PROGRAM STUDI PENDIDIKAN MATEMATIKA UN PGRI KEDIRI

SISTEM REKOMENDASI PROSES KELULUSAN MAHASISWA BERBASIS ALGORITMA KLASIFIKASI C4.5

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE

BAB 2 TINJAUAN PUSTAKA

BAB II LANDASAN TEORI

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

PERBANDINGAN DECISION TREE

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

IMPLEMENTASI DATA MINING UNTUK MENGETAHUI PERILAKU SESEORANG DALAM MEMBELI ALAT PANAHAN

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN Latar Belakang. Mahasiswa sebagai produk universitas dapat memberikan gambaran

Pemanfaatan Educational Data Mining (EDM)...

KLASIFIKASI MASA STUDI MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA MENGGUNAKAN ALGORITMA C4.5

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa

Research of Science and Informatic

DATA MINING JASA PENGIRIMAN TITIPAN KILAT DI PT CITRA VAN TITIPAN KILAT (TIKI) DENGAN METODE DECISION TREE NASKAH PUBLIKASI

Suyanto, Artificial Intelligence

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa

ANALISA DAN PERANCANGAN PENENTUAN GURU BERPRESTASI MENGGUNAKAN METODE DECISION TREE (Studi kasus SMA XYZ)

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO

APLIKASI PENENTUAN CALON PENDONOR DARAH MENGGUNAKAN METODE ALGORITMA ID3 ( STUDI KASUS PMI KOTA KEDIRI )

SISTEM PENDUKUNG KEPUTUSAN PEMILIHAN PROGRAM STUDI DI UNIVERSITAS DENGAN ALGORITMA C4.5 (STUDI KASUS: UNIVERSITAS MULTIMEDIA NUSANTARA)

PENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI PREDIKAT KEBERHASILAN MAHASISWA DI AMIK TUNAS BANGSA. Abstrak

BAB I PENDAHULUAN. secara manual dari suatu kumpulan data. Defenisi lain data mining adalah sebagai

Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya

ISSN: JURNAL GAUSSIAN, Volume 3, Nomor 4, Tahun 2014, Halaman Online di:

BAB I PENDAHULUAN. Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan informasi yang akurat

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Aplikasi Data Mining untuk Mengukur Tingkat Kelulusan Mahasiswa dengan Metode Apriori

PENCARIAN ASSOCIATION RULES PADA DATA LULUSAN MAHASISWA PERGURUAN TINGGI MENGGUNAKAN ALGORITMA FP-GROWTH SKRIPSI SHARFINA FAZA

PENERAPAN ALGORITMA C4.5 PADA APLIKASI DATA MINING PEMILIHAN BEASISWA BAGI MAHASISWA DI UNIVERSITAS DIPONEGORO

BAB I PENDAHULUAN. dari pemikiran-pemikiran manusia yang semakin maju, hal tersebut dapat. mendukung bagi pengembangan penyebaran informasi.

ABSTRAK. Kata Kunci : Curah Hujan, Levenberg Marquardt, Backpropagation. ABSTRACT

BAB I PENDAHULUAN. dihindarkan dari kehidupan bermasyarakat di dunia tidak terkecuali di

PERBANDINGAN ALGORITMA ID3 DAN C5.0 DALAM INDENTIFIKASI PENJURUSAN SISWA SMA

PROGRAM BANTU SELEKSI AWAL DOSEN BERPRESTASI MENGGUNAKAN METODE ITERATIVE DICHOTOMISER 3

Model Aplikasi Penentuan Jenis Beasiswa Berbasis Algoritma K-NN Termodifikasi

PENGEMBANGAN PERANGKAT LUNAK DIAGNOSA PENYAKIT DIABETES MELLITUS TIPE II BERBASIS TEKNIK KLASIFIKASI DATA ABSTRACT

PENERAPAN ALGORITMA APRIORI DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK MAHASISWA DENGAN PRESTASI AKADEMIK (STUDI KASUS : STAI

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK SELEKSI CALON PENERIMA BEASISWA TINGKAT UNIVERSITAS

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

IMPLEMENTASI DATA MINING DALAM PENERIMAAN KARYAWAN BARU DENGAN METODE DECISION TREE DI BENDESA HOTEL

Klasifikasi. Diadaptasi dari slide Jiawei Han

BAB III ANALISA DAN DESAIN SISTEM

Transkripsi:

PENERAPAN ALGORITMA ID3 DAN C45 DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK MAHASISWA DENGAN PRESTASI AKADEMIK Novyana Arista 1, Martaleli Bettiza, S.Si, M.Sc,. 2, Hendra Kurniawan, S.Kom., M.Sc.Eng. 3 Mahasiswa Program Studi Teknik Informatika Fakultas Teknik UMRAH 1 Dosen Program Studi Teknik Informatika Fakultas Teknik UMRAH 2,3 vee.yands@gmail.com 1, mbettiza@gmail.com 2, nra.kurniawan@gmail.com 3 ABSTRAK Pemanfaatan data yang ada di dalam sistem informasi untuk menunjang kegiatan pengambilan keputusan, tidak cukup hanya mengandalkan data operasional saja, diperlukan suatu analisis data untuk menggali potensi - potensi informasi yang ada yaitu dengan menggunakan teknik data mining. Untuk itu penelitian ini menggunakan dua algoritma C4.5 dan ID3 dan data yang digunakan adalah data awal masuk mahasiswa dan data prestasi akademik mahasiswa Universitas Maritim Raja Ali Haji yaitu mahasiswa angkatan 2012, data awal yang digunakan adalah Jalur pendaftaran, Jurusan, Jenis Kelamin,Pekerjan Orang Tua,Asal Daerah, dan prestasi akademik yang digunakan adalah IPK. Dari hasil yang didapat ID3 memiliki akurasi 87.3403% dengan waktu eksekusi 0.515 detik dan C4.5 memiliki akurasi 70.0348 % dengan waktu eksekusi 0.452 detik. Dari hasil rule dapat dilihat bahwa algoritma C4.5 lebih sederhana dibandingkan dengan algoritma ID3. Kata Kunci : Data mining, Iterative Dichotomiser 3 (ID3), C4.5 ABSTRACT Utilization of existing data in information systems to support decision-making activities, can not just rely on operational data alone, we need a data analysis to explore the potential - the potential of existing information by using data mining techniques. For this study used two ID3 and C4.5 algorithms and data used are the initial data entry of students and student achievement data Maritime University Raja Ali Haji namely student class of 2012, preliminary data used is Line registration, department, Gender, The work Parents' Region of Origin, and academic achievement that is used is the IPK. Of the result optained rule, initial data entry of students and academic achievement have connectedness. Where in ID3 algoritmh has 364 rule obtained while C4.5 algorithm gained 12 rule. Keywords: Data mining, Iterative Dichotomiser 3 (ID3), C4.5

I. PENDAHULUAN 1.1 Latar Belakang Pemanfaatan data yang ada di dalam sistem informasi untuk menunjang kegiatan pengambilan keputusan tidak cukup hanya mengandalkan data operasional saja, diperlukan suatu analisis data untuk menggali potensi - potensi informasi yang ada. Penggunaan teknik data mining diharapkan dapat menganalisa keterhubungan antara data yang tersimpan di dalam gudang data sehingga menjadi informasi yang berharga. Teknik yang dapat digunakan pada implementasi data mining adalah klasifikasi, prediksi, association rule, dan clustering. Klasifikasi merupakan metode yang berfungsi untuk menemukan model yang membedakan kelas data, sehingga klasifikasi dapat memperkirakan label kelas dari suatu objek yang belum diketahui. Salah satu metode klasifikasi yang sering digunakan adalah decision tree (Budi, dkk. 2010). Beberapa algoritma decision tree yang cukup sering digunakan adalah Iterative Dichotomiser 3 (ID3) dan C4.5. Dalam penelitian yang berjudul Aplikasi Data Mining Untuk Mengetahui Hubungan Proses Masuk Dengan Tingkat Kelulusan Mahasiswa oleh Ma ruf (2013) menyarankan untuk pengembangan aplikasi data mining lebih lanjut dari segi algoritma yang digunakan yaitu algoritma C4.5. Berdasarkan penjelasan latar belakang diatas, maka untuk itu peneliti mengangkat judul Penerapan Algoritma ID3 Dan C4.5 Dalam Menemukan Hubungan Data Awal Masuk Mahasiswa Dengan Prestasi Akademik (Studi Kasus: Universitas Maritim Raja Ali Haji). Dimana diharapkan dapat menemukan hubungan data awal masuk mahasiswa dengan prestasi akademik. 1.2 Perumusan Masalah Adapun rumusan masalah yang menjadi fokus penelitian adalah bagaimana menemukan keterhubungan antara data awal masuk mahasiswa dengan prestasi akademik mahasiswa Universitas Maritim Raja Ali Haji dengan penerapan algoritma ID3 dan C4.5. 1.3 Batasan Masalah Mengingat masalah yang di angkat sangat luas, mencakup semua jurusan sehingga perlu di berikan batasan: 1. Penelitian di laksanakan di Universitas Maritim Raja ali Haji. 2. Penelitian ini menggunakan dua algoritma ID3 dan C4.5. 3. Data awal masuk yang digunakan adalah jalur pendaftaran, asal daerah, jurusan, Pekerjaan Orangtua, dan jenis kelamin. 4. Prestasi akademik yang dijadikan Variabel hasil adalah IPK sampai tingkat semester 7. 5. Data awal masuk yang digunakan adalah data awal masuk mahasiswa tahun angkatan 2012. 1.4 Tujuan Penelitian Bagaimana mendapatkan keterhubungan antara data awal masuk mahasiswa dengan prestasi akademik dengan menggunakan algoritma ID3 dan C4.5. 1.5 Manfaat Penelitian Adapun manfaat penelitian ini adalah dapat menemukan hubungan antara data awal masuk mahasiswa dengan prestasi akademik dimana sebelumnya data tersebut selama ini tersembunyi digudang data sehingga menjadi informasi yang berharga dan bermanfaat bagi pihak Universitas Maritim Raja Ali Haji. II. KAJIAN LITERATUR

2.1 Kajian Terdahulu Beberapa penelitian yang terkait dengan penelitian ini yaitu : Pratama (2014) dalam jurnalnya yang berjudul Penerapan Algoritma Apriori Dalam Menemukan Hubungan Data Awal Masuk Mahasiswa Dengan Prestasi Akademik, dalam penelitiannya dilakukan suatu analisis data yang mengimplementasikan salah satu metode dalam classification yaitu apriori, Dengan adanya informasi tersebut akan dapat diketahui potensial masuk mahasiswanya dengan melihat nilai support dan confidence. Arnando (2015) dalam jurnalnya yang berjudul Klasifikasi Padang Lamun Dengan Metode C4.5 Pemetaan Digital Di Kabupaten Bintan dalam penelitiannya membangun sebuah sistem informasi geografis yang mengkasifikasikan jenis-jenis lamun di Kabupaten Bintan, dengan adanya sitem informasi geografis ini berfungsi untuk menampilkan informasi letak lamun beserta jenis-jenisnya.. Kamagi (2014) dalam jurnalnya yang berjudul Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa, bagaimana algoritma C4.5 dapat diimplementasikan untuk memprediksi tingkat kelulusan mahasiswa dengan empat kategori yaitu lulus cepat, lulus tepat, lulus terlambat dan drop out. Adeyemodan dan Adeyeye (2015) dalam jurnalnya yang berjudul Comparative Study of ID3/C4.5 Decision tree and Multilayer Perceptron Algorithms for the Prediction of Typhoid Fever, dalam penelitian ini dilakukan penelitian tentang sample penyakit demam dari beberapa rumah sakit Tujuan utama dari penelitian ini adalah untuk membandingkan akurasi kinerja multilayer perceptron (mlp),artificial neural network dan ID3 (iterative dichotomiser 3), C4.5 (juga dikenal sebagai j48). Peraturan menteri pendidikan dan kebudayaan Republik Indonesia (2014) tentang standar nasional pendidikan tinggi No.49 Pasal 24 mengenai mahasiswa program sarjana. Membagi capaian pembelajaran lulusan yang ditargetkan oleh program studi dengan indeks prestasi kumulatif (IPK) dalam 3 kategori yaitu memuaskan, sangat memuaskan, dan pujian. 2.2 Landasan Teori 1. Decision tree (pohon keputusan) Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat kuat dan terkenal. Sebuah pohon keputusan adalah pohon di mana setiap node cabang merupakan pilihan antara sejumlah alternatif, dan masing-masing simpul daun merupakan keputusan. Pohon keputusan biasanya digunakan untuk memperoleh informasi untuk tujuan pengambilan keputusan. Hasil akhirnya adalah pohon keputusan di mana setiap cabang merupakan skenario/rule yang yang didapatkan dan hasilnya. Beberapa contoh algoritma decision tree yang sering digunakan adalah algoritma ID3 dan algoritma C4.5 (Utari, 2015). Decision Tree berusaha menemukan atribut yang tepat untuk menyelesaikan dan menentukan kelas. Dengan kata lain, atribut yang berada di posisi paling atas dalam decision tree adalah atribut yang paling berpengaruh dalam menentukan hasil prediksi. Oleh karena itu, proses pembuatan model decision tree merupakan proses interative untuk menilai atribut paling berpengaruh yang akan menjadi percabangan dari struktur pohon ini. Percabangan ini juga sering disebut dengan istilah titik percabangan (split point). Proses ini bisa dibagi menjadi dua tahap. Yang pertama adalah menghitung besarnya pengaruh dari setiap atribut. Tahap kedua adalah

memilih atribut terbaik untuk menjadi titik percabangan dari struktur pohon. Untuk tahap pertama ada beberapa matrik yang bisa dipakai untuk menghitung besarnya pengaruh seperti entropy, information gain dan sebagainya (Giovani, dkk. 2011). Setelah mendapatkan nilai entropy, maka dapat diukur efektivitas suatu atribut dalam mengklasifikasikan data yang disebut sebagai gain. Secara matematis, gain dari suatu atribut A, dituliskan sebagai berikut: 2. Algoritma ID3 Algoritma ID3 atau Iterative Dichotomiser 3 (ID3) merupakan sebuah metode yang digunakan untuk membuat pohon keputusan yang telah dikembangkan oleh J. Ross Quinlan sejak tahun 1986 (Munawaroh, 2013). ID3 adalah suatu algoritma matematika yang digunakan untuk menghasilkan suatu pohon keputusan yang mampu mengklasifikasi suatu obyek. ID3 diperkenalkan pertama kali oleh Quinlan (1979). ID3 merepresentasi konsep-konsep dalam bentuk pohon keputusan. Aturan-aturan yang dihasilkan oleh ID3 mempunyai relasi yang hirarkis seperti suatu pohon (mempunyai akar, titik, cabang, dan daun). Beberapa peneliti menyebut struktur model yang dihasilkan ID3 sebagai pohon keputusan (decision tree) sementara peneliti yang lain menyebutnya pohon aturan (rule tree). Information gain atau biasa disebut gain info adalah kriteria pemisahan yang menggunakan pengukuran entropy. Untuk mendapatkan information gain dari suatu atribut dibutuhkan entropy keseluruhan kelas atau entropy (S), secara matematis entropy dirumuskan sebagai berikut : Entropy S = Keterangan : S : Himpunan kelas klasifikasi c : Banyaknya kelas klasifikasi P i : Jumlah sampel pada kelas i Gain S, A = Entropy S vεvalues (A) S v S Entropy (S v ) Keterangan : A : Atribut v : Menyatakan suatu nilai yang mungkin untuk atribut A Values (A) : Himpunan nilai-nilai yang mungkin untuk atribut A S v : Sub-himpunan kelas klasifikasi Entropy(S v ) : Entropy untuk sampelsampel yang memiliki nilai v atribut yang mempunyai nilai information gain paling tinggi dibanding dengan atribut yang lain, dipilih sebagai pemilah. 3. Tahap algoritma C4.5 Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Dalam algoritma C4.5 untuk membangun pohon keputusan hal pertama yang dilakukan yaitu memilih atribut sebagai akar, kemudian dibuat cabang untuk tiap-tiap nilai didalam akar tersebut. Langkah berikutnya yaitu membagi kasus dalam cabang. Kemudian ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama (Utari, 2015). C i=1 P i log 2 P i... Penghitungan nilai entropy (1) untuk mendapatkan nilai gain, terlebih dahulu kita harus mengetahui parameter lain yang mempengaruhi nilai gain, dimana parameter ini sangat diperlukan untuk mendapatkan nilai gain. Parameter tersebut adalah entropy. Parameter ini sering digunakan untuk mengukur heterogenitas suatu kumpulan sampel data. Secara matematis nilai entropy dapat

dihitung dengan menggunakan formula sebagai berikut : Entropy(S) = i=1 P i log 2 P i n Keterangan: n = jumlah nilai yang ada pada atribut target (jumlah kelas) P i = jumlah sampel pada kelas i Jika kita sudah mendapatkan nilai entropy, maka langkah selanjutnya adalah melakukan perhitungan terhadap gain. Berdasarkan perhitungan matematis gain dari suatu atribut A dapat diformulasikan sebagai berikut : Gain S, A = Enteropy S ( n i=1 Keterangan : A : atribut S v S Enteropy(S v)) V : menyatakan suatu nilai yang mungkin untuk atribut A Values (A) : himpunan nilai-nilai yang mungkin untuk atribut A. S v : jumlah sampel untuk nilai v S : jumlah seluruh sampel data Entropy (S) : entropy untuk sampelsampel yang memiliki nilai v Untuk menghitung gain ratio kita perlu ketahui suatu term baru yang disebut split information. Split information dihitung dengan formula sebagai berikut: Split information = n S v log2 S v i=1 S S Selanjutnya gain ratio dihitung dengan cara : Gain ratio = Gain split information III. METODOLOGI PENELITIAN Pada bab ini akan dipaparkan metodologi penelitian yang terdiri dari beberapa sub bab yaitu berupa lokasi dan objek penelitian, metode pengembangan sistem, jenis kebutuhan data, teknik pengumpulan data, alat bantu penelitian dan kerangka pikir penelitian yang digunakan dalam menyelesaikan masalah penelitian. A. Lokasi dan Objek Penelitian Pada penelitian ini, lokasi objek penelitian adalah Universitas Maritim Raja Ali Haji Tanjungpinang. B. Metode Pengembangan Sistem Dalam pembangunan sistem ini, peneliti menggunakan model waterfall dimana tahapan-tahapannya dimulai dari analisis kebutuhan, perancangan dan perancangan sistem, pengkodean,uji, implementasi dan perawatan. analys design code test is Gambar 1. Metode pengembangan sistem Berikut adalah penjelasan dari masing-masing tahapan diatas: 1. Analysis Tahap ini menguraikan kebutuhan aplikasi yang utuh menjadi komponenkomponen aplikasi untuk mengetahui bagaimana aplikasi dibangun. Pada tahap ini, hal yang dilakukan adalah mencari dan mempelajari referensi tentang perbandingan algoritma ID3 dan C4.5 dalam menemukan hubungan data awal masuk mahasiswa dengan prestasi akademik. 2. Design Tahap ini merupakan tahap perancangan sistem. Tahap design ini

terbagi dalam beberapa tahap yaitu design aliran proses data pada sistem ini (flowchart), design tampilan (user interface). 3. Code Tahap ini adalah penerjemahan rancangan dalam tahap desain ke dalam bahasa pemrograman. 4. Test Tahap ini merupakan uji coba terhadap aplikasi yang dibangun. Sehingga analisis hasil implementasi yang didapat dari sistem disesuaikan dengan kebutuhan sistem tersebut. Jika penerapan sistem sudah berjalan dengan baik, maka sistem sudah bisa diimplementasikan. VI. PERANCANGAN DAN IMPLEMENTASI 4.1 Analisa Perancangan Sistem Dalam proses analisis perancangan ini akan dibahas mengenai pengolahan data dan pembentukan model. Untuk itu, perlu dibuatkan sebuah flowchart diagram untuk menggambarkan rancangan sistem. 1. Flowchart diagram algoritma ID3 Gambar 2. Flowchart diagram algoritma ID3

2. Flowchart Diagram Algoritma C4.5 Gambar 4. Form login 2. Form Utama Form ini merupakan implementasi dari perancangan form Utama. Form Utamadapat dilihat pada Gambar 13. Gambar 3. Flowchart diagram algoritma C4.5 3. Implementasi Sistem Berikut adalah implementasi dari rancangan yang telah dibuat sebelumnya: 1. Form login Form ini merupakan implementasi dari perancangan form login. Form login dapat dilihat pada Gambar 12. Gambar 5. Form utama 3. Form informasi pengguna Form ini merupakan implementasi dari perancangan form Informasi Pengguna. Form Informasi Penggunadapat dilihat pada Gambar 14.

Gambar 6. Form data pengguna 4. Form data uji Form I ni merupakan implementasi dari perancangan form Data uji. Form Data uji dapat dilihat pada Gambar 15. Gambar 8.Form algoritma ID3 6. Form data algoritma C4.5 Form ini merupakan implementasi dari perancangan form Algoritma C4.5. Form algoritma C4.5 dapat dilihat pada Gambar 17. Gambar 9. Form algoritma C4.5 V. ANALISA DAN PEMBAHASAN Gambar 7. Form data uji 5. Form data algoritma ID3 Form ini merupakan implementasi dari perancangan form Algoritma ID3. Form algoritma ID3 dapat dilihat pada Gambar 16. Pada bab ini dapat diambil suatu analisa dari pembahasan bab-bab sebelumnya. Analisa yang dilakukan disini adalah bagaimana hasil klasifikasi keterhubungan antara data awal masuk mahasiswa dengan prestasi akademik dari kedua algoritma yang akan dibandingkan setelah ditest dengan Data uji, beserta akurasinya. 5.1 Hasil Dalam penelitian ini menggunakan Delapan ratus enam puluh satu data yang diuji untuk melihat

keterhubungan data awal masuk mahasiswa dengan prestasi akademik. 1. Hasil Klasifikasi Setelah memasukkan semua data yang ada kedalam sistem, yaitu data awal masuk mahasiswa dan prestasi akademik kemudian diuji dengan data yang sama. Untuk melihat berapa data yang memiliki hasil sama atau tidak sama. Untuk tabel klasifikasi hasil algoritma ID3 dan algoritma C4.5 dapat dilihat pada Lampiran 1 dan Lampiran 2. Hasil pencocokan data algoritma ID3 pada Lampiran 1 dapat diketahui bahwa: Jumlah klasifikasi sama = 752 data Jumlah klasifikasi Tidak Sama = 109 data Waktu eksekusi data = 0.515 detik Sehingga akurasinya adalah 752 861 100% = 87.3403% Hasil pencocokan data algoritma C4.5 pada Lampiran 2 dapat diketahui bahwa: Jumlah klasifikasi sama = 603 data Jumlah klasifikasi Tidak Sama = 258 data Waktu eksekusi data = 0.452 detik Sehingga akurasinya adalah 100% = 70.0348% 603 861 2. Hasil rule Dari hasil pembentukan rule dengan jumlah Data uji sebanyak Delapan ratus enam puluh satu data asli didapat beberapa hasil rule dengan menggunakan algoritma ID3 dan C4.5 seperti yg akan dijelaskan pada rule dibawah ini : 1. If (JenisKelamin=L and JalurPendaftaran= UNDANGAN,) Then Sangat Memuaskan 2. If (JenisKelamin=L and JalurPendaftaran= SNMPTN, and AsalDaerah = LUAR KEPRI) Then Sangat Memuaskan 3. If (JenisKelamin=L and JalurPendaftaran= SNMPTN, and AsalDaerah = KOTA BATAM) Then Sangat Memuaskan VI. PENUTUP 1. Kesimpulan Penelitian ini menemukan bahwa root dari algoritma ID3 dan C4.5 adalah Jenis Kelamin. Beberapa aturan yang didapat membuktikan bahwa ada keterhubungan antara data awal masuk mahasiswa dengan prestasi akademik. Dengan menggunakan algoritma ID3 didapat beberapa aturan yaitu : 1. Jika dia laki-laki jurusan TE asal daerah Luar Kepri, Kota Batam, Kab.Bintan prestasi akademik Sangat Memuaskan. 2. Jika dia laki-laki jurusan TI pekerjaan orangtua Wiraswasta prestasi akademik Sangat Memuaskan. 3. Jika dia perempuan jalur pendaftaran Undangan prestasi akademik Sangat Memuaskan. 5. Jika dia perempuan jalur pendaftaran SNMPTN prestasi akademik Sangat Memuaskan. 1. Jika dia perempuan jalur pendaftaran Hinterland prestasi akademik Sangat Memuaskan. Sedangkan aturan yang didapat dari algoritma C4.5 adalah : 1. Jika dia laki-laki jurusan TE jalur pendaftaran Undangan prestasi akademik Sangat Memuaskan.

2. Jika dia perempuan maka prestasi akademik Sangat Memuaskan. 2. Saran Untuk pengembangan Aplikasi Data mining lebih lanjut dari segi algoritma yang digunakan yaitu dapat menggunakan algoritma lain, misal algoritma KNN, algoritma CART ataupun menggunakan fuzzy C means. DAFTAR PUSTAKA Arnando, D.T., 2015, Klasifikasi Padang Lamun Dengan Metode C4.5 (Pemetaan Digital Di Kabupaten Bintan, Skripsi, Universitas Maritim Raja Ali Haji, Tanjungpinang. Adeyemo,O..O., dan Adeyeye.T..O, 2015, Comparative Study of ID3/C4.5 Decision tree and Multilayer Perceptron Algorithms for the Prediction of Typhoid Fever, African Journal of Computing & ICT, Ibadan, Nigeria, 8(1). Kalpesh, A., 2013, Predicting Students Performance using ID3 and C4.5 Classification Algorithms, International Journal of Data Mining & Knowledge Management Process (IJDKP), 3(5). Kusrini dan Lutfi., Taufik. 2009. Algoritma Data Mining. Jakarta: Penerbit Andi. Munawaroh, H., 2013, Perbandingan Algoritma ID3 dan C5.0 dalam Indentifikasi Penjurusan Siswa SMA, Skripsi, Universitas Trunojoyo, Bangkalan. Pratama, H.C., 2014, Penerapan Algoritma Apriori Dalam Menemukan Hubungan Data Awal Masuk Mahasiswa Dengan Prestasi Akademik (Studi Kasus : Stai Miftahul Ulum Tanjungpinang), Skripsi, Universitas Maritim Raja Ali Haji, Tanjungpinang. Giovani, R.A., 2011, Sistem Pendukung Keputusan Prediksi Kecepatan Studi Mahasiswa Menggunakan Metode ID3, Jurnal Buana Informatika,2(2). Kamagi, D.H., 2014, Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa, Skripsi, Universitas Multimedia Nusantara, Tangerang. Tyati, A.E., Ispriyanti, D., dan Hoyyi, A., 2015, Algoritma Iterative Dichotomiser 3 (ID3) Untuk Mengidentifikasi Data Rekam Medis (Studi Kasus Penyakit Diabetes Mellitus Di Balai Kesehatan Kementerian Perindustrian, Jakarta), Jurnal Gaussian, 4(2). Utari, S.P., 2015, Implementasi Metode C4.5 untuk Menentukan Guru Terbaik pada SMK 1 Percut Sei Tuan Medan, Volume. IX No. 3, Medan