Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

dokumen-dokumen yang mirip
Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Membangun Rule Dengan Algoritma Iterative Dichotomiser 3 (Id3) Untuk Penjurusan Siswa SMA

Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru

PERANCANGAN SISTEM PENDUKUNG KEPUTUSAN (SPK) UNTUK MENENTUKAN KELAIKLAUTAN KAPAL ABSTRAK

BAB III METODE PENELITIAN

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE

BAB II TINJAUAN PUSTAKA

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

PERANCANGAN SISTEM PENDUKUNG KEPUTUSAN UNTUK MENENTUKAN KELAIKLAUTAN KAPAL STUDI KASUS DI KANTOR ADMINISTRASI PELABUHAN KLAS UTAMA TJ.

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK)

BAB II TINJAUAN PUSTAKA

PROGRAM BANTU SELEKSI AWAL DOSEN BERPRESTASI MENGGUNAKAN METODE ITERATIVE DICHOTOMISER 3

BAB II LANDASAN TEORI

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.

Bab 2 Tinjauan Pustaka

PERBANDINGAN DECISION TREE

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Suyanto, Artificial Intelligence

BAB I PENDAHULUAN. dan masyarakat, karena melalui pendidikan pengembangan berbagai potensi yang

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

DIAGNOSA KETERLAMBATAN PERKEMBANGAN PADA ANAK BALITA DENGAN ACUAN DENVER II DAN PENGAMBIL KEPUTUSAN DENGAN METODE DECISION TREE BERBASIS JSP

1. Pendahuluan 2. Kajian Pustaka

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2.

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK SELEKSI CALON PENERIMA BEASISWA TINGKAT UNIVERSITAS

BAB 3 METODE PENELITIAN

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

Versi Online tersedia di : JURNAL TECH-E (Online)

Scientific Journal of Informatics Vol. 2, No. 1, Mei 2015

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

Perancangan dan Implementasi Sistem Pendukung Keputusan untuk Jalan Menggunakan Metode ID3 (Studi Kasus BAPPEDA Kota Salatiga) Halaman Judul

Model Penentuan Potensi Status Gizi Bermasalah Menggunakan Decision Tree

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penerimaan Mahasiswa Baru

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

Sistem Klasifikasi Jamur Dengan Algoritma Iterative Dichotomiser 3

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3)

SISTEM KLASIFIKASI PENYEBARAN PENYAKIT MATA DI JAWA BARAT DENGAN ALGORITMA ITERATIVE DICHOTOMISER 3 DAN NAÏVE BAYES CLASSIFIER

PENGEMBANGAN SISTEM PENDUKUNG KEPUTUSAN PENERIMAAN KARYAWAN MENGGUNAKAN METODA POHON KEPUTUSAN ID3

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal

BAB III METODOLOGI PENELITIAN. Dataset

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

BAB III ANALISA DAN DESAIN SISTEM

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

KLASIFIKASI PADA TEXT MINING

TUGAS DATA MINING. Nama Kelompok : I Putu Ari Ratna Pratama ( ) Putu Mega Suryawan ( ) Ida Bagus Surya Winantara ( )

BAB 2 LANDASAN TEORI

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

BAB III METODE PENELITIAN. ini dilaksanakan dari bulan Agustus Oktober 2016.

Oleh Lukman Hariadi

ANALISA KINERJA ALGORITMA C.45 DALAM MEMPREDIKSI PENCAPAIAN PROFIT

PERBANDINGAN 3 METODE DALAM DATA MINING UNTUK PREDIKSI PENERIMA BEASISWA BERDASARKAN PRESTASI DI SMA NEGERI 6 SURAKARTA

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

PENCARIAM JURUSAN SUBANG DENGAN ALGORITMA C 4.5 DAN DATA MINING STMIK SUBANG Timbo Faritcan Parlaungan Siallagan

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE

BAB III METODE PENELITIAN

BAB III ANALISIS DAN DESAIN SISTEM

Decision Tree Penentuan Masa Studi Mahasiswa Prodi Teknik Informatika (Studi Kasus: Fakultas Teknik dan Komputer Universitas Harapan Medan)

BAB 2 TINJAUAN PUSTAKA

Jurnal TELEMATIKA MKOM Vol.4 No.1, Maret 2012 ISSN: X

SATIN Sains dan Teknologi Informasi

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

SISTEM REKOMENDASI PENENTUAN JUDUL SKRIPSI MENGGUNAKAN ALGORITMA DECISION TREE

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa

Penerapan Data Mining dalam Memprediksi Pembelian cat

DATA DAN METODE Data

Algoritma Iterative Dichotomizer 3 (ID3) Pengambilan Keputusan

IMPLEMENTASI ALGORITMA C4.5 UNTUK MENENTUKAN PENERIMA BEASISWA DI STT HARAPAN MEDAN

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

PENERAPAN ALGORITMA ITERATIVE DICHOTOMISER 3 (ID3) UNTUK DIAGNOSA PENYAKIT DEMAM BERDARAH DENGUE

KLASIFIKASI PADA TEXT MINING

BAB I PENDAHULUAN. waktu mendatang. Perkembangan teknologi informasi membuat pencarian. data data sangat mudah bahkan cenderung berlebihan.

BAB I PENDAHULUAN 1.1 Latar Belakang

Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa

DAFTAR ISI PHP... 15

Materi Praktikum Data Mining Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala

BAB 2 LANDASAN TEORI

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse

Algoritma Iterative Dichotomizer 3 ( ID3 ) Pengambilan Keputusan

ADITIAWARMAN. Diajukan sebagai salah satu syarat untuk memperoleh gelar. Sarjana Komputer pada Program Studi Teknik Informatika

Transkripsi:

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Gunadarma Jalan Margonda Raya 100, Depok 16424 Email : 1 winda_widya@staff.gunadarma.ac.id, 2 yulia_eka@staff.gunadarma.ac.id, 3 ayu_ws@staff.gunadarma.ac.id ABSTRAK Jalur kelulusan merupakan hal penentu seorang mahasiswa untuk memperoleh gelar jenjang pendidikan strata satu pada sebuah Perguruan Tinggi. Penelitian ini bertujuan untuk mengetahui pemanfaatan algoritma ID3 dalam penentu jalur kelulusan serta menghasilkan rule atau aturan pada penentuan jalur kelulusan mahasiswa tingkat akhir. Metode yang digunakan adalah Iterative Dichotomiser 3 (ID3) dengan menggunakan alat bantu perangkat lunak Rapidminer. Dari hasil penelitian diperoleh 7 rule atau aturan dalam penentuan jalur kelulusan yaitu 3 rule untuk jalur skipsi dan 4 rule untuk jalur non skripsi dan dapat dikatakan algoritma ID3 dapat dimanfaatkan dalam penentuan jalur kelulusan dengan nilai akurasi antara 0,85-1,00. Kata Kunci: Decision Tree Learning, ID3, Jalur kelulusan PENDAHULUAN Decicion tree learning adalah suatu metode belajar yang sangat populer dan banyak digunakan secara praktis. Metode ini merupakan metode yang berusaha menemukan fungsi-fungsi pendekatan yang bernilai diskrit dan tahan terhadap data-data yang terdapat kesalahan (noise data) serta mampu mempelajari ekspresi-ekspresi disjungtive. Iterative Dichotomiser 3 (ID3), Assistant dan C4.5 merupakan jenis dari decision tree learning. Dalam membangun decision tree learning dibutuhkan evaluasi semua atribut yang ada menggunakan suatu ukuran statistik untuk mengukur efektifitas suatu atribut dalam mengklasifikasikan kumpulan sampel data. Dalam hal ini information gain adalah yang paling banyak digunakan (Suyanto, 2011). Jalur kelulusan merupakan tahap akhir yang harus dilalui seorang mahasiswa dalam menyelesaikan pendidikan di perguruan tinggi. Pada salah satu Perguruan Tinggi Swasta (PTS) di Jakarta, terdapat dua jalur kelulusan yang dapat dilalui, yaitu jalur skripsi dan jalur non-skripsi. Jalur skripsi merupakan proses kelulusan mahasiswa, dimana seorang mahasiswa diwajibkan menyusun karya tulis ilmiah berdasarkan penelitian lapangan dan/atau kepustakaan. Jalur nonskripsi merupakan proses kelulusan mahasiswa, dimana seorang mahasiswa tidak menyusun sebuah karya tulis ilmiah melainkan melalui pengujian secara lisan 3 mata kuliah yang berkaitan dengan bidang studi. Permasalahan yang terjadi adalah ketidaktepatan keputusan yang diambil pihak sekretariat dalam menentukan jalur kelulusan mahasiswa, seperti terjadinya seorang mahasiswa yang harusnya menempuh jalur skripsi tapi dinyatakan jalur non skripsi. Dalam penelitian ini algoritma ID3 akan dibuat sebuah model yang akan menghasilkan sebuah pohon keputusan. Dimana pohon keputusan tersebut akan digunakan untuk menentukan jalur skripsi pada mahasiswa atau jalur non skripsi dalam jalur kelulusan mahasiswa tingkat akhir pada suatu Perguruan Tinggi Swasta. TINJAUAN PUSTAKA Beberapa penelitian terkait decision tree learning diantaranya; penelitian yang dilakukan oleh Rong Cao dan Lizhen Xu menggunakan Algoritma C4.5 untuk menganalisa penjualan. Lee (2010) menggunakan algoritma ID3 untuk penentuan penerima beasiswa. Wibowo (2009) menggunakan algoritma ID3 untuk membantu dalam pengambilan keputusan pada penentuan MVP di sebuah pertandingan bola basket. Salah satu jenis dari decision tree learning adalah algoritma ID3. Algoritma ID3 (Iterative Dichotomiser 3) merupakan algoritma decision tree learning (algoritma pembelajaran pohon keputusan) yang menggunakan strategi pencarian hill-climbing, yaitu Winda Widya Ariestya, Yulia Eka Praptiningsih, Wahyu Supriatin 64

dimulai dari pohon kosong, kemudian secara progresif berusaha menemukan sebuah pohon keputusan yang mengklasifikasikan sampel-sampel data secara akurat tanpa kesalahan. Pertumbuhan cabang-cabang pohon keputusan pada algoritma ID3 dilakukan sampai pohon tersebut mampu mengklasisifikasikan sampel data secara akurat dengan tingkat kebenaran 100 % sesuai dengan data latih (Suyanto, 2011). Adapun sample data yang digunakan oleh ID3 memiliki beberapa syarat menurut Setiawan (Setiawan, 2010), yaitu: 1. Deskripsi atribut-nilai. Atribut yang sama harus mendeskripsikan tiap contoh dan memiliki jumlah nilai yang sudah ditentukan. 2. Kelas yang sudah didefinisikan sebelumnya. Suatu atribut contoh harus sudah didefinisikan, karena mereka tidak dipelajari oleh ID3. 3. Kelas-kelas yang diskrit. Kelas harus digambarkan dengan jelas. Kelas yang kontinu dipecah-pecah menjadi kategori-kategori yang relatif, misalnya saja metal dikategorikan menjadi hard, quite hard, flexible, soft, quite soft. 4. Jumlah contoh (example) yang cukup. Karena pembangkitan induktif digunakan, maka dibutuhkan test case yang cukup untuk membedakan pola yang valid dari peluang suatu kejadian. Algoritma pada metode ini menggunakan konsep dari entropy informasi. Pemilihan atribut dengan menggunakan Information Gain. Pemilihan atribut pada ID3 dilakukan dengan properti statistik, yang disebut dengan information gain. Gain mengukur seberapa baik suatu atribut memisahkan training example ke dalam kelas target. Atribut dengan informasi tertinggi akan dipilih. Dengan tujuan untuk mendefinisikan gain, pertama-tama digunakanlah ide dari teori informasi yang disebut entropy. Entropy mengukur jumlah dari informasi yang ada pada atribut dengan rumus : S adalah ruang (data) sample yang digunakan untuk training. P a adalah jumlah yang bersolusi positif (mendukung) pada data sample untuk kriteria tertentu. P b adalah jumlah yang bersolusi negative (tidak mendukung) pada data sample untuk kriteria tertentu. Dari rumus entropy diatas dapat disimpulkan bahwa definisi entropy (S) adalah jumlah bit yang diperkirakan dibutuhkan untuk dapat mengekstrak suatu kelas (+ atau-) dari sejumlah data acak pada suatu ruang sampel S. Entropy bisa dikatakan sebagai kebutuhan bit untuk meyatakan suatu kelas. Semakin kecil nilai entropy maka semakin baik digunakan dalam mengekstraksi suatu kelas. Pada algoritma ID3 pengurangan entropy disebut dengan informasi gain. Pembagian sample S terhadap atribut A dapat dihitung information gain dengan rumus: Dimana : A : atribut V : suatu nilai yang mungkin untuk atribut A Value (A) : himpunan yang mungkin untuk atribut A Sv : Jumlah sampel untuk nilai v S : jumlah seluruh sampel data Entropy (Sv) : entropy untuk sampel-sampel yang memiliki nilai v Secara ringkas, langkah kerja Algoritma ID3 dapat digambarkan sebagai berikut: 1. Penghitungan Information Gain dari setiap atribut 2. Pemilihan atribut yang memiliki nilai information gain terbesar, 3. Pembentukan simpul yang berisi atribut tersebut, 4. Ulangi proses perhitungan information gain akan terus dilaksanakan sampai semua data telah termasuk dalam kelas yang sama. Atribut yang telah dipilih tidak diikutkan lagi dalam perhitungan nilai information gain. METODE PENELITIAN Metode penelitian dalam paper ini menggunakan metode eksperien dengan tahapan; pengumpulan data, pemodelan, evaluasi hasil dan dokumen eksperimen. Alur tahapan penelitian ini di tunjukkan pada gambar 1 di bawah ini. Mulai Pengumpulan & Preprocessing Data Pemodelan Evaluasi Hasil Dokumen Eksperimen Selesai Gambar 1. Alur Penelitian Volume VIII/No. 1/Mei/2016 65

Tahap pertama yang dilakukan adalah tahap pengumpulan dan preprocessing data, dimana pada tahap ini data mahasiswa dikumpulkan untuk selanjutnya dilakukan preprocessing yaitu penyaringan data mahasiswa dan mengklasifikasikan menjadi beberapa atribut. Tahapan kedua yang dilakukan adalah pemodelan yaitu penerapan algoritma ID3 dari data yang sudah tersedia. Tahapan ketiga adalah evaluasi hasil, yaitu tahapan dimana data yang telah diterapkan pada algoritma ID3 hasilnya di evaluasi tingkat akurasinya dan yang terakhir adalah tahap Dokumen eksperimen. PEMBAHASAN Pengumpulan Dan Preprocessing Data Sumber data utama yang digunakan dalam penelitian ini adalah dataset mahasiswa akuntansi angkatan 2012 pada sebuah PTS dengan format.xlsx. Dataset mahasiswa terdiri dari atribut NPM, Nama, IPK lokal, IPK utama, IPK total, SKS, MK utama, Tgl Lulus PI, Alamat, Telepon, HP, Tgl lahir, proposal dan kelas. Jumlah data pada atribut tersebut berjumlah 632 record, 282 data latih dan 350 data uji. Atribut yang akan digunakan pada penelitian ini adalah IPK total, jumlah SKS, MK Utama, PI, dan Proposal. Beberapa atribut dilakukan proses klasifikasi data, diantaranya IPK total dikelompokkan menjadi 3 kategori (rendah, cukup, tinggi), SKS dikelompokkan menjadi 2 kategori (cukup, kurang), MK Utama dikelompokkan menjadi 2 kategori (memenuhi, belum memenuhi), PI dikelompokkan menjadi 2 kategori (lulus, belum lulus), Proposal dikelompokkan menjadi 2 kategori (diterima, ditolak). Klasifikasi atribut mahasiswa dapat dilihat pada tabel 1 di bawah ini. Tabel 1. Range klaifikasi data mahasiswa Atribut Value Range IPK Total Rendah 0-2,99 Cukup 3,00-3,24 Tinggi 3,25 SKS Cukup 112 Kurang 0-111 MK Utama Memenuhi 11 Belum memenuhi 0-10 PI Lulus - Belum Lulus - Proposal Diterima - Ditolak - Pada tahap preprocessing, data mahasiswa yang dipilih dipastikan layak untuk dilakukan proses pengolahan. Dari data mahasiswa dilakukkan proses transformasi data dan reduksi data. Dalam proses transformasi, data ditransformasikan ke dalam bentuk yang sesuai untuk proses data mining. Selanjutnya data direduksi yaitu dengan melakukan penghilangan atribut yang tidak diperlukan sehingga ukuran dari database menjadi kecil dan hanya menyertakan atribut yang diperlukan dalam proses data mining. Dari dua proses yang telah dilakukan didapatkan hasil seperti tabel 2 berikut ini. IPK UTAMA IPK TOTAL Tabel 2. Tabel data hasil preprocessing SKS MK UTAMA PI PROPOSAL JALUR Rendah Cukup Kurang Belum memenuhi Lulus Ditolak Non skripsi Rendah Tinggi Kurang Belum memenuhi Lulus Ditolak Non skripsi Rendah Tinggi Kurang Belum memenuhi Lulus Ditolak Non skripsi Tinggi Tinggi Cukup Memenuhi Lulus Diterima Skripsi Rendah Cukup Cukup Memenuhi Lulus Ditolak Non skripsi Winda Widya Ariestya, Yulia Eka Praptiningsih, Wahyu Supriatin 66

Tinggi Cukup Cukup Memenuhi Lulus Ditolak Non skripsi Cukup Tinggi Cukup Memenuhi Lulus Diterima Skripsi Tinggi Tinggi Cukup Memenuhi Lulus Diterima Skripsi..................... Pemodelan Pemodelan merupakan tahap yang secara langsung melibatkan teknik data mining, yaitu dengan melakukan pemilihan teknik data mining dan menentukan algoritma yang akan digunakan. Algoritma yang digunakan dalam penelitian ini adalah algoritma. ID3 dengan bantuan tool yang digunakan adalah RapidMiner Studio Basic versi 6.5. Berikut merupakan pengolahan data dengan menggunakan algoritma ID3 pada RapidMiner : Dengan menggunakan pemodelan ID3 seperti gambar 1 di atas, maka di dapatkan hasil dengan pohon keputusan yang terbentuk adalah sebagai berikut. Gambar 2. Model pohon keputusan yang terbentuk Aturan-aturan yang diperoleh dari pohon keputusan tersebut untuk menentukan jalur kelulusan berdasarkan atribut-atribut pada penelitian ini, yaitu: IF PI = belum lulus and proposal = diterima and mk_utama = memenuhi then jalur kelulusan = skripsi Volume VIII/No. 1/Mei/2016 67

IF PI = lulus and SKS = kurang and mk_utama = memenuhi then jalur kelulusan = skripsi IF PI = lulus and SKS = cukup and IPK total = cukup or tinggi then jalur kelulusan = skripsi IF PI = belum lulus and proposal = diterima and mk_utama = belum memenuhi then jalur kelulusan = non skripsi IF PI = belum lulus and proposal = ditolak then jalur kelulusan = non skripsi IF PI = lulus and SKS = cukup and IPK total = rendah then jalur kelulusan = non skripsi IF PI = lulus and SKS = kurang and MK utama = belum memenuhi then jalur kelulusan = non skripsi Gambar 3. Rule atau aturan yang diperoleh Evaluasi Hasil Komparasi nilai accuracy, precision dan recall yang diperoleh dari pengolahan data adalah sebagai berikut. Tabel 3. Nilai accuracy, precision dan recall Information Gain Gini Index Gain Ratio Accuracy 90,00% 100% 85,00% Precision 85,71% 100% 79,76% Recall 93,33% 100% 83,33% Model yang dihasilkan dengan criteria information gain. Gain ratio dan gini index diuji menggunakan metode confusion matrix, terlihat perbandingan nilai accuracy, precision dan recall pada table 3, untuk criteria gain ratio memiliki nilai accuracy, precision dan recall yang paling tinggi, diikuti dengan criteria information gain dan gini index. Dokumentasi Eksperimen a. Mengambil data dari file.xls yang merupakan dataset analisis mahasiswa tingkat akhir, adapun prosesnya dapat dilihat pada gambar 4. Pada gambar 4 di bawah menunjukan data analisis mahasiswa tingkat akhir yang telah di import ke dalam perangkat lunak RapidMiner b. Menentukan id Pada Gambar 5 menunjukan proses pengambilan id sebagai kata kunci utama (primary key) pada data analisis mahasiswa tingkat akhir. c. Penerapan Algoritma ID3 Proses penerapan algoritma dilakukan setelah data diambil dari dataset dan ditentukan id. Gambar 6 menunjukan penerapan algoritma ID3 dalam menentukan jalur kelulusan mahasiswa. Gambar 6 merupakan gambar yang menunjukan penerapan algoritma ID3 dalam menentukan jalur kelulusan. Winda Widya Ariestya, Yulia Eka Praptiningsih, Wahyu Supriatin 68

d. Evaluasi hasil penerapan algoritma Gambar 7 menggambarkan proses mencari nilai akurasi dari pohin keputusan yang telah didapatkan. Gambar 4. Import data dari dataset Gambar 5. Menentukan id Volume VIII/No. 1/Mei/2016 69

Gambar 6. Penerapan algoritma ID3 KESIMPULAN Dalam penelitian ini dilakukan pembuatan model menggunakan algoritma ID3 menggunakan data mahasiswa tingkat akhir pada suatu PTS. Dari hasil pohon keputusan diperoleh 7 rule atau aturan yaitu 3 Gambar 7. Menentukan nilai akurasi aturan untuk jalur skripsi dan 4 aturan untuk jalur non skripsi. Model yang dihasilkan diuji keakuratannya dengan cara mengambil data untuk diuji/validasi dari data cleaning yang telah didapatkan dengan perangkat lunak RapidMiner dan sisanya sebagai data training. Model Winda Widya Ariestya, Yulia Eka Praptiningsih, Wahyu Supriatin 70

yang dihasilkan dapat dikategorikan klasifikasi yang sangat baik karena pada pengukuran kinerja kriteria information gain, gain ratio dan gini index memiliki nilai accuracy antara 0,85-1,00, sehingga dapat dikatakan pohon keputusan dengan algoritma ID3 dapat diterapkan dalam penentuan jalur kelulusan mahasiswa tingkat akhir. DAFTAR PUSTAKA [1] Lee, Michael. 2010. Perancangan Klasifikasi Penerimaan Beasiswa Menggunakan Algoritma ID3 (Iterative Dichtomizer Three) (Studi Kasus : Beasiswa Rutin UKSW Salatiga). Salatiga: FTI UKSW. [2] Rong Cao and Lizhen Xu. 2009. Improved C4.5 Algorithm for the Analysis of Sales. In 2009 Sixth Web Information Systems and Applications Conference. [3] Setiawan, Bambang. 2010. Perancangan Sistem Pendukung Keputusan (Spk) Untuk Menentukan Kelaiklautan Kapal : Studi Kasus Di Kantor Administrasi Pelabuhan Klas Utama Tj. Perak Surabaya. Master Thesis, Institut Teknologi Sepuluh Nopember: Surabaya. [4] Suyanto. 2011. Artificial Intelegent (Cetakan kedua). Informatika: Bandung. [5] Wibowo, Bagus Ari. 2011. Perancangan dan Implementasi Sistem Pendukung Keputusan untuk Jalan Menggunakan Metode ID3 (Studi Kasus BAPPEDA Kota Salatiga). Universitas Kristen Satya Wacana: Jawa Tengah. [6] URL http://akademik.gunadarma.ac.id diakses tanggal 10 Desember 2015. Volume VIII/No. 1/Mei/2016 71