ISSN: Candraningsih 1, Bowo Nurhadiyono 2

dokumen-dokumen yang mirip
ALGORITMA C4.5 UNTUK KLASIFIKASI CALON PESERTA LOMBA CERDAS CERMAT SISWA SMP N 1 WINONG TINGKAT KABUPATEN

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

KLASIFIKASI DATA MINING UNTUK MENENTUKAN POTENSI KREDIT MACET PADA KOPERASI SIMPAN PINJAM PRIMKOVERI WALERI MENGGUNAKAN ALGORITMA DECISION TREE C4.

PENERAPAN DATA MINING KLASIFIKASI DENGAN MENGGUNAKAN ALGORITNMA C 4.5 PADA DATA NASABAH KREDIT KOPERASI SIMPAN PINJAM GRAHA MANDIRI TEGAL

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

BAB II TINJAUAN PUSTAKA

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

Penerapan Data Mining dalam Memprediksi Pembelian cat

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB II LANDASAN TEORI

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

BAB II TINJAUAN PUSTAKA

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI

DECISION TREE BERBASIS ALGORITMA UNTUK PENGAMBILAN KEPUTUSAN

Implementasi Data Mining Menggunakan Algoritma C4.5 Untuk Klasifikasi Penjurusan Siswa Pada SMA Negeri 2 Pemalang

Kata kunci Prediksi Ketepatan Masa Studi, Sistem Pakar, Case Based Reasoning, Algoritma C4.5

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK SELEKSI CALON PENERIMA BEASISWA TINGKAT UNIVERSITAS

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Prediksi Kelayakan Masuk Penjurusan Ipa Siswa Sekolah Menengah Atas Menggunakan C4.5 (Studi Kasus: Sma Tarakanita Gading Serpong)

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB III METODE PENELITIAN

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

EKSPLORA INFORMATIKA 127

SISTEM REKOMENDASI PENENTUAN JUDUL SKRIPSI MENGGUNAKAN ALGORITMA DECISION TREE

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal

Versi Online tersedia di : JURNAL TECH-E (Online)

Algoritma Data Mining (2) Tugas Klasifikasi

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

TINJAUAN PUSTAKA. Definisi Data Mining

IMPLEMENTASI ALGORITMA C4.5 UNTUK MENENTUKAN PENERIMA BEASISWA DI STT HARAPAN MEDAN

PERBANDINGAN DECISION TREE

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

BAB 2 LANDASAN TEORI

BAB 2 TINJAUAN PUSTAKA

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK)

BAB I PENDAHULUAN. jurusan ditentukan berdasarkan standar kriteria tiap jurusan.

IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN:

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

BAB II TINJAUAN PUSTAKA

ALGORITMA DECISION TREE (C4.5) UNTUK MEMPREDIKSI KEPUASAN MAHASISWA TERHADAP KINERJA DOSEN POLITEKNIK TEDC BANDUNG

PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA

Penerapan Algoritma C4.5 untuk Memprediksi Penerimaan Calon Pegawai Baru di PT WISE

BAB II LANDASAN TEORI

PROGRAM BANTU SELEKSI AWAL DOSEN BERPRESTASI MENGGUNAKAN METODE ITERATIVE DICHOTOMISER 3

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

PROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK

JURNAL IMPLEMENTASI ALGORITMA C4.5 DALAM PENENTUAN JURUSAN DI SMK PEMUDA PAPAR KEDIRI

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PENERIMAAN PESERTA DIDIK SMA NEGERI 2 SEMARANG MENGGUNAKAN METODE REGRESI LOGISTIK ORDINAL

SNIPTEK 2014 ISBN:

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian

BAB II TINJAUAN PUSTAKA DAN LANDASAR TEORI

KOMPARASI DATA MINING UNTUK MEMPREDIKSI MINAT KLIEN DALAM MEMILIH PRODUK ASURANSI PENDIDIKAN (Studi pada PT. AJB Bumiputera 1912 Karanganyar)

BAB II TINJAUAN PUSTAKA

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

Pemanfaatan Educational Data Mining (EDM)...

ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI


Research of Science and Informatic

OPTIMASI DECISION TREE MENGGUNAKAN PARTICLE SWARM OPTIMIZATION PADA DATA SISWA PUTUS SEKOLAH

IDENTIFIKASI LAMA STUDI BERDASARKAN KARAKTERISTIK MAHASISWA MENGGUNAKAN ALGORITMA C4.5

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

ANALISIS KETERHUBUNGAN REKAM JEJAK AKADEMIK MAHASISWA TERHADAP PRESTASI BELAJAR MENGGUNAKAN ALGORITMA C4.5 DAN ID3,


Perbandingan Kinerja Jaringan Syaraf Tiruan Dan Fuzzy Inference System Untuk Prediksi Prestasi Peserta Didik

BAB II LANDASAN TEORI

PENERAPAN ALGORITMA ID3 UNTUK PREDIKSI MINAT STUDI MAHASISWA TEKNIK INFORMATIKA PADA UNIVERSITAS DIAN NUSWANTORO. Abstrak

ii

PERBANDINGAN ALGORITMA APRIORI DAN ALGORITMA FP-GROWTH UNTUK PEREKOMENDASI PADA TRANSAKSI PEMINJAMAN BUKU DI PERPUSTAKAAN UNIVERSITAS DIAN NUSWANTORO

BAB 2 TINJAUAN PUSTAKA

BAB III METODE PENELITIAN

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

Transkripsi:

8 Klasifikasi Calon Peserta Lomba Cerdas Cermat Siswa Menggunakan Algoritma C4.5 Classification for Candidate of Student Competition Participants Using C4.5 Algorithm Candraningsih, Bowo Nurhadiyono 2,2 Jurusan Teknik Informatika, Universitas Dian Nuswantoro Semarang Jl. Imam Bonjol 205-207 Semarang 503 e-mail: chandraningsih604@gmail.com, 2 bowo.nurhadiono@dsn.dinus.ac.id Abstrak Sekolah merupakan lembaga penyelenggara pendidikan akademik bagi siswa. Dalam proses pembelajaran di sekolah dalam jangka waktu tertentu maka akan terkumpul sejumlah data yang besar yang nantinya akan menyulitkan pihak sekolah untuk mengolah data tersebut sehingga berpengaruh dalam peningkatan mutu siswa yang dihasilkan, dan dalam skala besar akan menurunkan prestasi sekolah dilihat dari sedikitnya prestasi dari siswa yang mendapatkan gelar juara dalam sebuah perlombaan. Salah satu faktor penyebab menurunnya prestasi akademik SMP N Winong adalah banyaknya data dan kriteria yang digunakan dalam proses seleksi calon peserta lomba cerdas cermat sehingga pihak sekolah kurang tepat dalam mengirimkan perwakilan lomba. Data mining dapat menggali informasi dari data yang jumlahnya sangat besar dengan metode- metode tertentu untuk mendapat informasi atau ilmu pengetahuan yang baru. Dengan metode klasifikasi yang digunakan dapat diketahui apakah siswa layak menjadi calon peserta lomba atau tidak. Oleh karena itu data mining bisa digunakan untuk mengklasifikasikan data calon peserta lomba sebagai sarana untuk menerapkan algoritma C4.5 dalam proses seleksi calon peserta lomba cerdas cermat siswa SMP N Winong tingkat kabupaten. Hasil klasifikasi dari algoritma C4.5 untuk mengetahui tingkat akurasi dalam membuat klasifikasi calon peserta lomba cerdas cermat. Hasil evaluasi diperoleh bahwa algoritma C4.5 memiliki akurasi 95,45%. Rule yang diperoleh dari klasifikasi dengan algoritma C4.5 jika diterapkan dalam data baru diperoleh hasil validasi dengan tingkat akurasi 90,63%. Kata kunci data mining, klasifikasi, algoritma C4.5, confussion matrik, akurasi, lomba cerdas cermat. Abstract School was an institution of academic education administrator for students. The learning process in schools within a certain time period to produce a large amount of data would be difficult for the school for processing such data so that the effect of improving the quality of students produced. On a large scale would lower the school achievement seen from at least the achievements of students who obtain title in student competitions. One of the factors causing the decline in academic achievement at SMP N Winong was the number of data and criteria used in the selection process of candidates for the competition so that the schools are having difficulty to select participant in the student competition. Data mining could digged up information from very large amounts of data with specific methods to obtain information or a new science. Through the classification method used could be known whether the student deserves to be prospective participant or not. Therefore, data mining could be used to classify the data of prospective participants as a means to implement the algorithm C4.5 in the selection process of student competition candidate of SMP N Winong district level. Results of algorithm

IJCCS ISSN: 978-520 9 C4.5 classification used to determine the level of accuracy in classifying candidates. Results of the evaluation showed that the C4.5 algorithm had an accuracy of 95.45%. Rule derived from C4.5 classification algorithm if implemented in the new data obtained validation results with an accuracy rate of 90.63%. Keywords data mining, classification, C4.5 algorithm, confussion matrix, accuracy, student competition.. PENDAHULUAN Sekolah merupakan lembaga penyelenggara pendidikan akademik bagi siswa. Dalam proses pembelajaran di sekolah dalam jangka waktu tertentu, maka akan terkumpul sejumlah data yang sangat besar. Berangkat dari banyaknya data yang akan diolah mengakibatkan pihak sekolah kesulitan untuk menentukan kriteria yang akan diolah. Kumpulan data tersebut akan diproses lebih lanjut dengan data mining untuk memperoleh pola baru yang dapat digunakan untuk meningkatkan efektifitas dalam proses pembelajaran. Data mining merupakan proses yang menggunakan teknik statistic, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar []. Istilah data mining memiliki hakikat sebagai disipin ilmu yang tujuan utamanya adalah untuk menemukan, menggali, atau menambang pengetahuan dari data atau informasi yang kita miliki [2]. Metode, teknik, maupun algoritma yang digunakan dalam data mining sangatlah bervariasi. Pemilihan metode dan algoritma yang tepat, semuanya bergantung dengan tujuan dan proses secara keseluruhan. Data mining mampu menganalisa data yang sangat besar sehingga mampu memberikan informasi maupun arti bagi pendukung keputusan yang akan diambil nantinya. Data sampel yang digunakan dalam penelitian kali ini data nilai siswa calon peserta lomba cerdas cermat tingkat kabupaten yang setiap tahunnya pihak sekolah mengirimkan perwakilannya. Banyaknya kriteria yang digunakan membuat pihak sekolah kesulitan dalam mengirimkan peserta lomba. Melalui penelitian ini diharapkan pihak sekolah akan tepat dalam mengirimkan perwakilan lomba cerdas cermat tersebut. 2. Tinjauan Studi 2. METODE PENELITIAN Tabel Penelitian terkait No Nama Peneliti Judul Anik Andriani Penerapan Algoritma C4.5 pada (202) Program Klasifikasi Mahasiswa Dropout 2 Angga Ginanjar Mabrur, Riani Lubis ( 202) 3 Budanis Dwi Meilani dan Penerapan Data Mining untuk Memprediksi Kriteria Nasabah Kredit Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Title of manuscript is short and clear, implies research results (First Author)

20 Achmad Fauzi Slamet (200) Menggunakan Metode Decision Tree Dari penelitian diatas penulis berusaha mengembangkan dari penelitian yang sudah ada. Oleh karenanya penulis menggunakan metode klasifikasi dan algoritma C4.5 untuk mencari tingkat akurasi dari penelitian yang telah dilakukan. 2.2 Pengelompokan Data Mining Ada beberapa teknik yang dimiliki data mining berdasarkan tugas yang bisa dilakukan, antara lain [3]: a. Deskripsi Para peneliti biasanya mencoba menemukan cara mendeskripsikan pola dan trend yang tersembunyi dalam data. b. Estimasi Estimasi hamper sama dengan klasifikasi, kecuali variable tujuan yang lebih kearah numeric daripada kategori. c. Prediksi Prediksi memiliki beberapa kemiripan dengan estimasi dan klasifikasi. Hanya saja jika prediksi hasilnya menunjukkan sesuatu yang belum terjadi (mungkin terjadi di masa depan). d. Klasifikasi Dalam klasifikasi variable, tujuan bersifat kategorik. Misalnya, kita akan mengklasifikasikan pendapatan dalam tiga kelas, yaitu pendapatan tinggi pendapatan sedang, dan pendapatan rendah e. Clustering Clustering lebih condong kea rah pengelompokan rcord, pengamatan, atau kasus dalam kelas yang memiliki kemiripan. f. Asosiasi Mengidentifikasi hubungan antara berbagai peristiwa yang terjadi pada suatu waktu. 2.3 Klasifikasi Klasifikasi merupakan salah satu teknik dalam data mining. Klasifikasi (taksonomi) merupakan proses penempatan objek atau konsep tertentu ke dalam satu set kategori berdasarkan objek yang digunakan. Salah satu teknik klasifikasi yang popular digunakan adalah decision tree [4]. Klasifikasi sendiri terbagi menjadi dua tahap, yaitu pengklasifikasian dan pembelajaran. Pada tahap pembelajaran, sebuah algoritma klasifikasi akan membangun sebuah model klasifikasi dengan cara menganalisis training data. Tahap pembelajaran dapat juga dipandang sebagai tahap pembentukan fungsi atau pemetaan y=f(x) di mana y adalah kelas hasil prediksi dan X adalah truple yang ingin diprediksi kelasnya. 2.4 Algoritma C4.5 Algoritma C4.5 merupakan salah satu algoritma yang telah secara luas digunakan, khususnya di area machine learning yang memiliki beberapa perbaikan dari algoritma sebelumnya yaitu ID3. Algoritma C4.5 dan ID3 model yang tak terpisahkan, karena membangun sebuah pohon keputusan, dibutuhkan algoritma C4.5 Diakhir tahun 980- an, J. Ross Quinlan seorang peneliti di bidang mesin pembelajaran mengembangkan sebuah model pohon keputusan yang dinamakan ID3. Ada beberapa tahapan dalam membuat sebuah pohon keputusan dalam algoritma C4.5 [5] yaitu:

IJCCS ISSN: 978-520 2. Mempersiapkan data training. Data training biasanya diambil dari data histori yang sudah pernah terjadi sebelumnya dan sudah dikelompokkan dalam kelas- kelas tertentu. 2. Menghitung akar pohon. Akar akan diambil dari atribut yang akan dipilih, dengan cara menghitung nilai gain dari masing- masing atribut, nilai gain yang paling tinggi akan menjadi akar pertama. Sebelum menghitung nilai gain dari atribut, hitung dahulu nilai entropy. Untuk menghitung nilai entropy digunakan rumus : Keterangan : S = Himpunan Kasus n = Jumlah Partisi S pi = proporsi terhadap S Entropy (S) = () Kemudian setelah nilai entropy pada masing- masing atribut sudah diperoleh maka hitung nilai gain dengan menggunakan rumus : Keterangan : S= Himpunan kasus A = Fitur n = jumlah partisi atribut A = Proporsi terhadap S S = Jumlah Kasus dalam S Gain ( S, A ) = entropy ( S ) (2) 2.5 Objek Penelitian Penulis melakukan penelitian di SMP Negeri Winong yang beralamatkan di JL. Raya Wnong Gabus KM 0.5. Penelitian ini dilakukan pada bulan September 204. Adapun penelitian ini dilakukan untuk mengetahui calon siswa yang diprediksi untuk mengikuti lomba cerdas cermat yang tingkat kabupaten yang setiap tahun selalu rutin diadakan. 2.6 Teknik Analisis Data Data yang digunakan dalam penelitian ini adalah data berdasarkan kriteria yang digunakan dalam perhitungan, yaitu pada siswa kelas VIII semester ganjil tahun ajaran 203/204 SMP Negeri Winong yang digunakan untuk perhitungan alternatif tertinggi penentuan siswa yang akan mengikuti lomba cerdas cermat tingkat Kabupaten. Metode yang diusulkan untuk proses seperti yang telah dijelaskan di atas yaitu metode klasifikasi dengan algoritma yang digunakan adalah algoritma C4.5 dengan kriteria yang digunakan sebagai berikut :. Nilai Bahasa Indonesia 2. Nilai Bahasa Inggris 3. Nilai Biologi 4. Nilai Fisika 5. Nilai Matematika 6. Nilai IPS Title of manuscript is short and clear, implies research results (First Author)

22 7. Nilai keaktifan (meliputi keaktifan mengerjakan soal dan menjawab pertanyaan ketika bimbingan belajar berlangsung 8. Perolehan skor IQ 9. Nilai Bimbingan belajar 3. HASIL DAN PEMBAHASAN Tabel 2 Data yang digunakan B.Ind B.Ing BIO FIS MAT IPS Aktif IQ Bim Hasil 93 84 86 82 83 84 A 07 83 L 80 84 80 83 82 78 K 94 85 TL 80 76 84 84 85 82 K 02 80 TL 80 83 85 83 8 85 A 28 86 TL 88 83 85 90 90 80 K 90 83 L Tabel 3 Konversi Nilai Nilai Klasifikasi 86-00 A 7-85 B 56-70 C 4-55 D 40 E Tabel 4 Konversi IQ Range Kategori Klasifikasi >= 40 Genius 5 20 39 Superior 4 0 9 Diatas rata- rata 3 90 09 Rata- rata 2 <= 89 Dibawah ratarata Tabel 5 Hasil Konversi B.Ind B.Ing BIO FIS MAT IPS Aktif IQ Bim Hasil A B A B B B A 2 B L B B B B B B K 2 B TL B B B B B B K 2 B TL B B B B B B A 4 A TL A B B A A B K 2 B L

IJCCS ISSN: 978-520 23 Tabel 6 Perhitungan gain dan entropi Node Atribut Kateg Jml_ka L TL Entr Gain ori sus opi Total 32 2 0 0.7 6 6 B.Ind A B 5 7 4 0 0.82 0.55 0.3 Gain tertinggi 5 2 B.Ing A 6 8 8 0.05 B 6 98 0.62 8 Bio A 4 8 6 0.98 0.06 B 8 0 0.6 8 0 Fis A 26 4 2 0.9 0.04 B 06 2 0 0.66 2 4 Mat A 3 9 4 0.6 0. B 9 0 0.09 7 2 IPS A 2 6 6 0.03 B 20 2 2 0.65 0 0 Bim A 5 6 0.99 0.02 B 2 2 0 0.66 0 N.Aktif A 26 2 6 0.7 0 0 K 06 8 24 0.72 2 IQ 0 0 0.0 2 2 88 0.73 3 3 3 2 0.39 4 7 2 5 0.86 5 0 0 0 0 Tabel 7 Confussion Matrix Correct Classfication Classified as + - + True False positives Negatives _ False positives True Negatives Kolom menyatakan prediksi klasifikasi, sedangkan baris menyatakan klasifikasi sebenarnya. Evaluasi dengan confusion matrix menghasilkan nilai accuracy, dimana accuracy dalam klasifikasi adalah persentase ketepatan record data yang diklasifikasikan secara benar Title of manuscript is short and clear, implies research results (First Author)

24 setelah dilakukan pengujian pada hasil klasifikasi. False positive (FP) adalah hasil yang diprediksi positif (yes) namun pada klasifikasi sebenarnya hasilnya negative (no). False negative adalah hasil yang diprediksi negative (no) namun pada klasifikasi sebenarnya hasilnya positif (yes). Tingkat akurasi dari seluruh klasifikasi ditentukan dengan jumlah klasifikasi yang benar dibagi dengan total jumlah record klasifikasi. Accuracy = = = 0.9545 Untuk menghitung prosentasi akurasi, maka tingkat sukses dikalikan 00%. Ini berarti prosentase error dapat dicari dengan cara 00% dikurangi dengan prosentase sukses. Accuracy = * 00% = * 00% = 95.45% 4. KESIMPULAN Berdasarkan hasil penelitian pada klasifikasi penjurusan siswa dapat diambil beberapa kesimpulan sebagai berikut:. Klasifikasi proses seleksi calon peserta lomba siswa SMP N Winong dapat mengklasifikasikan siswa dalam tahapan lolos atau tidaknya dalam seleksi. 2. Dari 32 data siswa yang digunakan menunjukkan tingkat akurasi dengan algoritma C4.5 sebesar 95,45% dan pengujian data uji baru sebanyak 32 data pada tahun sebelumnya diperoleh tingkat akurasi sebesar 90,63%. 3. Penerapan rules dari algoritma C4.5 selanjutnya diterapkan pada bahasa pemrogramman PHP yang digunakan dalam klasifikasi hail proses seleksi yang berupa lolos atau tidaknya siswa sebagai calon peseta lomba. DAFTAR PUSTAKA [] Adi Suwondo, Dian Asmarajati, and Heri Surahman, "Algoritma C4.5 Berbasis Adaboost untuk Prediksi Penyakit Jantung Koroner," Juni 203. [2] Fatayat and Joko Risanto, "Proses Data Mining dalam Meningkatkan Sistem Pembelajaran pada Pendidikan Sekolah Menengah Pertama," 203. [3] Anik Andriani, "Penerapan algoritma C4.5 Pada program klasifikasi mahasiswa dropout," 202. [4] Bain.K, Holisatul Munawaroh, and Yeni Kustiyahningsih, "Perbandingan algoritma ID3 dan C5.0 dalam identifikasi penjurusan siswa SMA," Juni 203. [5] Swastina Liliana, "Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa," Gema Aktualita, Juni 203.