PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

Ukuran: px
Mulai penontonan dengan halaman:

Download "PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO"

Transkripsi

1

2 PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika INTISARI Indeks Prestasi Kumulatif (IPK) dan Lama Studi menjadi salah satu parameter standar penilaian mutu lulusan dan bagian dari penilaian evaluasi sebuah program studi. Penelitian ini bertujuan untuk mengklasifikasi data historis mahasiswa Fakultas Teknik dan Fakultas Ilmu Pendidikan Universitas Negeri Gorontalo tahun 2003 sampai tahun 2012 dengan menggunakan Algoritma C5.0. Metode penelitian yang digunakan adalah Eksperimen melalui tahapan Knowledge Discovery Database. Berdasarkan hasil pengujian dengan menggunakan teknik k-fold cross validation, diperoleh akurasi tertinggi dari prediksi IPK sebesar 79,3 % dan 86,7% untuk lama studi. Hasil prediksi mahasiswa aktif angkatan 2012 dan 2013 menunjukkan bahwa kategori IPK Sedang sebesar 100%, kategori Lama Studi Tepat Waktu 88,80 % dan kategori Lama Studi Tidak Tepat Waktu 11,20 %. Kata Kunci: Klasifikasi, Algoritma C5.0, IPK dan Lama Studi PENDAHULUAN Lulus tepat waktu dengan Indeks Prestasi Akademik (IPK) di atas rata -rata tentunya menjadi harapan setiap mahasiswa. IPK dan lama studi juga menjadi salah satu parameter standar penilaian mutu lulusan, karena profil lulusan selalu tidak lepas dari perhitungan rata-rata IPK dan lama studi lulusan. Sehingga penilaian IPK dan lama studi merupakan bagian dari penilaian evaluasi sebuah program studi, yang dalam proses evaluasinya dapat dilakukan lebih awal dengan mengklasifikasi data historis mahasiswa lulusan untuk memprediksi kategori IPK dan Lama Studi mahasiswa aktif yang informasinya belum diketahui sebelumnya, sehingga program studi dapat mengidentifikasi secara dini karakteristik mahasiswa yang berpotensi lulus dengan kategori tepat waktu atau IPK kategori rendah dan melakukan langkah persuasive. Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database atau data historis. Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar (Turban, 2005). Salah satu metode dalam data mining yang bisa digunakan untuk

3 memprediksi kategori IPK dan lama studi adalah Metode Klasifikasi dengan Algoritma C5.0. Hadjaratie (2012) dengan membandingkan beberapa metode teknik data mining dalam prediksi kategori IPK dan lama studi Fakultas Teknik UNG, yaitu metode Decission Tree dengan algoritma CART, Metode Artificial Neural Network dengan algortima Back Propagation, dan Metode K-Nearest Neighbour. Hasil penelitiannya menunjukkan bahwa metode Decision Tree dengan algoritma CART memiliki kinerja yang lebih baik dari metode lain dalam memprediksi kategori IPK dam lama studi mahasiswa (rata-rata akurasi sebesar 78%). Ernawati (2008) menjelaskan bahwa dalam algoritma C5.0, pemilihan atribut yang akan diproses menggunakan information gain. Secara heuristik akan dipilih atribut yang menghasilkan simpul yang paling bersih ( purest). Jika dalam cabang suatu decision tree anggotanya berasal dari satu kelas maka cabang ini disebut pure. Kriteria yang digunakan adalah information gain. Jadi dalam memilih atribut untuk memecah obyek dalam beberapa kelas harus kita pilih atribut yang menghasilkan information gain paling besar. Ukuran information gain digunakan untuk memilih atribut uji pada setiap node di dalam tree. Atribut dengan nilai information gain tertinggi akan terpilih sebagai parent bagi node selanjutnya. Formula untuk information gain adalah (Kantardzic M, 2003): s, s,,,,, s, = p log (p ) (1) S adalah sebuah himpunan yang terdiri dari s data sampel. Diketahui atribut class adalah m dimana mendefinisikan kelas-kelas di dalamnya, Ci (for i= 1,, m), si adalah jumlah sampel pada S dalam class Ci. untuk mengklasifikasikan sampel yang digunakan maka diperlukan informasi dengan menggunakan aturan seperti di atas (2.1). Dimana pi adalah proporsi kelas dalam output seperti pada kelas Ci dan diestimasikan dengan si /s. Atribut A memiliki nilai tertentu {a1, a2,, av}. Atribut A dapat digunakan pada partisi S ke dalam v subset, {S1, S2,, Sv}, dimana Sj berisi sample pada S yang bernilai aj pada A. Jika A dipilih sebagai atribut tes (sebagai contoh atribut terbaik untuk split), maka subset ini akan berhubungan pada cabang dari node himpunan S. Sij adalah jumlah sample pada class Ci dalam sebuah subset Sj. Untuk mendapatkan informasi nilai subset dari atribut A tersebut maka digunakan formula (Ernawati, 2006). ( ) (,, ) (2)

4 adalah jumlah subset j yang dibagi dengan jumlah sampel pada S, maka untuk mendapatkan nilai gain, selanjutnya digunakan formula (Ernawati,2006) Gain (A) = I (S 1, S 2, S m ) = E (A) (3) Klasifikasi dengan algoritma C5.0 perlu diuji keakuratannya, salah satunya dengan teknik pengujian Cross Validation, yaitu metode umum digunakan untuk mengevaluasi kinerja dalam classifier. Dalam pendekatan cross validation, setiap record digunakan beberapa kali dalam jumlah yang sama untuk training dan tepat sekali untuk testing. Metode ini mempartisi data ke dalam dua sub set data yang berukuran sama. Pilih salah satu sebagai data training dan satu lagi untuk testing, kemudian dilakukan pertukaran fungsi dari subset sedemikian sehingga subset yang sebelumnya sebagai training set menjadi test set demikian sebelumnya. Pendekatan ini dinamakan two-fold- cross-validation. Total error diperoleh dengan menjumlahkan error-error untuk kedua proses tersebut. Metode k-fold cross-validation menggeneralisasi pendekatan ini dengan mensegmentasi data ke dalam k partisi berukuran sama. Selama proses, salah satu dari partisi dipilih untuk training, sedangkan sisanya untuk testing. Prosedur ini diulangi k kali sedemikian sehingga setiap partisi digunakan untuk testing tepat satu kali. Total error ditentukan dengan menjumlahkan error untuk semua k proses tersebut (Tan, et al. 2005). Hasil pengujian dari setiap data testing dievaluasi tabulasi Confusion Matrix, dimana setiap sel berisi angka yang menunjukkan berapa banyak kasus yang sebenarnya dari kelas yang diamati untuk diprediksi sebagaimana yang terlihat pada Tabel 1 (Han dan Kamber, 2006). Tabel 1. Confusion Matrix untuk 2 Kelas Classification Class = Yes Class = No Predicted Class Class = Yes Class = No A B TP (True Positive) FN (False Negative) C D FP (False Positive) TN (True Negative) TP adalah jumlah record positif yang diklasifikasikan sebagai positif, FP adalah jumlah record negative yang diklasifikasikan sebagai positif, FN adalah jumlah record positif yang diklasifikasikan sebagai negative, TN adalah jumlah record negative yang diklasifikasikan sebagai negative. Evaluasi dengan confusion matrix menghasilkan akurasi dan laju error. Akurasi

5 adalah persentase dari total data yang diprediksi secara benar. Laju error adalah persentase dari total data yang diprediksi secara salah. = = 100% (4) METODE PENELITIAN Metode yang digunakan pada penelitian ini adalah metode Eksperimen (Suratmo, 2002) yang tahapannya mengacu pada tahapan Knowledge Discovery in Database (KDD) (Han dan Kamber, 2006), dan disusun berdasarkan tahapan penelitian Irene (2014), seperti yang terlihat pada Gambar 1. mulai Pengumpulan Data Praposesing Data Data Set Lulusan Data Set Mahasiswa Aktif Data Set IPK Data Set Lama Studi k Fold Cross Validation Klasifikasi (Algoritma C5.0) Pengujian Akurasi Prediksi selesai Gambar 1. Tahapan Penelitian Data yang digunakan pada penelitian berasal dari basis data akademik Fakultas Teknik dan Fakultas Ilmu Pendidikan UNG, yang bersumber dari Sistem Informasi Akademik Terpadu UNG (SIATUNG) mengenai data mahasiswa lulusan yang digunakan adalah mahasiswa yang lulus tahun 2003 sampai dengan tahun 2012 (862 record untuk Fakultas Teknik dan 4224 record untuk Fakultas Ilmu Pendidikan) dan data prediksi menggunakan data mahasiswa aktif angkatan tahun 2012 dan 2013 (767 record untuk Fakultas Teknik dan 1357 record untuk Fakultas Ilmu Pendidkan).

6 Proses klasifikasi dan pengujian dilakukan dengan menggunakan teknik k-fold cross validation, dimana pada penelitian ini jumlah k yang digunakan sebanyak 2 ( 2-fold cross validation), sehingga data dibagi menjadi dua bagian ( 2-fold cross validation), dimana satu bagian data dijadikan sebagai data training dan satunya lagi sebagai data testing. (Tabel 2). Data training digunakan untuk proses klasifikasi dan data testing digunakan untuk proses pengujian. Tabel 2. Pembagian 2-fold cross validation untuk data set IPK dan Lama Studi Kelompok Data Data Training Data Testing A IPK_Dataset_1 (training 1) LS_Dataset_1 (training 1) IPK_Dataset_2 (testing 1) LS_Dataset_2 (testing 1) Jlh record Jlh Missing value 13,83 % 44,32 % B IPK_Dataset_2 (training 2) LS_Dataset_2 (training 2) IPK_Dataset_1 (testing 2) LS_Dataset_1 (testing 2) Jlh record Jlh Missing value 44,32 % 13,83 % HASIL DAN PEMBAHASAN Klasifikasi Berdasarkan hasil klasifikasi data mahasiswa lulusan dengan menggunakan algoritma C5.0 dan melibatkan formula 1, formula 2, formula 3, diketahui bahwa jumlah rule yang terbentuk dan atribut yang terlibat tidak sama untuk setiap proses klasfikasi, baik pada data set IPK dan Lama Studi. Untuk data training set_ipk_1, rule yang terbentuk sebanyak 58 rule dan atribut yang terlibat sebanyak 12 atribut (semua atribut), sedangkan pada data training set_ipk_2 rule yang terbentuk sebanyak 8 rule dan atribut yang terlibat sebanyak 7 atribut, yang terdiri dari : jurusan, strata, asal sekolah, jenis kelamin, penghasilan ayah, seleksi, penghasilan ibu. Adapun data training set_ls_1, rule yang terbentuk sebanyak 41 rule dan atribut yang terlibat sebanyak 12 atribut (semua atribut), sedangkan data set_ls_2 rule yang terbentuk sebanyak 11 rule dan atribut yang terlibat sebanyak 7 atribut, yang terdiri dari : jurusan, strata, asal sekolah, jenis kelamin, penghasilan ayah, seleksi, penghasilan ibu. Dengan demikian, dapat diketahui bahwa data training set 2 (baik set_ipk_2 dan set_ls_2) lebih sedikit menghasilkan rule dan keterlibatan atribut dalam proses klasifikasi dibandingkan dengan data training set 1 (set_ipk_1 dan set_ls_1). Hal ini dapat saja disebabkan oleh karena jumlah missing value pada data training set 2 (44.32%) lebih banyak dibandingkan pada data training set 1 (13.83%). Karena

7 datanya lebih banyak, maka proses klasifikasi pada data training set 1 lebih banyak melakukan proses split untuk mendapatkan leaf (terbentuknya rule). Sedangkan pada data training set 2, karena banyaknya missing value, maka proses untuk mendapatkan leaf tidak banyak melakukan proses split, karena atribut yang tersisa tidak lagi memiliki data ( missing value), sehingga leaf dibentuk secara otomatis oleh kategori dengan frekuensi mayoritas, sebagaimana aturan yang berlaku pada penerapan algoritma C5.0. Pengujian Akurasi Sebelum melakukan prediksi data mahasiswa aktif, maka penerapan algoritma C5.0 pada data training IPK dan Lama Studi divalidasi terlebih dahulu dengan menggunakan data testing, untuk mendapatkan nilai performasi berupa nilai akurasi dari masing-masing data set, berdasarkan metode pembagian data 2-fold cross validation (Tabel 2), yang menyajikan informasi hasil perhitungan akurasi algoritma C.50 untuk data set IPK, dimana pada kelompok data A, himpunan rule yang dibentuk oleh data training Set_IPK_1 divalidasi dengan menggunakan data testing Set_IPK_2, sehingga bisa diperoleh kategori IPK hasil prediksi yang selanjutnya akan dibandingkan dengan kategori IPK dari data yang sebenarnya. Begitu pula sebaliknya dengan kelompok data B, dimana himpunan rule yang dibentuk oleh data training Set_IPK_2 divalidasi dengan menggunakan data testing Set_IPK_1. Perhitungan akurasi dilakukan berdasarkan formula 4. Tabel 3. Akurasi Algoritma C.50 pada data set IPK kelompok A OBSERVED PREDICTED RENDAH SEDANG TINGGI PERCENT CORRECT RENDAH % SEDANG % TINGGI % OVERALL PERCENTAGE 0 100% %

8 Tabel 4 Akurasi Algoritma C.50 pada data set IPK kelompok B OBSERVED PREDICTED RENDAH SEDANG TINGGI PERCENT CORRECT RENDAH % SEDANG % TINGGI % OVERALL PERCENTAGE 0 100% % Tabel 3 Merupakan hasil perhitugan akurasi algoritma C.50 untuk data set Lama Studi, dimana pada kelompok data A, himpunan rule yang dibentuk oleh data training Set_LS_1 divalidasi dengan menggunakan data testing Set_LS_2, sehingga bisa diperoleh kategori Lama Studi hasil prediksi yang selanjutnya akan dibandingkan dengan kategori Lama Studi dari data yang sebenarnya. Begitu pula sebaliknya dengan kelompok data B (Tabel 4), dimana himpunan rule yang dibentuk oleh data training Set_LS_2 divalidasi dengan menggunakan data testing Set_LS_1. Tabel 5. Akurasi Algoritma C.50 pada data set Lama Studi kelompok A OBSERVED PREDICTED TIDAK TEPAT WAKTU TEPAT WAKTU PERCENT CORRECT TIDAK TEPAT WAKTU % TEPAT WAKTU % OVERALL PERCENTAGE 29.6% 70.4% 70.4% Tabel 6. Akurasi Algoritma C.50 pada data set Lama Studi kelompok B OBSERVED PREDICTED TIDAK TEPAT WAKTU TEPAT WAKTU PERCENT CORRECT TIDAK TEPAT WAKTU % TEPAT WAKTU % OVERALL PERCENTAGE 5 % % 86.7% Berdasarkan kedua tabel perhitungan akurasi di atas (Tabel 5 dan 6), dapat diketahui kelompok data yang memiliki akurasi tertinggi adalah kelompok data set B, baik pada data set IPK (79.3%) maupun data set Lama Studi (86.7%), sehingga untuk selanjutnya himpunan rule

9 yang diperoleh dari data training Set_IPK_2 dan Set_LS_2 yang dipilih untuk digunakan sebagai pola dalam memprediksi data mahasiswa aktif angkatan 2012 dan 2013 yang belum memiliki kelas target. Prediksi Kategori IPK dan Lama Studi dari mahasiswa aktif angkatan 2012 dan 2013 diprediksi berdasarkan rule dari dataset yang memiliki akurasi IPK dan Lama Studi tertinggi (kelompok B). Untuk kategori IPK, hasil prediksi menunjukkan bahwa keseluruhan data menghasilkan kategori IPK = Sedang, sedangkan untuk kategori Lama Studi, hasil prediksinya bervariasi setiap atribut, dimana mayoritas kelas kategori dari setiap atribut menunjukkan hasil prediksi dengan kategori Lama Studi = Tepat Waktu. Implementasi 5. Implementasi penerapan klasifikasi ke dalam sistem disajikan pada Gambar 2, 3, 4, dan Gambar 2. Form menu klasifikasi Gambar 2 merupakan proses klasifikasi C5.0 untuk membentuk rule, rule yang dihasilkan akan digunakan dalam menghitung akurasi dan untuk memprediksi mahasiswa baru. Gambar 3. Form menu rule Gambar 3 merupakan hasil rule dari proses klasifikasi yang dilakukan oleh gambar 2 diatas.

10 Gambar 4. Form pencocokan data Gambar 4 diatas merupakan form untuk menghitung akurasi dari setiap kelompok data, kelompok data yang memiliki nilai akurasi tertinggi, kelompok data tersebut akan digunakan pada proses prediksi Gambar 5. Form Prediksi permahasiswa Gambar 5 diatas merupakan form prediksi mahasiswa, untuk mengetahui IPK dan Lama Studi dari seorang mahasiswa.

11 SIMPULAN DAN SARAN Berdasarkan hasil penelitian yang diperoleh, beberapa hal yang dapat disimpulkan adalah : a. Klasifikasi data lulusan berdasarkan IPK dan Lama Studi menghasilkan nilai akurasi 79,3 % dan laju error 20,7 % untuk set IPK, serta nilai akurasi 86,7 % dan laju error 13,3 % untuk set Lama Studi b. Hasil prediksi mahasiswa aktif angkatan 2012 dan 2013, dinyatakan bahwa untuk kategori IPK SEDANG sebanyak 1777 mahasiswa, kategori Lama studi tepat waktu sebanyak 1578 mahasiswa dan tidak tepat waktu sebanyak 199. Adapun hal-hal yang dapat disarankan adalah sebagai berikut : a. Proses klasifikasi data mahasiswa disarankan untuk dikembangkan dan menguji coba kembali dengan data set yang memiliki data yang lebih lengkap (lebih sedikit missing value) dan ruang lingkup yang lebih luas (semua fakultas di lingkungan Universitas Negeri Gorontalo). b. Proses pengujian disarankan untuk dilakukan dengan mengubah jumlah k dalam metode k- fold cross validation atau dengan teknik yang berbeda selain k-fold cross validation. c. Sistem dapat dikembangkan lebih dinamis, terutama dalam mengimport data set serta otomatisasi proses pembagian data training dengan mengubah secara dinamis nilai k pada metode k-fold cross validation. DAFTAR PUSTAKA Ernawati, I Prediksi Status Keaktifan Studi Mahasiswa Dengan Algoritma C5.0 dan K- Nearest Neighbour. [Tesis]. Institut Pertanian Bogor. Han, J dan Kamber, M. (2006). Data Mining Concept and Tehniques. San Fransisco: Morgan Kauffman. ISBN 13: Irene, W Penerapan Algoritma C5.0 dalam Pengklasifikasian Data Mahasiswa Universitas Negeri Goronta [Skripsi]. Fakultas Teknik : Universitas Negeri Gorontalo. Sistem Informasi Akademik Terpadu Universitas Negeri Gorontalo. (diakses pada tanggal 2 Juli 2013) Turban Decision Support System and intelligent system. Yogyakarta : Andi Offset Hadjaratie, L Prediksi dan Pemetaan Data Mahasiswa Fakultas Teknik Universitas Negeri Gorontalo Menggunakan Pendekatan Data Mining. Laporan Penelitian Universitas Negeri Gorontalo.

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG Andri 1), Yesi Novaria Kunang 2), Sri Murniati 3) 1,2,3) Jurusan Sistem Informasi Universitas

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien 1 Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien Ketut Wisnu Antara 1, Gede Thadeo Angga Kusuma 2 Jurusan Pendidikan Teknik Informatika Universitas Pendidikan Ganesha

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1.1 Data Training Data training adalah data yang digunakan untuk pembelajaran pada proses data mining atau proses pembentukan pohon keputusan.pada penelitian ini

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5 1 PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5 Dina Maurina, Ahmad Zainul Fanani S.Si, M.Kom Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA Anik Andriani Program Studi Manajemen Informatika, AMIK BSI Jakarta Jl. RS Fatmawati 24, Pondok

Lebih terperinci

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5 DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5 DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION Hamsir Saleh Hamsir.saleh@gmail.com Fakultas Ilmu Komputer Universitas Ichsan Gorontalo Abstrak Memprediksi kebangkrutan

Lebih terperinci

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah

Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah Selly Artaty Zega Program Studi Teknik Multimedia dan Jaringan, Jurusan Teknik Informatika, Politeknik

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA Yasinta Agustyani, Yuliana Susanti, dan Vika Yugi Program Studi Matematika Fakultas

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout  Data mining BAB 1 PENDAHULUAN Bab ini membahas mengenai latar belakang masalah, identifikasi masalah, ruang lingkup tugas akhir, maksud dan tujuan tugas akhir, metode penelitian tugas akhir, dan sistematika penulisan

Lebih terperinci

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL) KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL) Budi Utami 1, Yuniarsi Rahayu, 2 1,2 Program Studi Teknik Informatika, Fakultas Ilmu Komputer,

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5 DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5 Dwi Untari A11.2010.05410 Program Studi Teknik Informatika S1 Fakultas Ilmu Komputer Universitas

Lebih terperinci

DATA DAN METODE Data

DATA DAN METODE Data DATA DAN METODE Data Sumber data yang digunakan dalam penelitian berasal dari data mahasiswa tahun angkatan 2000 sampai dengan 2005, dan dari tiga program studi yaitu S1- Sistem Informasi, S1-Teknik Informatika,

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan

Lebih terperinci

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU Aradea, Satriyo A., Ariyan Z., Yuliana A. Teknik Informatika Universitas Siliwangi Tasikmalaya Ilmu Komputer Universitas Diponegoro

Lebih terperinci

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU Jonathan Rinaldy 1) 1) Program Studi Teknik Informatika, Sekolah Tinggi Informatika & Komputer

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Decision Tree Definisi Decision tree adalah sebuah diagram alir yang berbentuk seperti struktur pohon yang mana setiap internal node menyatakan pengujian terhadap suatu atribut,

Lebih terperinci

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal) 1 KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal) Budi Utami Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula No. 5-11 Semarang-50131

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA IMPLEMENTATION OF DATA MINING WITH C4.5 ALGORITHM TO PREDICT STUDENT ACHIEVEMENT Oleh: SITI MUHIMATUL KHOIROH NPM

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Udara Udara adalah suatu campuran gas yang terdapat pada lapisan atmosfir yang mengelilingi bumi. Udara juga merupakan atmosfer yang berada di sekeliling bumi yang memiliki fungsi

Lebih terperinci

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN PEMINATAN JURUSAN SISWA DI SMA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING C4.5 THE DECISION SUPPORT SYSTEM FOR SUBJECT SPECIALIZATION STUDENTS IN HIGH SCHOOL USING DATA MINING

Lebih terperinci

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal 234 Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal Comparative Analysis Of ID3 And C4.5 Algorithm For Classification Of Grant

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif Khafiizh Hastuti 1, Erwin Yudi Hidayat 2 1, 2 Fakultas Ilmu Komputer, Universitas Dian Nuswantoro, Semarang 50131 E-mail : 1 afis@dsn.dinus.ac.id,

Lebih terperinci

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE Didik Setiyadi, Ali Nurdin DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE 1 DIDIK SETIYADI, 2 ALI NURDIN 1,2 Sekolah Tinggi Manajemen Informatika dan Komputer Eresha Program Studi : Teknik Informatika

Lebih terperinci

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK)

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK) IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK) [1] Beti Novianti, [2] Tedy Rismawan [3] Syamsul Bahri [1][2][3] Jurusan Sistem Komputer, Fakultas

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

ISSN : 2442-5826 e-proceeding of Applied Science : Vol.2, No.3 December 2016 Page 858 SISTEM PENDUKUNG KEPUTUSAN PEMINATAN JURUSAN SISWA DI SMA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING C4.5 THE DECISION

Lebih terperinci

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree Disusun oleh : Budanis Dwi Meilani Achmad dan Fauzi Slamat Jurusan Sistem Informasi Fakultas Teknologi Informasi.

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1 Abstract

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1  Abstract Penerapan K-Optimal Pada Algoritma Knn untuk Prediksi Kelulusan Tepat Waktu Mahasiswa Program Studi Ilmu Komputer Fmipa Unlam Berdasarkan IP Sampai Dengan Semester 4 Mutiara Ayu Banjarsari 1, H. Irwan

Lebih terperinci

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA Harry Dhika 1), Tri Yani Akhirina 2), Surajiyo 3) 1), 2),3) Teknik Informatika Universitas Indraprasta PGRI Jl Nangka No. 58B, Jakarta, DKI Jakarta 12530 Email

Lebih terperinci

DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5

DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5 Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2017, pp. 7~12 7 DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5 Tri Retnasari 1, Eva Rahmawati 2 1 STMIK

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAR TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAR TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAR TEORI 2.1 Penelitian Terkait Penelitian mengenai penggunaan Metode Klasifikasi dengan algoritma C4.5 dalam pengelompokan data siswa berdasarkan prestasi dan kriteria

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN Penelitian ini adalah penelitian eksperimen dengan langkah-langkah atau metode penelitian sebagai berikut: 1. Penentuan Masalah Penentuan masalah ini diperoleh dari studi literature

Lebih terperinci

DAFTAR ISI Transformasi data... 47

DAFTAR ISI Transformasi data... 47 DAFTAR ISI HALAMAN JUDUL... i HALAMAN PENGESAHAN... ii HALAMAN PERNYATAAN... iii PRAKATA... iv DAFTAR ISI... vi DAFTAR TABEL... ix DAFTAR GAMBAR... xi INTISARI... xiii ABSTRACT... xiv BAB I PENDAHULUAN...

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Sebelum melakukan penelitian adapun penulis mencari penelitian penelitian yang memungkinkan terkait dengan penelitian antara lain : 1. Analisis Kinerja Data

Lebih terperinci

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA Ade Putra Fakultas Vokasi, Program Studi Komputerisasi Akuntansi Universitas Bina Darma

Lebih terperinci

Pemanfaatan Educational Data Mining (EDM)...

Pemanfaatan Educational Data Mining (EDM)... PEMANFAATAN EDUCATIONAL DATA MINING (EDM) UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS: TI-S1 UDINUS) Defri Kurniawan 1*, Wibowo Wicaksono 1 dan Yani Parti Astuti 1 1

Lebih terperinci

MODEL ALGORITMA K-NEAREST NEIGHBOR

MODEL ALGORITMA K-NEAREST NEIGHBOR MODEL ALGORITMA K-NEAREST NEIGHBOR (K-NN) UNTUK PREDIKSI KELULUSAN MAHASISWA Abdul Rohman Dosen Jurusan Elektronika Fakultas Teknik Universitas Pandanaran Semarang Abstrak Dalam sistem pendidikan mahasiswa

Lebih terperinci

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG 1 IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG Muhammad Efendi Program Studi Teknik Informatika

Lebih terperinci

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK

Lebih terperinci

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK)

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK) IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK) Diana Septiari Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI 39 PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK KLASIFIKASI MAHASISWA BERPRESTASI Nadiya Hijriana 1) dan Riadhul Muttaqin 1) 1 Program Studi Teknik Informatika Universitas Islam Kalimantan, Banjarmasin

Lebih terperinci

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika Classification Decision Tree Classification Decision Tree Pengertian Pohon Keputusan Pohon keputusan adalah

Lebih terperinci

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0 PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C.0 Rachma Fauzia Azhary, Isnandar Slamet, Supriyadi Wibowo Program Studi Matematika Fakultas Matematika dan Ilmu Pengetahuan

Lebih terperinci

SWABUMI VOL IV No. 1, Maret 2016 ISSN X

SWABUMI VOL IV No. 1, Maret 2016 ISSN X PENERAPAN PARTICLE SWARM OPTIMIZATION (PSO) UNTUK SELEKSI ATRIBUT DALAM MENINGKATKAN AKURASI PREDIKSI DIAGNOSIS PENYAKIT HEPATITIS DENGAN METODE ALGORITMA C4.5 Lis Saumi Ramdhani Program Studi Manajemen

Lebih terperinci

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE JURNA TEKNIK, (2014) 1-6 1 AIKASI DATA MINING UNTUK MEMREDIKSI ERFORMANSI MAHASISWA DENGAN METODE KASIFIKASI DECISION TREE Irfan Fahmi, Budi Santosa Jurusan Teknik Industri, Fakultas Teknologi Industri,

Lebih terperinci

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom LEARNING ARTIFICIAL INTELLIGENT Dr. Muljono, S.Si, M. Kom Outline Decision tree learning Jaringan Syaraf Tiruan K-Nearest Neighborhood Naïve Bayes Decision Tree Learning : Klasifikasi untuk penerimaan

Lebih terperinci

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO) IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO) Andika Elok Amalia 1), Muhammad Zidny Naf an 2) 1), 2) Program Studi Informatika ST3 Telkom Jl D.I.

Lebih terperinci

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2017, pp. 368~372 368 PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI Adhika Novandya AMIK BSI Bekasi e-mail:

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

KLASIFIKASI STATUS GIZI MENGGUNAKAN K-NEAREST NEIGHBOR INTISARI

KLASIFIKASI STATUS GIZI MENGGUNAKAN K-NEAREST NEIGHBOR INTISARI KLASIFIKASI STATUS GIZI MENGGUNAKAN K-NEAREST NEIGHBOR Sumarni Arifin Hasani¹, Sitti Suhada², Lillyan Hadjaratie³ ¹Program Studi Sistem Informasi, Fakultas Teknik, Universitas Negeri Gorontalo Email: sumarni.hasani@gmail.com

Lebih terperinci

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru Wahyudin Program Pendidikan Ilmu Komputer, Universitas Pendidikan Indonesia Abstrak Konsep pohon merupakan salah satu

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48 PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48 Sulidar Fitri Teknik Informatika STMIK AMIKOM Yogyakarta email : inboxfitri@gmail.com Abstraksi Penelitian

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah Proses yang menggunakan

Lebih terperinci

BAB. III. ANALISA PERMASALAHAN

BAB. III. ANALISA PERMASALAHAN BAB. III. ANALISA PERMASALAHAN Pada Bab II telah diuraikan beberapa teori dasar yang akan menjadi acuan / referensi ilmiah dalam melakukan penelitian. Bab ini akan berisi studi kasus yang dibangun dari

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Pada BAB II ini akan disampaikan materi-materi yang berkaitan dengan konsep data mining, yang merupakan landasan bagi pembahasan klasifikasi untuk evaluasi kinerja pegawai. 2. 1 Tinjauan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Studi Sebelum menyusun tugas akhir ini dilakukan tinjauan pustaka terlebih dahulu terhadap penelitian-penelitian terkait sebagai bahan referensi. Penelitian tentang

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu pelayanan dalam dunia perbankan adalah pemberian pinjaman kredit kepada nasabah yang memenuhi syarat perbankan. kredit merupakan sumber utama penghasilan

Lebih terperinci

BAB 1 PENDAHULUAN 1-1

BAB 1 PENDAHULUAN 1-1 BAB 1 PENDAHULUAN Bab ini menguraikan penjelasan umum mengenai tugas akhir yang dikerjakan. Penjelasan tersebut meliputi latar belakang masalah, tujuan tugas akhir, lingkup tugas akhir, metodologi yang

Lebih terperinci

IMPLEMENTASI TEKNIK DATA MINING CLASSIFICATION DENGAN METODE DECISSION TREE UNTUK MENENTUKAN TINGKAT KELULUSAN MAHASISWA

IMPLEMENTASI TEKNIK DATA MINING CLASSIFICATION DENGAN METODE DECISSION TREE UNTUK MENENTUKAN TINGKAT KELULUSAN MAHASISWA IMPLEMENTASI TEKNIK DATA MINING CLASSIFICATION DENGAN METODE DECISSION TREE UNTUK MENENTUKAN TINGKAT KELULUSAN MAHASISWA Sudirman 1,2 Departement of Information Science, Faculty of Computer Science and

Lebih terperinci

PENERAPAN ALGORITMA C4.5 PADA PROGRAM KLASIFIKASI MAHASISWA DROPOUT. Anik Andriani AMIK BSI Jakarta

PENERAPAN ALGORITMA C4.5 PADA PROGRAM KLASIFIKASI MAHASISWA DROPOUT. Anik Andriani AMIK BSI Jakarta PENERAPAN ALGORITMA C4.5 PADA PROGRAM KLASIFIKASI MAHASISWA DROPOUT Anik Andriani AMIK BSI Jakarta ABSTRAK. Prestasi akademik mahasiswa dievaluasi setiap akhir semester untuk mengetahui hasil belajar yang

Lebih terperinci

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G651044054 SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

PERBANDINGAN ALGORITMA ID3 DAN C5.0 DALAM INDENTIFIKASI PENJURUSAN SISWA SMA

PERBANDINGAN ALGORITMA ID3 DAN C5.0 DALAM INDENTIFIKASI PENJURUSAN SISWA SMA PERBANDINGAN ALGORITMA ID3 DAN C5.0 DALAM INDENTIFIKASI PENJURUSAN SISWA SMA *Holisatul Munawaroh, **Bain Khusnul K,S.T.,M.Kom ***Yeni Kustiyahningsih,S.Kom.,M.Kom Program Studi Teknik Informatika, Universitas

Lebih terperinci

PENGAMBILAN KEPUTUSAN UNTUK PENENTUAN BEASISWA TEPAT SASARAN MENGGUNAKAN METODE DECISION TREE DI SMK TARUNA BAKTI KERTOSONO

PENGAMBILAN KEPUTUSAN UNTUK PENENTUAN BEASISWA TEPAT SASARAN MENGGUNAKAN METODE DECISION TREE DI SMK TARUNA BAKTI KERTOSONO PENGAMBILAN KEPUTUSAN UNTUK PENENTUAN BEASISWA TEPAT SASARAN MENGGUNAKAN METODE DECISION TREE DI SMK TARUNA BAKTI KERTOSONO SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana

Lebih terperinci

Modul IV KLASIFIKASI

Modul IV KLASIFIKASI LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul IV KLASIFIKASI TUJUAN PRAKTIKUM Setelah mengikuti praktikum modul ini diharapkan: 1. Mahasiswa

Lebih terperinci

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI PROFIL LULUSAN STMIK LPKIA

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI PROFIL LULUSAN STMIK LPKIA PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI PROFIL LULUSAN STMIK LPKIA 1 Ati Suci Dian Martha, S.Kom, M.T., 2 Popy Widiyani 1 Program Studi Teknik Informatika STMIK LPKIA 2 Program Studi Sistem Informasi

Lebih terperinci

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG 1 Ati Suci Dian Martha, 2 Afryanto Redy 1 Program Studi Sistem Informasi STMIK LPKIA 1 Program Studi Sistem Informasi

Lebih terperinci

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN 5. Oleh karena itu untuk meningkatkan akurasinya, proses learning harus dihentikan lebih awal atau melakukan pemotongan tree secara umum. Untuk itu diberikan 2 (dua) buah threshold yang harus dipenuhi

Lebih terperinci

Penggunaan Pohon Keputusan untuk Data Mining

Penggunaan Pohon Keputusan untuk Data Mining Penggunaan Pohon Keputusan untuk Data Mining Indah Kuntum Khairina NIM 13505088 Program Studi Teknik Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jalan Ganesha

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Studi Beberapa penilitian yang terkait dalam penelitian ini adalah sebagai berikut: 1. Penerapan Data Mining Untuk Memprediksi Kriteria Nasabah Kredit [7] Penelitian

Lebih terperinci