Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Ukuran: px
Mulai penontonan dengan halaman:

Download "Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik"

Transkripsi

1 Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting untuk dilaksanakan oleh penyelengara program pendidikan agar kegiatan pembelajaran menjadi lebih efektif. Berdasarkan hasil klasifikasi ini nantinya penyelengara program pendidikan dapat mengelompokkan peserta program pendidikannya sehingga kegiatan pembelajaran dapat disesuaikan dengan kelompok-kelompok tersebut. Metode tradisional untuk melaksanakan klasifikasi ini adalah dengan mengurutkan peserta didik berdasarkan nilai akhir mereka kemudian membagi mereka berdasarkan ukuran tertentu. Metode yang lebih baik adalah dengan menggunakan algoritma Data Mining. Pada paper ini akan dibahas lima jenis algoritma Data Mining untuk melaksanakan proses klasifikasi. Lima algoritma Data Mining tersebut akan dibandingkan satu sama lain untuk mencari algoritma terbaik. Validasi dilaksanakan menggunakan 10-Fold Cross Validation untuk menentukan algoritma yang memberikan akurasi paling tinggi. Berdasarkan percobaan, didapatkan hasil bahwasanya Decision Tree C 4.5 memberikan hasil terbaik dengan akurasi %. Kata Kunci: Data Mining, Klasifikasi, Perbandingan, 10-Fold Cross Validation I. PENDAHULUAN Pada saat sebuah penyelengara program pendidikan membuka sebuah program pendidikan, banyak faktor yang akan mempengaruhi efektifitas program pendidikan tersebut. Efektifitas disini artinya adalah ukuran tercapai atau tidaknya tujuan dari program pendidikan tersebut. Beberapa faktor penting yang mempengaruhi efektifitas tersebut selain kurikulum, materi, pengajar, sarana dan prasarana, faktor yang sangat penting lainnya adalah pengelompokkan peserta didik. Metode yang paling sederhana untuk pengelompokkan ini adalah dengan mengurutkan peserta didik berdasarkan nilai akhir mereka kemudian membagi mereka berdasarkan ukuran tertentu, misalnya jumlah maksimal dalam satu kelas. Misalnya, jika dibagi menjadi 3 kelas maka kelas pertama yang merupakan kelas atas berisi peserta didik dengan nilai akhir tertinggi, kelas ketiga yang merupakan kelas bawah berisi peserta didik dengan nilai terendah, dan kelas kedua berisi dengan peserta didik dengan nilai diantara kedua kelas atas dan kelas bawah tersebut. Jadi, metoda klasifikasi sederhana tersebut hanya menggunakan satu attribut saja untuk menentukan seorang peserta didik akan masuk ke kelas yang mana, yakni nilai akhir yang sifat attribut-nya numerik. Meskipun nilai akhir tersebut mungkin dihitung berdasarkan beberapa variabel yang tidak semuanya merupakan hasil evaluasi seperti ujian, misalnya jumlah kehadiran. Namun, para peneliti di bidang Data Mining telah menghasilkan banyak algoritma klasifikasi yang dapat digunakan untuk melaksanakan klasifikasi dengan cara yang lebih baik dengan menggunakan beragam attribut, baik sifatnya numerik maupun nominal. Untuk mengetahui algoritma klasifikasi yang paling efektif untuk melaksanakan klasifikasi ini maka mereka perlu dibandingkan. Berdasarkan hasil perbandingan nantinya dapat dipilih algoritma yang paling tinggi akurasinya. Algoritma terpilih ini nantinya dapat digunakan untuk membuat model klasifikasi yang selanjutnya dapat digunakan untuk melaksanakan pengelompokkan peserta didik. II. LANDASAN TEORI 2.1. Definisi Klasifikasi Klasifikasi adalah sebuah proses analisa data yang menghasilkan model-model untuk menggambarkan kelas-kelas yang terkandung dari data tersebut (Han, 2012). Model - model tersebut disebut classifier. Jadi, classifier inilah yang akan digunakan untuk menyusun kelas-kelas yang terkandung dari data, misalnya untuk Decision Tree maka kelas-kelas tersebut digambarkan dalam bentuk pohon. Para peneliti di bidang Data Mining telah memperkenalkan banyak jenis dari classifier. Berikut daftar lima jenis classifier yang akan dibandingkan pada paper ini Decision Tree Decision Tree digunakan untuk mempelajari klasifikasi dan prediksi pola dari data dan menggambarkan relasi dari variabel attribut x dan variabel target y dalam bentuk pohon (Ye, 2014). Decision Tree adalah struktur menyerupai flowchart dimana setiap internal node (node yang bukan leaf atau bukan node terluar) merupakan pengujian terhadap variabel attribut, tiap cabangnya merupakan hasil dari pengujian tersebut, sedangkan node terluar yakni leaf menjadi labelnya (Han, 2012). Prosiding SIMNASIPTEK: Hal. A-101

2 Gambar 1. Decision Tree Naive Bayes Naive Bayes adalah algoritma yang cara kerjanya berdasarkan Theorema Bayes dengan mengasumsikan bahwa pengaruh dari nilai sebuah attribut dari sebuah kelas sifatnya independen dari nilai attribut-attribut lainnya (Han, 2012). Asumsi tersebut dibuat untuk menyederhanakan proses komputasi (Han, 2012). Intisari dari Theorema Bayes adalah untuk mencari probabilitas sebuah tupel X untuk menjadi bagian dari sebuah kelas C dengan syarat deskripsi attribut dari X telah diketahui dengan jelas (Han, 2012). sejumlah Decision Tree dengan memilih attribut secara acak. Setiap individual Decision Tree disusun dengan cara memilih attribut-attribut secara acak pada tiap node untuk menentukan pemecahan pada node tersebut (Han, 2012) Artificial Neural Networks (ANNs) Artificial Neural Networks (ANNs) didesain untuk meniru cara kerja dari otak manusia dengan tujuan untuk membuat kecerdasan buatan yang meniru kecerdasan manusia. Arsitektur ANNs seperti halnya otak manusia, yakni terdiri dari neuron-neuron yang saling berhubungan. Pada ANNs, neuron-neuron ini adalah unit-unit pemrosesan (Ye, 2014). Unit-unit pemrosesan ini dapat saling bertukar pesan satu sama lain dan mereka masing-masing memiliki bobot yang dapat berubah sesuai dengan pengalaman atau hasil belajar. Gambar 4. Artificial Neural Networks Gambar 2. Theorema Bayes k-nn Algoritma k-nn bekerja dengan belajar berdasarkan analogi, yakni dengan membandingkan test tuple dengan training tuple yang serupa dengannya. Seluruh training tuple disimpan dalam sebuah ruang n-dimensi pola. Saat diberikan tupel yang tidak diketahui, k-nn akan mencari sejumlah (k) training tuple yang terdekat dengan tuple yang tidak diketahui tersebut (Han, 2012). Gambar 3. k-nn Random Forest Random Forest bekerja dengan membangun III. Metode Penelitian Seluruh algoritma klasifikasi melaksanakan prinsip dasar klasifikasi, yakni mereka akan membagi kelas-kelas dari dataset yang diberikan. Pada paper ini, kelima algoritma yang telah dipaparkan pada bagian sebelumnya akan dibandingkan untuk membuat classifier dari sebuah dataset yang sama dalam bentuk sebuah studi kasus di sebuah lembaga penyelenggara program pendidikan. Sebuah lembaga penyelengara program pendidikan melaksanakan kegiatan pembelajaran secara offline dan online. Peserta program pendidikan tersebut mengikuti pemaparan materi ajar melalui metode tatap muka di kelas sedangkan untuk evaluasi materi yang telah diberikan dilaksanakan secara online. Lembaga ini ingin mengklasifikasikan peserta program tersebut menjadi tiga kelas, yakni kelas atas, kelas tengah, dan kelas bawah Dataset Dataset yang akan digunakan untuk training adalah data pengerjaan evaluasi secara online. Berikut attribut dari dataset: 1. ID_SISWA: Nomor induk peserta didik, sifatnya numerik, mengidentifikasikan setiap peserta didik secara unik. 2. NAMA_SISWA: Nama peserta didik. 3. JUMLAH_SESI: Jumlah sesi pengerjaan quiz online, sifatnya numerik. Jumlah minimalnya 0 artinya siswa Prosiding SIMNASIPTEK: Hal. A-102

3 tersebut tidak pernah mengerjakan dan maksimal NILAI_RATA-RATA: Nilai rata-rata dari seluruh sesi pengerjaan quiz, sifatnya numerik. Nilai minimalnya 0 dan maksimalnya KELAS: Kelas dari siswa yang didapatkan dengan mengurutkan siswa berdasarkan 2 variabel, yaitu Nilai Rata-rata dan Jumlah Pengerjaan Quiz. Sifatnya nominal, yaitu A untuk Kelas Atas, B untuk Kelas Menengah ke Atas, dan C untuk Kelas Menengah ke Bawah, dan D untuk Kelas Bawah Kerangka Kerja Perbandingan Untuk melaksanakan perbandingan digunakan Rapidminer. Kerangka kerja perbandingan ditunjukkan pada gambar 5. Tabel 1. Confusion Matrix k-nn Confusion Matrix k-nn di atas adalah sebagai berikut: termasuk kelas A sebanyak 27 record. termasuk kelas B sebanyak 24 record. termasuk kelas C sebanyak 24 record. termasuk kelas D sebanyak 29 record. Positive (TP) = 104. Jadi, jumlah Classifier k-nn sebanyak 104 record. Jumlah seluruh record adalah 123 record sehingga accuracy dihitung dengan (104/123)*100% = 85% Hasil Klasifikasi Naive Bayes Naive Bayes menunjukkan presisi yang kurang bagus, bahkan lebih buruk dibandingkan k-nn untuk klasifikasi kelas C. Hasil lengkapnya disajikan pada confusion matrix Tabel 2. Confusion Matrix Naive Bayes Gambar 5. Kerangka kerja perbandingan Berikut ini keterangan kerangka kerja perbandingan pada gambar Attribut-attribut dari dataset yang digunakan adalah JUMLAH_SESI dan NILAI_RATA-RATA. 2. Algoritma klasifikasi yang digunakan adalah Decision Tree, Naive Bayes, k-nn, Random Forest, dan Artificial Neural Networks (ANNs). 3. Model validasi yang digunakan adalah 10-fold crossvalidation, artinya data training dibagi menjadi 10 bagian yang sama dan proses pembelajaran dilaksanakan sebanyak 10 kali. 4. Model evaluasi yang digunakan menggunakan accuracy sebagai indikator kinerja dari classifier. 5. Untuk uji beda digunakan T-Test. IV. PEMBAHASAN Berdasarkan kerangka kerja yang telah dijelaskan pada bagian sebelumnya didapatkan hasil percobaan sebagai berikut: 4.1. Hasil Klasifikasi k-nn k-nn menunjukkan presisi yang kurang bagus, terutama untuk klasifikasi kelas C. Hasil lengkapnya disajikan pada confusion matrix berikut ini. Confusion Matrix Naïve Bayes di atas adalah sebagai berikut: termasuk kelas B sebanyak 27 record. termasuk kelas D sebanyak 28 record. Positive (TP) = 112. Jadi, jumlah Classifier Naïve Bayes sebanyak 112 record. Jumlah dihitung dengan (112/123)*100% = 91%. Prosiding SIMNASIPTEK: Hal. A-103

4 4.3. Hasil Klasifikasi C 4.5 C 4.5 menunjukkan presisi yang sempurna untuk klasifikasi kelas D. Hasil lengkapnya disajikan pada confusion matrix Tabel 3. Confusion Matrix C 4.5 Confusion Matrix C 4.5 di atas adalah sebagai berikut: termasuk kelas B sebanyak 29 record. termasuk kelas D sebanyak 33 record. Positive (TP) = 119. Jadi, jumlah Classifier Decision Tree sebanyak 119 record. Jumlah dihitung dengan (119/123)*100% = 97 % Hasil Klasifikasi Random Forest Random Forest menunjukkan presisi yang sempurna untuk klasifikasi kelas D, seperti C 4.5. Hasil lengkapnya disajikan pada confusion matrix Tabel 4. Confusion Matrix Random Forest Confusion Matrix Random Forest di atas adalah sebagai berikut: termasuk kelas B sebanyak 28 record. termasuk kelas D sebanyak 33 record. Positive (TP) = 118. Jadi, jumlah Classifier Random Forest sebanyak 118 record. Jumlah seluruh record adalah 123 record sehingga accuracy dihitung dengan (118/123)*100% = 96 % Hasil Klasifikasi ANNs ANNs menunjukkan presisi yang sempurna untuk klasifikasi kelas D, seperti C 4.5 dan Random Forest. Namun, presisi untuk kelas A tidak bagus. Hasil lengkapnya disajikan pada confusion matrix Tabel 5. Confusion Matrix ANNs Confusion Matrix ANNs di atas adalah sebagai berikut: termasuk kelas A sebanyak 28 record. termasuk kelas B sebanyak 23 record. termasuk kelas C sebanyak 30 record. termasuk kelas D sebanyak 32 record. Positive (TP) = 113. Jadi, jumlah Classifier ANNs sebanyak 113 record. Jumlah dihitung dengan (113/123)*100% = 92 % Hasil Uji Beda Untuk mengetahui perbandingan dari kelima algoritma yang digunakan pada percobaan digunakan T-Test untuk menguji perbedaan dari kelima algoritma tersebut. Pengujian menggunakan T-Test akan memasangkan setiap algoritma dengan seluruh algoritma lain sehingga total ada 10 pasangan atau 10 hasil T-Test. Hasilnya ditunjukkan pada tabel Tabel 6. Hasil T-Test Setiap algoritma diwakilkan oleh nilai akurasinya dengan skala nilai 0 sampai dengan 1. Untuk nilai hasil T-Test juga memiliki skala yang Prosiding SIMNASIPTEK: Hal. A-104

5 sama. Sebagai patokan ukuran besarnya perbedaan digunakan alpha yang nilainya Nilai hasil T-Test yang besarnya dibawah alpha menunjukkan adanya perbedaan yang cukup signifikan dari pasangan algoritma tersebut. Pada tabel, hasil seperti ini dicetak tebal. Hasil T-Test yang terkecil ditunjukkan oleh pasangan algoritma k-nn dengan C 4.5, yaitu Ini menunjukkan, hasil dari klasifikasi menggunakan k-nn jika dibandingkan dengan menggunakan C 4.5 menunjukkan perbedaan yang paling signifikan diantara pasangan algoritma yang lain. Hasil T-Test yang terbesar ditunjukkan oleh pasangan algoritma Naïve Bayes dengan ANNs, yaitu Ini menunjukkan, hasil dari klasifikasi menggunakan Naïve Bayes jika dibandingkan dengan menggunakan ANNs menunjukkan perbedaan yang paling tidak signifikan diantara pasangan algoritma yang lain. Berdasarkan ukuran akurasi maka C 4.5 merupakan algoritma yang terbaik untuk melaksanakan klasifikasi dari dataset yang digunakan dengan akurasi 97%. V. KESIMPULAN Berdasarkan percobaan yang telah dilaksanakan dapat ditarik kesimpulan bahwa algoritma yang terbaik untuk melaksanakan klasifikasi terhadap dataset mulai dari yang terbaik adalah Decision Tree, Random Forest, ANNs, Naïve Bayes, dan terakhir k-nn. Tabel 7. Perbandingan Akurasi Classifier ANNs memiliki akurasi yang lebih tinggi dibanding Naïve Bayes. Untuk akurasi prediksi perkelas, prediksi KELAS A sedangkan akurasi tertinggi untuk prediksi KELAS D. Random Forest memiliki akurasi yang lebih tinggi dibanding ANNs. Untuk akurasi prediksi perkelas, prediksi KELAS B dan KELAS C sedangkan akurasi tertinggi untuk prediksi KELAS D. Kelima classifier sepakat mampu memprediksi dengan tingkat akurasi tertinggi untuk KELAS D. Adapun untuk akurasi terendah mereka berbeda-beda. C 4.5 memiliki akurasi yang tertinggi dibanding yang lain. Untuk akurasi prediksi perkelas, prediksi KELAS B sedangkan akurasi tertinggi untuk prediksi KELAS D. Penelitian ini dapat dikembangkan dengan menggunakan lebih banyak attribut pada dataset. Attribut-attribut yang mungkin digunakan, misalnya kehadiran, nilai UTS, nilai UAS, dan sebagainya. Selain itu, penelitian yang dapat dilakukan juga dengan menggunakan metode data mining lainnya, misalnya clustering menggunakan algoritma k-mean. Berdasarkan hasil penelitian ini maka dapat diadakan penelitian lanjutan untuk mengimplementasikan algoritma terbaik, yakni C 4.5 untuk membuat model klasifikasi yang dapat digunakan untuk mengklasifikasi dan memprediksi data peserta didik. REFERENSI k-nn memiliki akurasi yang paling kecil. Untuk akurasi prediksi per-kelas, akurasi yang paling rendah adalah untuk prediksi KELAS C sedangkan akurasi tertinggi untuk prediksi KELAS D. Naïve Bayes memiliki akurasi yang lebih tinggi dibanding k-nn. Untuk akurasi prediksi perkelas, prediksi KELAS C sedangkan akurasi tertinggi untuk prediksi KELAS D. Han, Jiawei (2012). Data Mining. Concept and Techniques Third Edition. Elsevier Inc. Ye, Nong (2014). Data Mining. Theories, Algorithms, and Examples. Taylor & Francis Group, LLC. Prosiding SIMNASIPTEK: Hal. A-105

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB 1 PENDAHULUAN 1-1

BAB 1 PENDAHULUAN 1-1 BAB 1 PENDAHULUAN Bab ini menguraikan penjelasan umum mengenai tugas akhir yang dikerjakan. Penjelasan tersebut meliputi latar belakang masalah, tujuan tugas akhir, lingkup tugas akhir, metodologi yang

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2017, pp. 368~372 368 PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI Adhika Novandya AMIK BSI Bekasi e-mail:

Lebih terperinci

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout  Data mining BAB 1 PENDAHULUAN Bab ini membahas mengenai latar belakang masalah, identifikasi masalah, ruang lingkup tugas akhir, maksud dan tujuan tugas akhir, metode penelitian tugas akhir, dan sistematika penulisan

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

SNIPTEK 2014 ISBN:

SNIPTEK 2014 ISBN: KOMPARASI MENGGUNAKAN ALGORITMA C4.5, NEURAL NETWORK DAN NAÏVE BAYES DALAM PREDIKSI UJIAN KOMPENTENSI SMK MAHADHIKA 4 JAKARTA Aswan Supriyadi Sunge STMIK Nusa Mandiri mardian82@gmail.com Kaman Nainggolan

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN Penelitian ini adalah penelitian eksperimen dengan langkah-langkah atau metode penelitian sebagai berikut: 1. Penentuan Masalah Penentuan masalah ini diperoleh dari studi literature

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

Penerapan Algoritma Klasifikasi Data Mining C4.5 Pada Dataset Cuaca Wilayah Bekasi

Penerapan Algoritma Klasifikasi Data Mining C4.5 Pada Dataset Cuaca Wilayah Bekasi Penerapan Algoritma Klasifikasi Data Mining C4.5 Pada Dataset Cuaca Wilayah Bekasi Adhika Novandya 1, Isni Oktria 2 Program Studi Manajemen Informatika, AMIK Bina Sarana Informatika 1 Jurusan Teknik Informatika,

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : Tabel 2.1 Penelitian sebelumnya Parameter Penulis Objek Metode Hasil

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

BAB I PENDAHULUAN.

BAB I PENDAHULUAN. BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini smartphone telah berevolusi menjadi komputer pribadi kecil dan portabel yang memungkinkan pengguna untuk melakukan penjelajahan internet, mengirim e-mail

Lebih terperinci

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN: KAJIAN KOMPARASI ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK DALAM PEMILIHAN PENERIMA BEASISWA (Studi Kasus pada SMA Muhammadiyah 4 Jakarta ) Ulfa Pauziah Program Studi Teknik Informatika, Universitas

Lebih terperinci

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh :

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh : ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI Oleh : Frista Yulianora 1401128832 Muchammad Hasbi Latif 1401136065 Rika Jubel Febriana

Lebih terperinci

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU Aradea, Satriyo A., Ariyan Z., Yuliana A. Teknik Informatika Universitas Siliwangi Tasikmalaya Ilmu Komputer Universitas Diponegoro

Lebih terperinci

Penerapan Metode Neural Network Berbasis Algoritma Genetika Untuk Prediksi Penyakit Kanker Payudara

Penerapan Metode Neural Network Berbasis Algoritma Genetika Untuk Prediksi Penyakit Kanker Payudara JURNAL TECH-E - VOL. NO. (207) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 258-96 (Online) Artikel Penerapan Metode Neural Network Berbasis Algoritma Genetika Untuk Prediksi

Lebih terperinci

BAB I PENDAHULUAN. Hal ini dibuktikan dengan adanya fakta yang diungkap oleh World Health

BAB I PENDAHULUAN. Hal ini dibuktikan dengan adanya fakta yang diungkap oleh World Health BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Manusia dapat mendeteksi rangsangan dari luar tubuh dengan adanya alat tubuh yang dinamakan indera. Indera yang digunakan untuk mendeteksi adanya rangsangan

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION Hamsir Saleh Hamsir.saleh@gmail.com Fakultas Ilmu Komputer Universitas Ichsan Gorontalo Abstrak Memprediksi kebangkrutan

Lebih terperinci

BAB 2. Landasan Teori

BAB 2. Landasan Teori BAB 2 Landasan Teori 2.1 Pengertian Data Mining Menurut Han dan Kamber (2011:6) menjelaskan bahwa Data Mining merupakan pemilihan atau menggali pengetahuan dari jumlah data yang banyak. Berbeda dengan

Lebih terperinci

Lingkungan Pengembangan HASIL DAN PEMBAHASAN

Lingkungan Pengembangan HASIL DAN PEMBAHASAN aturan 3--5 untuk menentukan interval akan dibagi menjadi berapa kelompok. Hasilnya akan menjadi hirarki paling atas. Kemudian nilai maksimum dan nilai minimum diperiksa apakah nilainya masuk ke dalam

Lebih terperinci

1. BAB I PENDAHULUAN 1.1 Latar Belakang

1. BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini dunia telah memasuki era dimana masyarakat dapat secara bebas menyuarakan pendapat mereka di berbagai media, salah satunya melalui media sosial. Masyarakat

Lebih terperinci

DAFTAR ISI Transformasi data... 47

DAFTAR ISI Transformasi data... 47 DAFTAR ISI HALAMAN JUDUL... i HALAMAN PENGESAHAN... ii HALAMAN PERNYATAAN... iii PRAKATA... iv DAFTAR ISI... vi DAFTAR TABEL... ix DAFTAR GAMBAR... xi INTISARI... xiii ABSTRACT... xiv BAB I PENDAHULUAN...

Lebih terperinci

Pemanfaatan Educational Data Mining (EDM)...

Pemanfaatan Educational Data Mining (EDM)... PEMANFAATAN EDUCATIONAL DATA MINING (EDM) UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS: TI-S1 UDINUS) Defri Kurniawan 1*, Wibowo Wicaksono 1 dan Yani Parti Astuti 1 1

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

KLASIFIKASI METODE NAIVE BAYES UNTUK KELANCARAN PEMBAYARAN KREDIT LEASING SEPEDA MOTOR

KLASIFIKASI METODE NAIVE BAYES UNTUK KELANCARAN PEMBAYARAN KREDIT LEASING SEPEDA MOTOR Technologia Vol 8, No.3, Juli September 2017 146 KLASIFIKASI METODE NAIVE BAYES UNTUK KELANCARAN PEMBAYARAN KREDIT LEASING SEPEDA MOTOR Fakultas Teknologi Informasi Universitas Islam Kalimantan Muhammad

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

Analisis Hubungan antar Faktor dan Komparasi Algoritma Klasifikasi pada Penentuan Penundaan Penerbangan

Analisis Hubungan antar Faktor dan Komparasi Algoritma Klasifikasi pada Penentuan Penundaan Penerbangan Analisis Hubungan antar Faktor dan Komparasi Algoritma Klasifikasi pada Penentuan Penundaan Penerbangan Danny Ibrahim 1*) 1 Program Magister Teknik Informatika, Fakultas Ilmu Komputer, Universitas Dian

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Studi Sebelum menyusun tugas akhir ini dilakukan tinjauan pustaka terlebih dahulu terhadap penelitian-penelitian terkait sebagai bahan referensi. Penelitian tentang

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1.1 Data Training Data training adalah data yang digunakan untuk pembelajaran pada proses data mining atau proses pembentukan pohon keputusan.pada penelitian ini

Lebih terperinci

Data ini berisi 13 atribut, yaitu. Dengan tipe atribut, yaitu

Data ini berisi 13 atribut, yaitu. Dengan tipe atribut, yaitu Hai khalayak ramai, pada kesempatan kali ini aku mau ngasik tutorial yang berkaitan dengan data mining. Apa sih itu data mining?? Data mining adalah suatu proses menemukan knowledge atau informasi dari

Lebih terperinci

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN BERBASIS DECISION TREE

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN BERBASIS DECISION TREE MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN BERBASIS DECISION TREE Rina Fiati 1, Putri Kurnia Handayani 2 1 Program Studi Teknik Informatika, Fakultas Teknik, Universitas Muria Kudus Gondangmanis,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Decision Tree Definisi Decision tree adalah sebuah diagram alir yang berbentuk seperti struktur pohon yang mana setiap internal node menyatakan pengujian terhadap suatu atribut,

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

Neural Network dan Implementasinya Dalam Data Mining. Rudolf Rudi Hermanto. Institut Teknologi Bandung.

Neural Network dan Implementasinya Dalam Data Mining. Rudolf Rudi Hermanto. Institut Teknologi Bandung. Neural Network dan Implementasinya Dalam Data Mining Rudolf Rudi Hermanto Institut Teknologi Bandung rudolf@students.itb.ac.id Abstrak Untuk mendapatkan informasi yang berharga dibutuhkan algoritma-algoritma

Lebih terperinci

ALGORITMA DECISION TREE (C4.5) UNTUK MEMPREDIKSI KEPUASAN MAHASISWA TERHADAP KINERJA DOSEN POLITEKNIK TEDC BANDUNG

ALGORITMA DECISION TREE (C4.5) UNTUK MEMPREDIKSI KEPUASAN MAHASISWA TERHADAP KINERJA DOSEN POLITEKNIK TEDC BANDUNG ALGORITMA DECISION TREE (C4.5) UNTUK MEMPREDIKSI KEPUASAN MAHASISWA TERHADAP KINERJA DOSEN POLITEKNIK TEDC BANDUNG Ade Yuliana 1, Duwi Bayu Pratomo 2 1,2 Program Studi Teknik Informatika - Politeknik TEDC

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang 1 1.1 Latar Belakang BAB I PENDAHULUAN Dalam Peraturan Menteri Agama Republik Indonesia Nomor 30 Tahun 2014 tentang Biaya Kuliah Tunggal dan Uang Kuliah Tunggal pada Perguruan Tinggi Keagamaan Negeri di

Lebih terperinci

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG Andri 1), Yesi Novaria Kunang 2), Sri Murniati 3) 1,2,3) Jurusan Sistem Informasi Universitas

Lebih terperinci

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penerimaan mahasiswa baru merupakan proses yang selalu dilakukan setiap tahunnya oleh Universitas Kristen Duta Wacana Yogyakarta (UKDW). Mahasiswa baru merupakan mahasiswa

Lebih terperinci

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA Laily Hermawanti Program Studi Teknik Informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro No. 1B

Lebih terperinci

KOMPORASI METODE KLASIFIKASI DATA MINING UNTUK PREDIKSI PENYAKIT JANTUNG

KOMPORASI METODE KLASIFIKASI DATA MINING UNTUK PREDIKSI PENYAKIT JANTUNG KOMPORASI METODE KLASIFIKASI DATA MINING UNTUK PREDIKSI PENYAKIT JANTUNG Abdul Rohman Fakultas Teknik Universitas Pandanaran Jl. Banjarsari Barat No.1 Semarang email: abdulrohman@unpand.ac.id ABSTRAK Dalam

Lebih terperinci

PROSIDING ISSN:

PROSIDING ISSN: PM-19 PREDIKSI PERFORMA AKADEMIK SISWA PADA PELAJARAN MATEMATIKA MENGGUNAKAN BAYESIAN NETWORKS DAN ALGORITMA KLASIFIKASI MACHINE LEARNING Betha Nurina Sari Teknik Informatika, Fakultas Ilmu Komputer, Universitas

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

KLASIFIKASI UNTUK DIAGNOSA DIABETES MENGGUNAKAN METODE BAYESIAN REGULARIZATION NEURAL NETWORK (RBNN)

KLASIFIKASI UNTUK DIAGNOSA DIABETES MENGGUNAKAN METODE BAYESIAN REGULARIZATION NEURAL NETWORK (RBNN) JURNAL INFORMATIKA VOL.11.NO1, JAN 2017 KLASIFIKASI UNTUK DIAGNOSA DIABETES MENGGUNAKAN METODE BAYESIAN REGULARIZATION NEURAL NETWORK (RBNN) M.Fadly Rahman 1, M.Ilham Darmawidjadja 2, Dion Alamsah 3 Teknik

Lebih terperinci

PENERAPAN ALGORITMA C4.5 BERBASIS ADABOOST UNTUK PREDIKSI PENYAKIT JANTUNG

PENERAPAN ALGORITMA C4.5 BERBASIS ADABOOST UNTUK PREDIKSI PENYAKIT JANTUNG PENERAPAN ALGORITMA C4.5 BERBASIS ADABOOST UNTUK PREDIKSI PENYAKIT JANTUNG Abdul Rohman 1, Vincent Suhartono 2, Catur Supriyanto 3 123 Pasca Sarjana Teknik Informatika Universitas Dian Nuswantoro ABSTRACT

Lebih terperinci

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai

Lebih terperinci

1. Model Prediksi Ini Menggunakan Tools RapidMiner

1. Model Prediksi Ini Menggunakan Tools RapidMiner 1. Model Prediksi Ini Menggunakan Tools RapidMiner RapidMiner memiliki keunggulan tersendiri, RapidMiner merupakan aplikasi data mining berbasis sistem open-source dunia yang terkemuka dan ternama. Tersedia

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO)

PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO) PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO) Levina Fitri Rahmawati, Isnandar Slamet, dan Diari Indriati Program

Lebih terperinci

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE Putri Kurnia Handayani Program Studi Sistem Informasi, Fakultas Teknik, Universitas Muria Kudus Gondangmanis, PO Box

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : E124909 / Data Mining Revisi ke : 4 Satuan Kredit Semester : 2 SKS Teori Tgl revisi : 16 Juli 2015 Jml Jam kuliah dalam seminggu

Lebih terperinci

PENERAPAN ALGORITMA C4.5 BERBASIS ADABOOST UNTUK PREDIKSI PENYAKIT JANTUNG

PENERAPAN ALGORITMA C4.5 BERBASIS ADABOOST UNTUK PREDIKSI PENYAKIT JANTUNG PENERAPAN ALGORITMA C4.5 BERBASIS ADABOOST UNTUK PREDIKSI PENYAKIT JANTUNG Abdul Rohman ) Abstrak Penyakit jantung adalah terjadinya penyumbatan sebagian atau total dari suatu lebih pembuluh darah, akibatnya

Lebih terperinci

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Metode Klasifikasi Data Mining dan Teknik Sampling Smote... METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Hairani

Lebih terperinci

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA Erik Hadi Saputra 1), Burhan Alfironi Muktamar 2) 1), 2) Teknik Informatika

Lebih terperinci

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien 1 Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien Ketut Wisnu Antara 1, Gede Thadeo Angga Kusuma 2 Jurusan Pendidikan Teknik Informatika Universitas Pendidikan Ganesha

Lebih terperinci

PREDIKSI KEBERHASILAN TELEMARKETING BANK UNTUK MENCARI ALGORITMA DENGAN PERFORMA TERBAIK

PREDIKSI KEBERHASILAN TELEMARKETING BANK UNTUK MENCARI ALGORITMA DENGAN PERFORMA TERBAIK PREDIKSI KEBERHASILAN TELEMARKETING BANK UNTUK MENCARI ALGORITMA DENGAN PERFORMA TERBAIK Elin Panca Saputra Jurusan Manajemen Informatika, AMIK BSI Jakarta Jl. Kamal Raya No. 18, Ringroad, Cengkareng,

Lebih terperinci

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode

Lebih terperinci

BAB I PENDAHULUAN. berjudul Kualitas SDM Indonesia di Dunia, Indonesia berada pada peringkat 108

BAB I PENDAHULUAN. berjudul Kualitas SDM Indonesia di Dunia, Indonesia berada pada peringkat 108 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam situs www.internetworldstats.com, Indonesia merupakan negara yang memiliki jumlah penduduk terpadat nomor empat di dunia pada tahun 2015. Dengan reputasi

Lebih terperinci

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering. BAB I PENDAHULUAN 1.1. Latar Belakang Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data. Informasi yang

Lebih terperinci

Prediksi Nasabah yang Berpotensi Membuka Simpanan Deposito Menggunakan Naive Bayes Berbasis Particle Swarm Optimization

Prediksi Nasabah yang Berpotensi Membuka Simpanan Deposito Menggunakan Naive Bayes Berbasis Particle Swarm Optimization Prediksi Nasabah yang Berpotensi Membuka Simpanan Deposito Menggunakan Naive Bayes Berbasis Particle Swarm Optimization Alvino Dwi Rachman Prabowo Program Studi Teknik Informatika, Fakultas Ilmu Komputer,

Lebih terperinci

Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa

Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa Liliana Swastina Program Studi Sistem Informasi Sekolah Tinggi Manajemen Informatika dan Komputer (STMIK) Indonesia Banjarmasin, Indonesia lilisera@gmail.com

Lebih terperinci

Penerapan Algoritma Cart Untuk Memprediksi Status Kelulusan Mahasiswa

Penerapan Algoritma Cart Untuk Memprediksi Status Kelulusan Mahasiswa ISSN: 2089-3787 1215 Penerapan Algoritma Cart Untuk Memprediksi Status Kelulusan Mahasiswa Muhammad Faisal Amin Program Studi Teknik Informatika, STMIK Banjarbaru Jl. A. Yani Km. 33,3 Banjarbaru Faisal.indonesia@gmail.com

Lebih terperinci

I.1 Latar Belakang Masalah Seiring berjalannya waktu dan perkembangan teknologi media penyimpanan elektronik, setiap organisasi dapat menyimpan

I.1 Latar Belakang Masalah Seiring berjalannya waktu dan perkembangan teknologi media penyimpanan elektronik, setiap organisasi dapat menyimpan BAB. I. PENDAHULUAN I.1 Latar Belakang Masalah Seiring berjalannya waktu dan perkembangan teknologi media penyimpanan elektronik, setiap organisasi dapat menyimpan datanya secara elektronik dan bersifat

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA Anik Andriani Program Studi Manajemen Informatika, AMIK BSI Jakarta Jl. RS Fatmawati 24, Pondok

Lebih terperinci

Komparasi Algoritma Data Mining Untuk Akurasi Penentuan Beasiswa Kurang Mampu IAIN Syekh Nurjati Cirebon

Komparasi Algoritma Data Mining Untuk Akurasi Penentuan Beasiswa Kurang Mampu IAIN Syekh Nurjati Cirebon Komparasi Algoritma Data Mining Untuk Akurasi Penentuan Beasiswa Kurang Mampu IAIN Syekh Nurjati Cirebon Arif Maulana Fakultas Ilmu Komputer, Dian Nuswantoro University Email: id.arifmaulana@gmail.com

Lebih terperinci

BAB II TINJAUAN PUSTAKA. sekumpulan besar data yang tersimspan dalam penyimpanan dengan

BAB II TINJAUAN PUSTAKA. sekumpulan besar data yang tersimspan dalam penyimpanan dengan BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Data Mining A. Pengertian Data Mining Menurut Gartner Group data mining adalah suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan

Lebih terperinci

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari BAB I PENDAHULUAN 1.1 Latar Belakang Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari internet ataupun milik pribadi juga semakin berkembang. Permasalahan utama adalah bagaimana memperoleh

Lebih terperinci

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel BAB III PEMBAHASAN A. Sumber Data Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel peminjam dengan jaminan sertifikat tanah, tunjuk, dan Buku Pemilik Kendaraan Bermotor (BPKB) serta

Lebih terperinci

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES Analisis Klasifikasi pada Nasabah... (Ahadiyah Nurul Kholifah) 1 ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES CLASSIFICATION ANALYSIS OF CREDIT CUSTOMERS

Lebih terperinci

Belajar Mudah Algoritma Data Mining : C4.5

Belajar Mudah Algoritma Data Mining : C4.5 Belajar Mudah Algoritma Data Mining : C4.5 Algoritma data mining C4.5 merupakan salah satu algoritma yang digunakan untuk melakukan klasifikasi atau segmentasi atau pengelompokan dan bersifat prediktif.

Lebih terperinci

KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR

KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR Dewi Pramudi Ismi 1), Ardiansyah 2) 1 Program Studi Teknik Informatika, Fakultas Teknologi Industri,

Lebih terperinci

ALGORITMA NAÏVE BAYES UNTUK PENENTUAN JURUSAN PADA SISWA MADRASAH ALIYAH

ALGORITMA NAÏVE BAYES UNTUK PENENTUAN JURUSAN PADA SISWA MADRASAH ALIYAH Technologia Vol 9, No.1, Januari Maret 218 42 AGORITMA NAÏVE BAYES UNTUK PENENTUAN JURUSAN PADA SISWA MADRASAH AIYAH Fakhriani Ekawati Fakultas Teknologi Informasi Universitas Islam Kalimantan Muhammad

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK PERBANDINGAN KLASIFIKASI KNN DAN NAIVE BAYESIAN SERTA PERBANDINGAN CLUSTERING SIMPLE K-MEANS YANG MENGGUNAKAN DISTANCE FUNCTION MANHATTAN DISTANCE DAN EUCLIDIAN DISTANCE PADA DATASET Dresses_Attribute_Sales

Lebih terperinci

STUDI KELAYAKAN PEMBUKAAN CABANG BARU BISNIS USAHA MENGGUNAKAN MODEL PREDIKTIF

STUDI KELAYAKAN PEMBUKAAN CABANG BARU BISNIS USAHA MENGGUNAKAN MODEL PREDIKTIF STUDI KELAYAKAN PEMBUKAAN CABANG BARU BISNIS USAHA MENGGUNAKAN MODEL PREDIKTIF Warnia Nengsih Prodi Sistem Informasi, Jurusan Komputer Politeknik Caltex Riau Jl. Umbansari No1 Rumbai Pekanbaru Riau 28265

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Pada BAB II ini akan disampaikan materi-materi yang berkaitan dengan konsep data mining, yang merupakan landasan bagi pembahasan klasifikasi untuk evaluasi kinerja pegawai. 2. 1 Tinjauan

Lebih terperinci

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa, BAB II TINJAUAN PUSTAKA 2.1 Terdahulu Dalam penelitian ini, peneliti juga menyertakan beberapa uraian singkat mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa, klasifikasi, metode

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu pelayanan dalam dunia perbankan adalah pemberian pinjaman kredit kepada nasabah yang memenuhi syarat perbankan. kredit merupakan sumber utama penghasilan

Lebih terperinci

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, 233-240 233 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Prediksi Ketepatan Waktu Lulus Mahasiswa dengan k- Nearest Neighbor dan Naïve Bayes

Lebih terperinci

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK)

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK) IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK) [1] Beti Novianti, [2] Tedy Rismawan [3] Syamsul Bahri [1][2][3] Jurusan Sistem Komputer, Fakultas

Lebih terperinci