1. Model Prediksi Ini Menggunakan Tools RapidMiner

dokumen-dokumen yang mirip
BAB III METODE PENELITIAN

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

PREDIKSI NILAI PROYEK AKHIR MAHASISWA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING

KAJIAN PERANCANGAN RULE KENAIKAN JABATAN PADA PT. ABC

BAB II LANDASAN TEORI

DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PREDIKSI NILAI PROYEK AKHIR MAHASISWA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING

BAB IV HASIL DAN PEMBAHASAN

IMPLEMENTASI BUSINESS INTELLIGENCE UNTUK MENENTUKAN MAHASISWA PENERIMA BEASISWA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODE PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

Analisis Hubungan antar Faktor dan Komparasi Algoritma Klasifikasi pada Penentuan Penundaan Penerbangan

KOMPARASI ALGORITMA NAÏVE BAYES DAN K- NEAREST NEIGHBOR UNTUK DETEKSI KANKER PAYUDARA

KLASIFIKASI METODE NAIVE BAYES UNTUK KELANCARAN PEMBAYARAN KREDIT LEASING SEPEDA MOTOR

BAB 2 TINJAUAN PUSTAKA

ALGORITMA C4.5 UNTUK PREDIKSI HASIL PEMILIHAN LEGISLATIF DPRD DKI JAKARTA

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

Versi Online tersedia di : JURNAL TECH-E (Online)

BAB 3 METODE PENELITIAN

BAB II KAJIAN PUSTAKA. pola seperti teknik statistic dan matematika (Larose, 2005).

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Data Mining Outline BAB I Pendahuluan. Proses Data Mining. Recap

Metode C45 Untuk Mengklarifikasi Pelanggan Perusahaan Telekomunikasi Seluler

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

KAJIAN KOMPARASI PENERAPAN ALGORITMA C4.5, NEURAL NETWORK, DAN SVM DENGAN TEKNIK PSO UNTUK PEMILIHAN KARYAWAN TELADAN PT. XYZ

PERBANDINGAN DECISION TREE

BAB I PENDAHULUAN. 1.1 Latar Belakang

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

Klasifikasi Berbasis Algoritma C4.5 untuk Deteksi Kenaikan Case Fatality Rate Demam Berdarah

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

ANALISIS PENENTUAN KARYAWAN TERBAIK MENGGUNAKAN METODE ALGORITMA NAIVE BAYES (STUDI KASUS PT. XYZ)

Analisis Kualitas Data dan Klasifikasi Data Pasien Kanker

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

PENCARIAM JURUSAN SUBANG DENGAN ALGORITMA C 4.5 DAN DATA MINING STMIK SUBANG Timbo Faritcan Parlaungan Siallagan

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB III METODE PENELITIAN

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

SELEKSI MOBIL BERDASARKAN FITUR DENGAN KOMPARASI METODE KLASIFIKASI NEURAL NETWORK, SUPPORT VECTOR MACHINE, DAN ALGORITMA C4.5

PENERAPAN ALGORITMA C4.5 BERBASIS ADABOOST UNTUK PREDIKSI PENYAKIT JANTUNG

Prediksi Kenaikan Rata-Rata Volume Perikanan Tangkap Dengan Teknik Data Mining

KAJIAN ALGORITMA NAÏVE BAYES DALAM PEMILIHAN PENERIMAAN BEASISWA TINGKAT SMA

KOMPARASI 5 METODE ALGORITMA KLASIFIKASI DATA MINING PADA PREDIKSI KEBERHASILAN PEMASARAN PRODUK LAYANAN PERBANKAN

BAB 2 TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

MODEL ALGORITMA K-NEAREST NEIGHBOR

BAB I PENDAHULUAN Latar Belakang

Application Determination Of Credit Feasibility in Sharia Cooperative

BAB 1 PENDAHULUAN 1-1

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE

PENERAPAN ALGORITMA C4.5 BERBASIS ADABOOST UNTUK PREDIKSI PENYAKIT JANTUNG

BAB I 1 PENDAHULUAN. atas sekelompok vertebra, invertebrate discs, saraf, otot, medulla, dan sendi

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN BERBASIS DECISION TREE

Klasifikasi Penerimaan Mahasiswa Baru Menggunakan Algortima C4.5 Dan Adaboost (Studi Kasus : STMIK XYZ)

Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

PREDIKSI PENYAKIT DIABETES MENGGUNAKAN NAIVE BAYES DENGAN OPTIMASI PARAMETER MENGGUNAKAN ALGORITMA GENETIKA

LEARNING. Program Studi Ilmu Komputer FPMIPA UPI RNI IK460(Kecerdasan Buatan)

CONTOH KASUS DATA MINING

BAB 1 PENDAHULUAN 1.1 Latar Belakang

PERBANDINGAN ALGORITMA KLASIFIKASI DATA MINING MODEL C4.5 DAN NAIVE BAYES UNTUK PREDIKSI PENYAKIT DIABETES

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

Komparasi Akurasi Algoritma C4.5 dan Naïve Bayes untuk Prediksi Pendonor Darah Potensial dengan Dataset RFMTC

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

PENERAPAN ALGORITMA NAIVE BAYES UNTUK KLASIFIKASI PENERIMA BEASISWA PRESTASI

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE

ANALISIS SENTIMEN OPINI PUBLIK BERITA KEBAKARAN HUTAN MELALUI KOMPARASI ALGORITMA SUPPORT VECTOR MACHINE

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

Komparasi Algoritma Data Mining Untuk Akurasi Penentuan Beasiswa Kurang Mampu IAIN Syekh Nurjati Cirebon

KLASIFIKASI PADA TEXT MINING

PENERAPAN ALGORTIMA C4.5 UNTUK PENENTUAN KELAYAKAN KREDIT

Data Mining II Estimasi

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

ii

PENERAPAN METODE KLASIFIKASI DATA MINING UNTUK PREDIKSI KELULUSAN TEPAT WAKTU. Asep Saefulloh 1, Moedjiono 2

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

Apa itu is K-Nearest Neighbor (KNN) Algorithm?

SNIPTEK 2014 ISBN:

BAB I PENDAHULUAN 1.1 Latar Belakang

Transkripsi:

1. Model Prediksi Ini Menggunakan Tools RapidMiner RapidMiner memiliki keunggulan tersendiri, RapidMiner merupakan aplikasi data mining berbasis sistem open-source dunia yang terkemuka dan ternama. Tersedia sebagai aplikasi yang berdiri sendiri untuk analisis data dan sebagai data mining. Solusi yang diusung antara lain Integrasi data, analisis ETL, analisis data dan pelaporan dalam satu suite tunggal. Memiliki antarmuka pengguna grafis yang intuitif untuk desain analisis proses, serta fleksibel terdapat banyak transformasi data, pemodelan data, dan metode visualisasi data. 2. Model Prediksi Elektabilitas Caleg a. Modeling Decision Tree Decision tree adalah model prediksi yang digambarkan dengan struktur pohon atau struktur berhirarki. Konsep dari decision tree adalah membantu user dalam mengubah data menjadi pohon keputusan dan syarat-syarat keputusan agar lebih mudah dipahami dan dipetakan.

Deskripsi : Jika calon memiliki suara sah lebih dari 3.082 maka akan terpilih menjadi anggota legislatif. Jika kurang dari 3082 akan dipertimbangkan dalam dua klasifikasi yaitu jumlah suara >2418 dan 2418 jika suara sah caleg 2418 akan dibagi lagi ke dalam kelompok suara sah caleg jika memiliki 1436.500 maka caleg tidak akan terpilih jika jumlah suara >1436.500 dan terdapat >1468 suara maka tidak akan terpilih dan jika 1468 maka akan terpilih menjadi anggota legislatif Dalam jumlah suara sebanyak >2418 terbagi menjadi dua klasifikasi yaitu apabila suara yang dimiliki >2935 maka caleg tidak akan terpilih. Dan jika 2935 akan ditentukan oleh suara sah partai dan daerah pemilihan untuk menentukan terpilih atau tidaknya menjadi anggota legislatif Jika memiliki suara sah partai berjumlah 16443 maka tidak akan terpilih menjadi anggota legislative. Jika memiliki suara sah partai >16443 maka akan ditentukan dari daerah pemilihannya. Jika daerah pemilih memiliki suara 1.500 maka caleg tersebut akan terpilih menjadi legislatif Kemudian jika memiliki suara daerah pemilihan >1.500 akan ditentukan dari suara sah partai. Jika suara sah partai >83822 maka tidak akan terpilih menjadi anggota legislatif. Dan jika suara sah partai 83822 akan ditinjau kembali dari suara sah caleg. Jika suara sah caleg >2445.500 maka ia akan terpilih menjadi anggota legislatif, dan jika 2445.500 maka tidak akan terpilih.

b. Modeling Naïve Bayes Naive Bayes merupakan suatu klasifikasi berpeluang sederhana berdasarkan teorema Bayes dengan asumsi antar variabel penjelas saling bebas (independen).

c. Modeling K-nn K-Neares Neighbour (K-NN) adalah sebuah metde klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Berdasarkan pernyataan tersebut dapat diartikan bahwa dari data yang dianalisis terdapat 425 data dengan 10 dimensi (atribut) untuk menentukan target ya dan tidak.

3. Evaluasi dan Akurasi Decision Tree (C4.5) Native Bayers (NB) K-Nearest Neighbor(K-NN) Akurasi 93.16 % 83.73 % 89.63 % Minus 4.45 % 4.25 % 2.21 % AUC 0.915 0.840 0.500 Kesimpulan : Berdasarkan tabel diatas, Model Decision Tree memiliki akurasi tertinggi dengan nilai sebesar 93.16 % diikuti K-nn dengan nilai 89.63 % dan pada urutan terakhir Naïve Bayes dengan akurasi paling rendah sebsar 83.73 %. Dari hasil tersebut dapat ditarik kesimpulan bahwa modeling yang paling baik digunakan untuk dataset tersebut yaitu Decision Tree model, karena memiliki akurasi prediksi paling besar dengan nilai presentase sebesar 93.16 % diantara ketiga model, dapat diartikan analisis yang dihasilkan dari Model Decision Tree memiliki kemungkinan menjadi kenyataan paling besar dan tepat.

Untuk melakukan validasi terhadap Tree yang dihasilkan, digunakan nilai dari area dibawah kurva ROC (AUC/Area Under Curve ). Menurut Gorunescu (2011), hasil perhitungan yang divisualisasikan dengan kurva ROC (Receiver Operating Characteristic) atau AUC (Area Under Curve). ROC memiliki tingkat nilai diagnosa yaitu : a. Akurasi bernilai 0.90 1.00 = excellent classification b. Akurasi bernilai 0.80 0.90 = good classification c. Akurasi bernilai 0.70 0.80 = fair classification d. Akurasi bernilai 0.60 0.70 = poor classification e. Akurasi bernilai 0.50 0.60 = failure Berdasarkan tabel tersebut juga dipresentasikan bahwa dengan menggunakan Decision Tree, AUC/ Area Under Currve yang dihasilkan lebih besar yaitu 0.91 > 0.90 masuk dalam kategori excellent classification, sedangkan untuk Native Bayers masuk dalam kategori good classification, dan K-nearest ada pada kategori failure. Dapat disimpulkan bahwasannya dengan dataset pemilu apabila ingin melakukan pengklasifikasian data dengan hasil yang paling akurat dan baik maka disarankan untuk menggunakan model Decision Tree