BAB 3 METODE PENELITIAN

dokumen-dokumen yang mirip
BAB III METODE PENELITIAN

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III METODOLOGI PENELITIAN. Dataset

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB III METODE PENELITIAN

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

BAB I PENDAHULUAN Latar Belakang

BAB III METODE PENELITIAN

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II LANDASAN TEORI

PENERAPAN DATA MINING UNTUK MENENTUKAN POTENSI HUJAN HARIAN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES

BAB 3 METODE PENELITIAN

BAB 2 TINJAUAN PUSTAKA

BAB III METODE PENELITIAN

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

BAB III METODE PENELITIAN

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Data Mining Outline BAB I Pendahuluan. Proses Data Mining. Recap

BAB III METODOLOGI PENELITIAN

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh :

TINJAUAN PUSTAKA. Definisi Data Mining

BAB I PENDAHULUAN 1.1 Latar Belakang

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

BAB 1 PENDAHULUAN Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB IV HASIL DAN PEMBAHASAN

BAB 1 PENDAHULUAN Latar Belakang

Prediksi Nasabah yang Berpotensi Membuka Simpanan Deposito Menggunakan Naive Bayes Berbasis Particle Swarm Optimization

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

PERBANDINGAN DECISION TREE

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II LANDASAN TEORI

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI

MENGGUNAKAN DATA MINING

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

CONTOH KASUS DATA MINING

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

Versi Online tersedia di : JURNAL TECH-E (Online)

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

I.1 Latar Belakang Masalah Seiring berjalannya waktu dan perkembangan teknologi media penyimpanan elektronik, setiap organisasi dapat menyimpan

1. Pendahuluan 1.1 Latar Belakang

THE APPLICATION OF DATA MINING FOR OLD STUDENT TO PREDICTION STUDIES USING NAIVE BAYES AND ADABOOST METHOD

BAB I PENDAHULUAN.

( ) ( ) (3) II-1 ( ) ( )

Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES. Bertalya Universitas Gunadarma 2009

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP

DATA PREPROCESSING. Budi Susanto (versi 1.2)

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

ALGORITMA KLASIFIKASI NAÏVE BAYES UNTUK MENILAI KELAYAKAN KREDIT

DAFTAR ISI Transformasi data... 47

ANALISIS PREDIKSI TINGKAT KETIDAKDIPLINAN SISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER (STUDI KASUS : SMK NEGERI 1 PACITAN)

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

SILABUS MATAKULIAH. Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN 1.1 Latar Belakang

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

KLASIFIKASI PADA DATA MINING MENGGUNAKAN NAIVE BAYESIAN CLASSIFIER CLASSIFICATION FOR DATA MINING USING NAIVE BAYESIAN CLASSIFIER

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

SILABUS MATAKULIAH. Revisi : 4 Tanggal Berlaku : 04 September Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

3.1 Metode Pengumpulan Data

BAB I PENDAHULUAN 1.1 Latar Belakang

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

KOMPARASI ALGORITMA C4.5 DENGAN NAÏVE BAYES DALAM PENGKLASIFIKASIAN TINGKAT PENDIDIKAN ANAK MISKIN. Andi Nurhayati 1, Andi Baso Kaswar 2

BAB III METODOLOGI PENELITIAN

KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE

1. BAB I PENDAHULUAN 1.1 Latar Belakang

DAFTAR ISI PHP... 15

Algoritma Dasar. 4.1 Naive Bayes

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

KLASIFIKASI PADA TEXT MINING

Abidah Elcholiqi, Beta Noranita, Indra Waspada

BAB 2. Landasan Teori

DAFTAR ISI. ABSTRAK...i. ABSTRACT...ii. KATA PENGANTAR...iii. UCAPAN TERIMAKASIH...iv. DAFTAR ISI...vi. DAFTAR TABEL...ix. DAFTAR GAMBAR...

HASIL DAN PEMBAHASAN. Data

BAB 1 PENDAHULUAN 1-1

Transkripsi:

BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi beberapa kegiatan mulai dari identifikasi permasalahan dan studi literatur untuk menemukan alternatif solusi untuk masalah yang ada. Tahap selanjutnya, yaitu tahap pengembangan model dengan mempersiapkan dataset untuk penelitian dan pemilihan algoritma dari sejumlah alternatif yang sesuai untuk pengolahan dataset. Ditahapan akhir dikembangkan prototipe yang diharapkan dapat membantu memudahkan user untuk mendapatkan informasi prediksi dari data yang dimiliki. Pada gambar 3.1 menunjukkan sistematika penelitian yang digunakan dalam penelitian ini, dengan rincian penjelasan tiaptiap tahapannya, yaitu: 3.1 Literature Review Tahap awal dalam penelitian ini adalah literature review atau tinjauan pustaka. Dalam melakukan penelitian yang menjadi literature review atau tinjauan pustaka yaitu dengan kajian pustaka atau studi literature. Suatu penelitian tidak lepas dari kajian pustaka atau studi literature. Penelitian ini didukung oleh teori- teori yang mendasari masalah, informasi, dan pemikiran- pemikiran yang relevan, serta bersumber dari buku, jurnal, maupun prosiding. 23

24 Literature Review Latar Belakang Masalah Studi Literature Landasan Teori Prediksi Nasabah (Algoritma Naive Bayes Classifier) Pengumpulan Data Pengumpulan Data Dataset Preprocessing Dataset (Preprocessed) Data Training Data Testing Membangun Model Naive Bayes Penerapan Model Naive Bayes Implementasi Model Naive Bayes Hasil Akurasi Pengembangan Prototype (Aplikasi Prediksi Matlab) Pengembangan Prototipe Representasi Prediksi Report/ Laporan Gambar 3.1 Metode Penelitian

25 3.2 Pengumpulan Data Data yang digunakan untuk penelitian ini berasal dari data nasabah bagian marketing sebuah bank di portugal, ayang didonasi pada tanggal 14 Februari 2012 oleh S.Moro, P.Cortez, dan P.Rita data tersebut termasuk data sekunder dan bersifat public yang diperoleh dari UCI Machine Learning Repository. Dataset tersebut akan dibagi menjadi 2 dataset yaitu data trainingadan data testing. Data trainingadigunakan untuk mengetahui probabilitas guna melakukan klasifikasi untuk pengambilan keputusan sedangkan data testing digunakan untuk eksperimen dalam penelitian ini guna pembangunan prototipe. Gambar 3.2 Dataset Bank Marketing Data yang didapatkan berupa data mentah atau data nasabah yang berjumlah 4521 record. Data tersebut terdiri 16 atribut dan 1 label kelas. Data tersebut harus melalui tahap seleksi dan preprocessing sebelum digunakan dalam penelitian.

26 Gambar 3.3 Data Mentah Data Nasabah 3.3 Implementasi Metode Naive Bayes Classifier Dari kajian pustaka atau studi literature penelitian, penerapan metode Naive Bayes Classifier berpotensi menentukan probabilitas guna melakukan klasifikasi apakah nasabah tersebut masuk dalam klasifikasi no atau yes. Berikut ini merupakan langkah penerapan metode Naive Bayes Classifier. 3.3.1 Preprocessing Sebelum tahap implementasi diterapkan, tahap preprocessing terlebih dahulu dilakukan. Jumlah dataaawal yang dapat diperoleh dariapengumpulan data yaitu sebanyaka4521 data, tetapi tidak semuaadata digunakan danatidak semua atribut dipergunakan karena data tersebut harusamelalui tahap pengolahan awal data atau disebut dengan preparation data.

27 Data awal Pembersihan data Penghapusan atribut Konversi data Data lengkap (data preprocessed) Gambar 3.4 Preprocessing Untuk mendapatkan data yang memiliki kualitas bagus, beberapa tahap harus dilakukan, berikut adalah tahapannya: 3.3.1.1 Data Cleaning Data yang tidak berkualitas akan menghasilkan data mining yang tidak berkualitas. Keputusan yang berkualitas harus didasarkan pada data yang berkualitas (data ganda atau data yang telah hilang dapat menyebabkan ketidak benaran). Ekstaksi data, pembersihan, dan transformasi data merupakan tugas utama dalam data warehouse. Tugas- tugas data cleaning, yaitu: 1. Mengisi nilai yang telah hilang pada data yang tidak lengkap (missing value). 2. Mengidentifikasi atau menghilangkan outliers dan memperhalus data noise. 3. Memperbaiki ketidak konsistenan data. 4. Memecahkan redudansi yang disebabkan oleh integrasi data.

28 3.3.1.2 Data Integration dan Transformation Dapat menigkatkan akurasi danaefisiensi algoritma. Algoritma Naive Bayes Classifier mampu melakukan proses data yangabernilai nominal, ordinal, atau kontinu. Sehingga nilaiadari tiap-tiap attribut yang terdapatapada dataset tidak perlu ditrasnformasikan. 1. Mengintegrasikan berbagai database atau file- file. 2. Transformasi data (data transformation). 3. Normalisasi dan agregasi. 3.3.1.3 Data Reduction Proses yang dilakukan dengan mereduksi suatu dataset yaitu dengan mengurangi jumlah atributadan record yang ada sehingga lebih sedikit tetapi masih tetap informatif. 1. Mendapatkan hasil representasi pada volume data yang sebelumnya sudah terkurangi namun tetap menghasilkan analisis yang sama. 2. Diskritisasi data adalah bagian dari proses reduksi data, namun pada bagian ini ini adalah penting untuk data-data yang numerik. 3.3.2 Dataset (preprocessed) Dataset (preprocessed) adalah dataset yang sudah melalui preprocessing diantaranya sudah melalui proses cleaning, integration dan transformation, dan reduction, sehingga dataset tersebut sudah siap digunakan untuk data traning dan data testing. 3.3.3 Data Training dan Data Testing Pada data training biasanya digunakan sebagai pola data pembentukan model data mining. Sedangkan data testing adalah data yang digunakan untuk pengujian dalam menerapkan model klasifikasi.

29 3.3.4 Membangun Model Naive Bayes Classifier Berdasarkan pada data training yang sebelumnya sudah melalui prepocessing sehingga dapat digunakan untuk membangun model Naive Bayes Classifier yaitu menyelesaikan masalah klasifikasi class atau atribut dalam data. 3.3.5 Penerapan Model Naive Bayes Classifier Penerapan model Naive Bayes Classifier dilakukan berdasarkan model yang telah dibangun sebelumnya yang digunakan untuk menentukan atribut atau class dari suatu data baru yang atribut atau class nya belum diketahui sebelumnya. 3.3.6 Hasil Akurasi Hasil akurasi merupakan hasil nilai akurasi yang didapat dari penerapan algoritma Naive Bayes Classifier. Untuk menghitung akurasi dari pola yang didapat, pengujian Confusion Matrix dan Receiver Operating Characteristics (ROC) merupakan metode akurasi dalam konsep data mining. Perhitungan Confusion Matrix menghasilkan output (Recall, Accuracy, dan, Error) sedangkan Receiver Operating Characteristics (ROC) menunjukkan penilaian tentang hasil dari prediksi yang dikategorikan kedalam 5 tingkatan nilai akurasi. 3.4 Pengembangan Prototipe Pada pengembangan prototipe terdapat 2 (dua) tahapan yaitu penerjemah pola dan development prototype. Penerjemah pola pada proses KDD merupakan proses untuk mengetahui apakah hasil pola dari penerapan metode yang digunakan sesuai atau bertentangan dengan fakta yang ada. Pada pengembangan prototipe dalam penelitian ini dilakukan melalui tahapan antara lain, sebagai berikut: 3.4.1 Development Prototype (Aplikasi Prediksi berbasis web) Pengembangan prototipe digunakan untuk merepresentasikan dalam penelitian ini, yaitu dengan mengimplementasikan aplikasi web. Hasil yang didapat dari implementasi tersebut dapat digunakan oleh pihak bank untuk melakukan penanganan lebih dini terhadap nasabah yang melakukan simpanan deposito.

30 3.4.2 Representasi Prediksi Penerapan algoritma Naive Bayes Classifier pada aplikasi web yang hasilnya penggambaran dari prediksi nasabah yang melakukan simpanan deposito. 3.4.3 Report atau Laporan Report atau laporan adalah view atau tampilan hasil dari prediksi berupa klasifikasi nasabah yang dapat digunakan oleh pihak bank untuk melakukan penanganan lebih dini terhadap nasabah.