KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

dokumen-dokumen yang mirip
Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PREDIKSI KEPUTUSAN KLIEN TELEMARKETING UNTUK DEPOSITO PADA BANK MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN. Dataset

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II LANDASAN TEORI

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PERBANDINGAN DECISION TREE

BAB 3 METODE PENELITIAN

TINJAUAN PUSTAKA. Definisi Data Mining

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB III METODE PENELITIAN

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

BAB 2 TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

PENERAPAN ALGORTIMA C4.5 UNTUK PENENTUAN KELAYAKAN KREDIT

BAB IV HASIL DAN PEMBAHASAN

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

Penentuan Kelayakan Kredit Dengan Algoritma Naïve Bayes Classifier: Studi Kasus Bank Mayapada Mitra Usaha Cabang PGC

ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

Komparasi Algoritma Support Vector Machine, Naïve Bayes Dan C4.5 Untuk Klasifikasi SMS

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

BAB II TINJAUAN PUSTAKA

BAB III METODE PENELITIAN

ALGORITMA KLASIFIKASI NAÏVE BAYES UNTUK MENILAI KELAYAKAN KREDIT

ALGORITMA NAÏVE BAIYES UNTUK PREDIKSI PROFESI BERDASARKAN SKILL JOB SEEKER

BAB 2. Landasan Teori

1. Model Prediksi Ini Menggunakan Tools RapidMiner

Analisis perbandingan Klasifikasi penyakit jantung dengan menggunakan naïve bayes

PEMILIHAN JENIS ASURANSI BERDASARKAN DEMOGRAFI CALON PEMEGANG POLIS DENGAN METODE NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

KAJIAN PENERAPAN ALGORITMA C4.5, NAIVE BAYES, DAN NEURAL NETWORK DALAM PEMILIHAN DOSEN TELADAN: STUDI KASUS UNIVERSITAS INDRAPRASTA

PENERAPAN DATA MINING UNTUK MENENTUKAN POTENSI HUJAN HARIAN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES

Abidah Elcholiqi, Beta Noranita, Indra Waspada

KLASIFIKASI METODE NAIVE BAYES UNTUK KELANCARAN PEMBAYARAN KREDIT LEASING SEPEDA MOTOR

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 3, Tahun 2015, Halaman Online di:

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK)

BAB 2 TINJAUAN PUSTAKA

Technologia Vol 7, No.3, Juli September OPTIMASI KLASIFIKASI PENILAIAN AKREDITASI LEMBAGA KURSUS MENGGUNAKAN METODE K-NN DAN NAIVE BAYES

Versi Online tersedia di : JURNAL TECH-E (Online)

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

APPLICATION OF DATA MINING ALGORITHM TO RECIPIENT OF MOTORCYCLE INSTALLMENT

ANALISIS PENENTUAN KARYAWAN TERBAIK MENGGUNAKAN METODE ALGORITMA NAIVE BAYES (STUDI KASUS PT. XYZ)

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

KAJIAN ALGORITMA NAÏVE BAYES DALAM PEMILIHAN PENERIMAAN BEASISWA TINGKAT SMA

PREDIKSI NILAI PROYEK AKHIR MAHASISWA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI

ALGORITMA K-NEAREST NEIGHBOR BERBASIS FORWARD SELECTION UNTUK MENDIAGNOSIS PENYAKIT JANTUNG KORONER

THE APPLICATION OF DATA MINING FOR OLD STUDENT TO PREDICTION STUDIES USING NAIVE BAYES AND ADABOOST METHOD

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

Penerapan Metode Neural Network Berbasis Algoritma Genetika Untuk Prediksi Penyakit Kanker Payudara

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

KLASIFIKASI GANGGUAN MOTORIK KASAR ANAK MENGGUNAKAN NAIVE BAYES SERTA OPTIMASI DENGAN PSO DAN ADABOOST

PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM ABSTRAK

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

TUGAS AKHIR. Oleh: Bondhan Arya Purnanditya A

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

Pemanfaatan Educational Data Mining (EDM)...

IMPLEMENTASI ALGORITMA NAIVE BAYES DALAM PENENTUAN PEMBERIAN KREDIT

PENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT

Aplikasi Klasifikasi Penentuan Pengajuan Kartu Kredit Menggunakan Metode Naive Bayes di Bank BNI Syariah Surabaya

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK MEMPREDIKSI DATA ULANG PENSIUN

SISTEM PENDUKUNG KEPUTUSAN UNTUK MEMPREDIKSI KETEPATAN LAMARAN KERJA SISWA MENGGUNAKAN METODE NAIVE BAYES DI SMK ISLAM 1 DURENAN

BAB II TINJAUAN PUSTAKA

Komparasi dan Analisis Kinerja Model Algoritma SVM dan PSO-SVM (Studi Kasus Klasifikasi Jalur Minat SMA)

SNIPTEK 2014 ISBN: KLASIFIKASI GANGGUAN MOTORIK KASAR ANAK MENGGUNAKAN NAIVE BAYES SERTA OPTIMASI DENGAN PSO DAN ADABOOST

Kajian Algoritma Jaringan Syaraf Tiruan untuk Mendeteksi Secara Dini Kepatuhan Wajib Pajak Orang Pribadi

PEMETAAN SEBARAN ASAL SISWA DAN KLASIFIKASI JARAK ASAL SISWA SMA NEGERI DI KABUPATEN PRINGSEWU MENGGUNAKAN METODE NAÏVE BAYES

BAB 2 LANDASAN TEORI


DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

SAINTEKBU: Jurnal Sains dan Teknologi Volume 9 No.2 Mei 2017 EVALUASI INTERNAL PROGRAM STUDI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (NBC)

Analisis Hubungan antar Faktor dan Komparasi Algoritma Klasifikasi pada Penentuan Penundaan Penerbangan

Prediksi Tingkat Kelulusan Mahasiswa Tepat Waktu Menggunakan Naïve Bayes: Studi Kasus UIN Syarif Hidayatullah Jakarta

PREDIKSI NILAI PROYEK AKHIR MAHASISWA MENGGUNAKAN ALGORITMA KLASIFIKASI DATA MINING

KOMPARASI DATA MINING UNTUK MEMPREDIKSI MINAT KLIEN DALAM MEMILIH PRODUK ASURANSI PENDIDIKAN (Studi pada PT. AJB Bumiputera 1912 Karanganyar)

PREDIKSI TINGKAT KELANCARAN PEMBAYARAN KREDIT BANK MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS FORWARD SELECTION

Kajian Algoritma Jaringan Syaraf Tiruan Untuk Mendeteksi Secara Dini Kepatuhan Wajib Pajak Orang Pribadi

BAB II LANDASAN TEORI

PERANCANGAN SISTEM MODEL PENENTU PEMBERIAN PINJAMAN KOPERASI KARYAWAN PERMATA BANK MENGGUNAKAN SVM

KLASIFIKASI DAN ANALISIS SENTIMEN DATA SMS CENTER BUPATI PAMEKASAN MENGGUNAKAN NAÏVE BAYES DENGAN MAD SMOOTHING

ANALISIS INTRUSION DETECTION SYSTEM DI INTERNAL JARINGAN WAN MENGGUNAKAN DATA MINING: STUDI KASUS PADA ASTRIDO GROUP JAKARTA

Prediksi Kenaikan Rata-Rata Volume Perikanan Tangkap Dengan Teknik Data Mining

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Prosiding Statistika ISSN:

PENERAPAN DATA MINING UNTUK KLASIFIKASI PENJURUSAN SEKOLAH MENENGAH ATAS PADA SMA 1 KAJEN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES CLASSIFIER

Transkripsi:

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi ditentukan oleh jumlah premi yang dibayar oleh nasabah. Banyaknya nasabah yang tidak lancar membayar premi berpengaruh terhadap kinerja serta eksistensi perusahaan sehari-hari. Algoritma Naive Bayes berbasis Backward Elimination bertujuan untuk melakukan klasifikasi nasabah asuransi dengan hasil akurasi 85,89 % dengan delapan atribut weight yaitu umur, jangka waktu, cara bayar, premi, jumlah hari, pekerjaan, penghasilan dan mata uang. Kata kunci : Asuransi, Naive Bayes, Backward Elimination. 1. Pendahuluan Asuransi atau pertanggungan adalah perjanjian antara dua pihak atau lebih, dengan mana pihak penanggung mengikatkan diri kepada tertanggung, dengan menerima premi asuransi, untuk memberikan penggantian kepada tertanggung karena kerugian, kerusakan atau kehilangan keuntungan yang diharapkan, atau tanggung jawab hukum kepada pihak ketiga yang mungkin akan diderita tertanggung, yang timbul dari suatu peristiwa yang tidak pasti, atau untuk memberikan suatu pembayaran yang didasarkan atas meninggal atau hidupnya seseorang yang dipertanggungkan. Premi merupakan pendapatan bagi perusahaan asuransi yang jumlahnya ditentukan dalam suatu persentase atau tarif tertentu dari jumlah yang dipertanggungkan. Bagi tertanggung premi merupakan beban karena membayar premi merupakan beban tertanggung. Pendapatan premi untuk perusahaan asuransi ditentukan oleh jumlah premi yang dibayar oleh nasabah. Permasalahan yang sering timbul adalah banyaknya nasabah yang tidak lancar dalam membayar premi. Lancar tidaknya pembayaran premi nasabah berpengaruh terhadap kinerja serta eksistensinya dalam kehidupan sehari hari. Diperlukan suatu cara agar dapat mengetahui bagaimana pola nasabah yang akan dikatakan lancar maupun tidak lancar agar dapat membantu perusahaan asuransi dalam mengklasifikasikan nasabahnya sehingga pihak asuransi bisa mengatasi sejak dini permasalahan tersebut. Untuk mengklasifikasi nasabah asuransi yang lancar dan tidak lancar membayar premi penelitian ini menggunakan algoritma Naive Bayes berbasis Backward Elimination. Algoritma ini dipilih karena bisa mengolah data dalam jumlah yang besar dan menghasilkan klasifikasi terbaik dengan Backward Elimination. Dimana profile data nasabah sebagai parametrik untuk pengukuran, agar dapat membantu perusahaan asuransi dalam mengambil keputusan menerima atau menolak calon nasabah asuransi nantinya. 2. Metode Data nasabah asuransi tersebut terdiri dari variabel umur, pekerjaan, penghasilan, jenis asuransi, jangka waktu, cara bayar, mata uang, premi, jumlah hari dan persentase kelancaran sebagai label. Jumlah data pada kasus ini ada 1066 record tetapi data tersebut masih mengandung duplikasi dan anomali atau inkonsisten data. Untuk meningkatkan keakurasian data, maka dilakukan reduction dan cleaning data. Setelah reduction dan cleaning data sudah dilakukan maka jumlah data berkurang menjadi 1013 record. Untuk mempermudah dan mempercepat proses perhitungan analisis data serta untuk meningkatkan keakurasian hasil perhitungan maka atribut yang bertipe integer dan numerik akan di discretize-kan ke dalam sejumlah kecil dari rentang yang berbeda, data yang numerik dinominalkan untuk mempermudah dalam perhitungan probabilitas Naive Bayes. Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive dimana diasumsikan kondisi antar atribut saling bebas. Klasifikasi Naive Bayes diasumsikan bahwa ada atau tidak ciri tertentu dari sebuah kelas tidak ada hubungannya dengan ciri dari kelas lainnya.[1] Copyright 2017 ILKOM Jurnal Ilmiah -- All rights reserved 96

Persamaan dari teorema Bayes adalah [4]: P(H X)= P(X H).P(H) P(X) Keterangan: X : Data dengan class yang belum diketahui H : Hipotesis data X merupakan suatu class spesifik P(H X) : Probabilitas hipotesis berdasar kondisi (posteriori probability) P(H) : Probabilitas hipotesis H (prior probability) P(X H) : Probabilitas X berdasarkan kondisi pada hipotesis H P(X) : Probabilitas X (1) Atribut yang digunakan akan diimplementasikan dengan Backward Elimination, sebelumnya data yang digunakan dijadikan data numerik dan diregresikan, sebelum mendapatkan nilai F terlebih dahulu mencari nilai prediksi, rata-rata prediksi, MSR dan MSE, rumus yang digunakan yaitu : Untuk mencari nilai prediksi dari masing-masing atribut Keterangan : Y i = β 0 + β 1 X 1i + β 2 X 2i + β 3 X 3i + β 4 X 4i + ε i (2) y : Atribut terkait, x : Atribut bebas, β : Parameter regresi, ε : Nilai kesalahan / standar error estimasi Mencari masing-masing nilai MSR dan MSE tiap atribut dengan rumus: MSR= (ŷ t - y ) 2 /p-1 MSE = (y t - ŷ t) 2 /n-p Keterangan : ŷ t : Nilai prediksi, y : Nilai rata-rata prediksi, p : Jumlah atribut, y t : Nilai aktual, n : Jumlah record data Mencari nilai F masing-masing atribut dengan rumus: F k*=msr(x k) / MSE(X k) (5) Dalam penelitian ini dipilih alat ukur evaluasi berupa Confusion Matrix dengan tujuan untuk mempermudah dalam menganilisis performa algoritma karena Confusion Matrix memberikan informasi dalam bentuk angka sehingga dapat dihitung rasio keberhasilan. Evaluasi model didasarkan pada pengujian untuk memperkirakan obyek yang benar dan salah [5], Confusion Matrix adalah salah satu alat ukur berbentuk matrik 2x2 yang digunakan untuk mendapatkan jumlah ketepatan klasifikasi dataset terhadap kelas aktif dan tidak aktif pada kedua algoritma yang dipakai. CLASSIFICATION OBERVED CLASS Class = Yes Class = No Tabel 1 Confusion Matrix Predicted Class Class = Yes A (True Positive-) C (False Positive-FP) Class = No (3) (4) b (False Negative-FN) d (True negative-tn) Keterangan : True Positive (tp) = Proporsi sampel bernilai true yang diprediksi secara benar True positive (tp) = Proporsi sampel bernilai false yang diprediksi secara benar False Positive (fp) = Proporsi sampel bernilai false yang salah diprediksi sebagai sampel bernilai ttrue. False Negative (fn) = Proporsi sampel bernilai true yang salah diprediksi sebagai sampel bernilai true. Untuk menghitung nilai accuracy, precision, dan recall dengan rumus perhitungan sebagai berikut : Copyright 2017 ILKOM Jurnal Ilmiah -- All rights reserved 97

Accuracy = ( a+d ) = +TN a+b+c+d +TN+FP+FN Precision = Recall = +FP +FN (6) (7) (8) Untuk mengukur ketelitian dari suatu model,kita dapat mengukur area di bawah kurva ROC. Akurasi AUC dikatakan sempurna apabila nilai AUC mencapai 1.000, dikatakan baik jika diatas 0.500 dan akurasinya buruk jika nilai AUC dibawah 0.500. [6] 2.1. Tahapan dalam eksperimen Beberapa tahapan dalam pengolahan eksperimen ini, dengan tahapan sebagai berikut: - Praprosessing : Untuk meningkatkan keakurasian data maka pada tahap ini akan dilakukan reduction dan cleaning data. - Desain Model : Tahap pertama menghitung jumlah class/label, tahap kedua menghitung jumlah kasus yang sama dengan class yang sama, tahap ketiga kalikan semua hasil variabel lancar dan tidak lancar dan tahap keempat membandingkan hasil class lancar dan tidak lancar. - Evaluasi : Proses eksperimen yang dilakukan oleh peneliti yaitu dengan menggunakan tools Rapid Miner dengan tahapan-tahapan seperti gambar berikut : Gambar 1 Desain eksperimen 3. Hasil dan Pembahasan 3.1 Evaluasi Menggunakan Algoritma Naive Bayes Berbasis Backward Elimination Pada penelitian ini, data yang digunakan adalah data bersih yang telah melalui preprocessing. Pengujian menggunakan model 10 fold cross validation dengan menggunakan fitur seleksi, yang akan secara acak mengambil 10% dari data training untuk data testing, proses ini diulang sebanyak 10 kali dan hasil pengujian model berupa accuracy, precision, dan recall. Seleksi fitur dengan menggunakan Backward Elimination dilakukan untuk menentukan atribut-atribut mana yang berpengaruh terhadap dataset. Proses seleksi fitur dilakukan untuk menghasilkan atribut-atribut yang sangat bermutu atau memiliki weight yang paling berpengaruh. Atribut yang digunakan umur, pekerjaan, penghasilan, jenis asuransi, jangka waktu, cara bayar, mata uang, premi, jumlah hari. Dari hasil eksperimen dengan menggunakan algoritma Naive Bayes berbasis Backward Elimination diperoleh hasil atribut weight yang berpengaruh seperti dalam tabel dibawah ini : Copyright 2017 ILKOM Jurnal Ilmiah -- All rights reserved 98

Tabel 2 Attribut Weight Attribute Weight Umur 1 Jangka Waktu 1 Cara Bayar 1 Premi 1 Jumlah Hari 1 Pekerjaan 1 Penghasilan 1 Jenis Asuransi 0 MU 1 Berdasarkan tabel 3.1 pada tahap Backward Elimination dari 9 atribut telah terpilih 8 atribut yang dianggap mempengaruhi tingkat akurasi, yaitu umur, jangka waktu, cara bayar, premi, jumlah hari, pekerjaan, penghasilan dan mata uang. Dilihat dari nilai pada tabel yang bernilai 1 hal ini menjelaskan bahwa dalam perhitungan klasifikasi nasabah asuransi jiwa secara optimal melalui 8 atribut yang dipilih melalui Backward Elimination. Pengolahan dengan menggunakan atribut tersebut dapat memudahkan pemrosesan dalam menentukan klasifikasi nasabah asuransi jiwa karena ada 1 atribut sebagai label yang menentukan lancar atau tidak lancar. Berikut contoh hasil data setelah seleksi atribut dengan menggunakan Backward Elimination : Tabel 3 Contoh Hasil Data Umur Jangka Waktu Cara Bayar Premi [- [- [- [- Jumlah Hari [-6 - ] [-6 - ] [-6 - ] [- - -6] Peker jaan Penghasi lan Pesrsentase MU Kelancaran 1 Lancar 1 Lancar 1 tidak lancar 1 Lancar Hasil akurasi yang telah didapatkan pada dataset nasabah asuransi jiwa dengan menggunakan algoritma Naive Bayes berbasis Backward Elimination ditampilkan pada tabel 3.3 yang menunjukkan tingkat akurasi sebesar 85,89%. Tabel 4 Hasil Confusion Matrix dengan Menggunakan Algoritma Naive Bayes berbasis Backward Elimination true lancar true tidak lancar class precision Pred. Lancar 868 141 86,03% Pred. Tidak Lancar 2 2 50,00% Class recall 99,77% 1,40% Eksperimen ini menggunakan data sebanyak 1013 record. Berdasarkan confusion matrix terlihat bahwa 868 record diprediksi lancar sebagai kelompok data lancar dan sebanyak 141 record diprediksi lancar sebagai kelompok data tidak lancar. Selanjutnya terlihat bahwa 2 record diprediksi tidak lancar sebagai kelompok data lancar dan sebanyak 2 record di diprediksi tidak lancar sebagai kelompok data tidak lancar. Precision adalah proporsi data yang benar-benar kelas lancar diantara data yang diklasifikasikan sebagai class lancar : Precision : Proporsi jumlah sampel bernilai true yang berhasil diprediksi secara tepat. Precision = = 868 +FP 868 +141 x 100% = 86,03% Copyright 2017 ILKOM Jurnal Ilmiah -- All rights reserved 99

Recall : Proporsi sampel bernilai true yang diprediksi secara benar. Recall = x 100 = 99,77 % Dari hasil ini, dapat dihitung nilai akurasinya. Akurasi = = 868 +FN 868 + 2 banyaknya prediksi yang benar total banyaknya prediksi 868 + 2 = 868 + 141 + 2 + 2 x 100% x 100% = 85,89% ISSN print 2087-1716 Dapat disimpulkan bahwa perhitungan persentase tingkat akurasi pada confusion matrix mencapai nilai persentase sebesar 85,89%. Sehingga data nasabah asuransi jiwa tersebut dinyatakan akurat menggunakan metode Naive Bayes berbasiis Backward elimination. Hasil pengujian ini telah menghasilkan nilai accuracy, precission dan recall disertai dengan ROC (Receiver Operating Characteristic) curve. AUC (Area Under the ROC Curve) merupakan grafik yang dapat digunakan untuk menilai model. Karena AUC adalah bagian dari daerah unit persegi, nilainya akan selalu antara 0,0 dan 1,0. Pada gambar 3.1 garis berwarna merah merupakan kurva ROC dengan sebesar 0,667 termasuk klasifikasi baik, sedangkan garis berwarna biru merupakan kurva ambang (thresholds). Gambar 2 Kurva ROC Berdasarkan hasil dengan Confusion Matrix dan kurva ROC menunjukkan rule hasil klasifikasi untuk memprediksi keputusan klien termasuk klasifikasi baik sehingga dapat digunakan untuk klasifikasi nasabah asuransi jiwa. 3.2. Perbandingan Hasil Metode Naive Bayes dan Naive Bayes berbasis Backward Elimination Berdasarkan hasil analisis dapat dibandingkan metode algoritma Naive Bayes berbasis Backward Elimination lebih baik daripada hanya menggunakan metode Naive Bayes saja, hasil accuracy yang didapatkan dengan menggunakan Naive Bayes yaitu 83,02% sedangkan Naive Bayes berbasis Backward Elimination 85,89%, dapat disimpulkan bahwa metode atau algoritma yang paling akurat adalah metode Naive Bayes berbasis Backward Elimination tingkat accuracy yang dihasilkan tinggi, dapat di lihat perbandingannya pada gambar 3.2. Gambar 3 Perbandingan Naive Bayes dan Naive Bayes + Backward Elimination Copyright 2017 ILKOM Jurnal Ilmiah -- All rights reserved 100

4. Kesimpulan Dan Saran 4.1 Kesimpulan 1. Dari sembilan atribut yang digunakan yaitu umur, pekerjaan, penghasilan, jenis asuransi, jangka waktu, cara bayar, mata uang, premi, dan jumlah hari dengan menggunakan algoritma Naive Bayes berbasis Backward Elimination didapatkan delapan atribut weight yaitu umur, jangka waktu, cara bayar, premi, jumlah hari, pekerjaan, penghasilan dan mata uang dalam mengklasifikasi nasabah yang lancar dan tidak lancar dalam pembayaran premi. 2. Secara mandiri tingkat akurasi yang dihasilkan algoritma Naive Bayes adalah 83,02 % dengan menambahkan seleksi fitur Backward Elimination menghasilkan akurasi 85,89 % dalam klasifikasi nasabah lancar dan tidak lancar. 4.2 Saran 1. Untuk meningkatkan akurasi klasifikasi nasabah lancar dan tidak lancar dapat dilakukan dengan penggabungan beberapa algoritma dan dapat juga menggunakan seleksi fitur yang lain. 2. Menggunakan dataset yang lain sebagai perbandingan tingkat akurasi yang dihasilkan algoritma Naive Bayes Daftar Pustaka [1] Bustami. 2013. Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data Nasabah Asuransi. TECHSI. [2] Sunjana. 2010. Klasifikasi Nasabah Sebuah Asuransi Menggunakan Algoritma C4.5. Yogyakarta. [3] Jurek A et al. 2008. Improving Naive Bayes Models of Insurance Risk by Unsupervised Classification. Computer Science and Information Technology pp.137-144. [4] Larose D. T. 2006. Data Mining Methods And Models. Canada: John Wiley & Sons. Inc.19. [5] Gorunescu, F. 2010. Data Mining: Concept, Models and Techniques. Romania:Springer. [6] Nuraeni F. 2013. Algoritma C4.5 Untuk Klasifikasi Pola Pembayaran Kredit Motor Pada Perusahaan Pembiayaan (Leasing). Seminar Nasional Informatika. [7] Santosa, B. 2007. Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis. Jogyakarta: Graha Ilmu. [8] Kusrini & Luthfi. E. Taufiq. 2009. Algoritma Data Mining. Yogyakarta: Andi Offset. [9] Republik Indonesia. 1992. Undang Undang No. 2 Tahun 1992 Tentang Usaha Perasuransian. Sekertariat Negara. Jakarta. Copyright 2017 ILKOM Jurnal Ilmiah -- All rights reserved 101