PEMBOBOTAN KORELASI PADA NAÏVE BAYES CLASSIFIER

dokumen-dokumen yang mirip
ANALISIS PERBANDINGAN TINGKAT AKURASI ALGORITMA NAÏVE BAYES CLASSIFIER DENGAN CORRELATED-NAÏVE BAYES CLASSIFIER

ANALISIS PERFORMA ALGORITME WEIGHTED NAIVE BAYES CLASSIFIER. Abstrak

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

BAB I PENDAHULUAN 1.1 Latar Belakang

( ) ( ) (3) II-1 ( ) ( )

RANCANGAN SISTEM REKOMENDASI KATEGORI PERUSAHAAN PRAKTIK INDUSTRI MENGGUNAKAN ALGORITMA NAÏVE BAYES

BAB II TINJAUAN PUSTAKA

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

BAB I PENDAHULUAN. 1.1 Latar Belakang

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA NASKAH PUBLIKASI

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

REKOMENDASI TOPIK TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA DI UNIVERSITAS MUHAMMADIYAH JEMBER MENGGUNAKAN METODE NAÏVE BAYESIAN CLASSIFIER

PERBANDINGAN 3 METODE DALAM DATA MINING UNTUK PREDIKSI PENERIMA BEASISWA BERDASARKAN PRESTASI DI SMA NEGERI 6 SURAKARTA

BAB II TINJAUAN PUSTAKA. sekumpulan besar data yang tersimspan dalam penyimpanan dengan

SISTEM PENDUKUNG PENGAMBILAN KEPUTUSAN MENGGUNAKAN METODE NAIVE BAYES (STUDI KASUS KREDIT SEPEDA MOTOR)

BAB II LANDASAN TEORI

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

KLASIFIKASI CALON PENDONOR DARAH MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (Studi Kasus : Calon Pendonor Darah di Kota Semarang)

SISTEM PENDUKUNG KEPUTUSAN UNTUK MEMPREDIKSI KETEPATAN LAMARAN KERJA SISWA MENGGUNAKAN METODE NAIVE BAYES DI SMK ISLAM 1 DURENAN

SKRIPSI. Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer (S.Kom) Pada Program Studi Teknik Informatika OLEH :

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

Abidah Elcholiqi, Beta Noranita, Indra Waspada

IMPLEMENTASI METODE NAIVE BAYES UNTUK MEMPREDIKSI KELULUSAN MAHASISWA DI PROGRAM STUDI TEKNIK INFORMATIKA FT UN PGRI KEDIRI

MENGGUNAKAN DATA MINING

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

BAB I PENDAHULUAN 1.1 Latar Belakang

PENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

PERBANDINGAN METODE KLASIFIKASI REGRESI LOGISTIK BINER DAN NAIVE BAYES PADA STATUS PENGGUNA KB DI KOTA TEGAL TAHUN 2014

ISSN : STMIK AMIKOM Yogyakarta, 6-8Februari 2015

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI

APLIKASI PENENTUAN ANGGOTA KELAS UNGGULAN DENGAN METODE NAÏVE BAYES

KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER

JURNAL. NAIVE BAYES KLASIFIKASI UNTUK SISTEM BANTU PENGAMBILAN TREATMENT TERAPI BERDASARKAN KELUHAN PASIEN (Studi Kasus : Terapi NAKAMURA Kediri)

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

BAB II LANDASAN TEORI

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

BAB I PENDAHULUAN 1.1 Latar Belakang

SAINTEKBU: Jurnal Sains dan Teknologi Volume 9 No.2 Mei 2017 EVALUASI INTERNAL PROGRAM STUDI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (NBC)

ANALISIS PREDIKSI TINGKAT KETIDAKDIPLINAN SISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER (STUDI KASUS : SMK NEGERI 1 PACITAN)

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

KLASIFIKASI RUMAH LAYAK HUNI DI KABUPATEN BREBES DENGAN MENGGUNAKAN METODE LEARNING VECTOR QUANTIZATION DAN NAIVE BAYES

PERBANDINGAN K-SUPPORT VECTOR NEAREST NEIGHBOR TERHADAP DECISION TREE DAN NAIVE BAYES

SISTEM PREDIKSI PENGUNDURAN DIRI PESERTA DIDIK MENGGUNAKAN METODE NAIVE BAYES CLASSIFIER

CONTOH KASUS DATA MINING

IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN:

ALGORITMA NAÏVE BAIYES UNTUK PREDIKSI PROFESI BERDASARKAN SKILL JOB SEEKER

PERANCANGAN SISTEM PAKAR PENENTU PROSES PERSALINAN DENGAN METODE NAIVE BAYES PADA KEPULAUAN DI DAERAH TERPENCIL PENEBEL TABANAN BALI

BAB I PENDAHULUAN 1.1 Latar Belakang

Metoda Naïve Bayes Classifier dan Penggunaannya pada Klasifikasi Dokumen

BAB 3 LANDASAN TEORI

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

UNTUK MENDUKUNG ADAPTIVE LEARNING DALAM PROSES PEMBELAJARAN FACE TO FACE LEARNING ENVIRONMENTS

THE APPLICATION OF DATA MINING FOR OLD STUDENT TO PREDICTION STUDIES USING NAIVE BAYES AND ADABOOST METHOD

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

Aplikasi Inferensi Bayes pada Data Mining terutama Pattern Recognition

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

Sekip Utara Yogyakarta * 1 2

Program Studi Sistem Informasi, STMIK Triguna Dharma

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK MEMPREDIKSI DATA ULANG PENSIUN

ARTIKEL. Oleh: ANA SAVITRI Dibimbing oleh : 1. Fatkur Rhohman, M.Pd. 2. Fajar Rohman Hariri, M.Kom.

PENGKLASIFIKASIAN BUNGA DENGAN MENGGUNAKAN METODE ISOMAP DAN NAIVE BAYES CLASSIFIER

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier

KLASIFIKASI KECENDERUNGAN PENYAKIT MATA DI JAWA BARAT DENGAN ASSOCIATION RULE DAN NAÏVE BAYES CLASSIFIER

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

SISTEM INFORMASI MONITORING BARANG LAUNDRY MENGGUNAKAN ALGORITMA NAÏVE BAYES UNTUK MEMPREDIKSI WAKTU PENGERJAAN BARANG LAUNDRY DI CV BENAYA

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

Implementasi Metode Klasifikasi Naïve Bayes Dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga

SISTEM PREDIKSI SERVIS BERKALA KENDARAAN BERMOTOR

Sistem Pendukung Keputusan Untuk Mengevaluasi Internal Program Studi

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Kata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier.

ALGORITMA NAÏVE BAYES UNTUK MELIHAT FAKTOR-FAKTOR YANG MEMPENGARUHI KULIT TERBAKAR

SISTEM PENDUKUNG KEPUTUSAN PEMILIHANKELAS UNGGULAN IPA DI SMA NEGERI 1 PATIANROWO MENGGUNAKAN METODE NAÏVE BAYES

Komparasi Algoritma Klasifikasi untuk dataset iris dengan rapid miner

DATA MINING CLASSIFICATION UNTUK PREDIKSI LAMA MASA STUDI MAHASISWA BERDASARKAN JALUR PENERIMAAN DENGAN METODE NAIVE BAYES

ISSN: JURNAL GAUSSIAN, Volume 5, Nomor 1, Tahun 2016, Halaman 1-10 Online di:

WEIGHT K-SUPPORT VECTOR NEAREST NEIGHBOR

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MENGKLASIFIKASI DATA NASABAH ASURANSI

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK

R Dimas Adityo 1), Herti Miawarni 2) Teknik Informatika Universitas Bhayangkara Surabaya 1) Teknik Elektro Universitas Bhayangkara Surabaya 2)

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 3, Tahun 2015, Halaman Online di:

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

JURNAL PERAMALAN PENERIMAAN NASABAH PADA PT BPR BINA REKSA KARYAARTHA MENGGUNAKAN METODE NAÏVE BAYES FORECASTING CUSTOMER ACCEPTANCE OF PT BPR

BAB II TINJAUAN PUSTAKA

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PROMOSI (Studi kasus Universitas Bina Darma Palembang)

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

Transkripsi:

PEMBOBOTAN KORELASI PADA NAÏVE BAYES CLASSIFIER Burhan Alfironi Muktamar 1), Noor Akhmad Setiawan 2), Teguh Bharata Adji 3) 1), 2), 3) Teknik Elektro dan Teknologi Informasi Universitas Gadjah Mada Jl. Grafika No.2, Kampus UGM, Yogyakarta, Daerah Istimewa Yogyakarta 55281 Email : burhanalfironimuktamar@gmail.com 1), noorwewe@ugm.ac.id 2), adji.tba@gmail.com 3) Abstrak klasifikasi dalam data mining yang memiliki kecepatan proses yang baik dan tingkat akurasi yang cukup tinggi. Dalam proses klasifikasi, Naïve Bayes Classifier mengadopsi teorema Bayesian untuk memetakan suatu data terhadap class dengan memperhitungkan probability dari attribute data tersebut. Sampai saat ini, algoritma Naïve Bayes Classifier hanya berdasar pada prior probability dan probability attribute. Salah satu hal yang berpotensi untuk meningkatkan akurasi dari Naïve Bayes Classifier adalah nilai korelasi attribute terhadap class. Dengan ikut memperhitungkan korelasi value attribute terhadap class, maka yang menjadi dasar ketepatan klasisifikasi bukan hanya probability melainkan juga seberapa besar hubungan (korelasi) attribute dengan class. Dalam penelitian ini, penulis ingin meningkatkan tingkat akurasi Naïve Bayes Classifier dengan memperhitungkan nilai korelasi dari masing-masing attribute terhadap class. Dengan metode ini, Naïve Bayes Classifier menambahkan satu parameter tambahan dalam perhitungan probability untuk mencapai posterior probability yaitu korelasi value dari attribute dengan class. Hasil dari penelitian ini adalah sebuah rumusan metode baru dari algoritma Naïve Bayes Classifier yang berbasis pada probability attribute dan korelasi value attribute terhadap class yang dinamakan Correlated-Naïve Bayes Classifier. Kata kunci: klasifikasi, Naïve Bayes Classifier, korelasi, data mining. 1. Pendahuluan Data mining, sering juga disebut knowledge discovery in database (KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari data mining ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan. Sehingga istilah pattern recognition sekarang jarang digunakan karena ia termasuk bagian dari data mining[1]. Tan (2006) mendefinisikan data mining sebagai proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan[2]. yang digunakan dalam klasifikasi data mining. Klasifikasi atau yang disebut supervised learning adalah menentukan sebuah record data baru ke salah satu dari beberapa kategori (atau k elas) yang telah didefinisikan sebelumnya[3]. Naïve Bayes Classifier adalah algoritma yang mengadopsi teorema Bayesian. Bayes merupakan teknik prediksi berbasis probabilistic sederhana yang berdasar pada penerapan teorema bayes (atau atura n bayes) dengan asumsi independensi (ketidaktergantungan) yang kuat (naif). Dengan kata lain, dalam Naïve Bayes, model yang digunakan adalah model fitur independen. Dalam Bayes(terutama Naïve Bayes), maksud independensi yang kuat pada fitur adalah bahwa sebuah fitur pada sebuah data tidak berkaitan dengan ada atau tidaknya fitur lain dalam data yang sama[2]. Teori keputusan Bayes adalah pendekatan statistic yang fundamental dalam pengenalan pola ( pattern recognition). Pendekatan ini didasarkan pada kuantifikasi trade-off antara berbagai keputusan klasifikasi dengan menggunakan probabilitas dan ongkos yang ditimbulkan dalam keputusan-keputusan tersebut. Berikut adalah persamaan-persamaan dari teorema Bayes[1]: Rumus kata umum dari teorema bayes Rumus teorema bayes (1) (2) Kaitan antara naïve bayes dengan klasifikasi, korelasi hipotesis, dan bukti dengan klasifikasi adalah bahwa hipotesis dalam teorema bayes merupakan label kelas yang menjadi target pemetaan dalam klasifikasi, sedangkan bukti merupakan fitur-fitur yang menjadi masukan dalam model klasifikasi. Jika X adalah vector masukan yang berisi fitur dan Y adalah label kelas, 2.1-43

Naïve Bayes dituliskan dengan P(Y X). Notasi tersebut berarti probabilitas label kelas Y didapatkan setelah fitur-fitur X diamati. Notasi ini disebut juga probabilitas akhir ( posterior probability) untuk Y, sedangkan P(Y) disebut probabilitas awal ( prior probability) Y. Formulasi Naive Bayes untuk klasifikasi adalah[2]: (3) klasifikasi yang terkenal dan power-full. Pengklasifikasian data dengan Naïve Bayes Classifier dapat dengan mudah diinduksi dari data set. Namun kekuatan independen attribute yang kurang dan hanya menggunakan distribusi probabilitas yang mendasari algoritma tersebut dapat membuat performa klasifikasi menjadi buruk[4]. Naïve Bayes Classifier adalah algoritma klasifikasi yang efisien, mudah dipelajari dan memiliki akurasi tinggi dalam banyak domain. Namun, ia memiliki dua kelemahan utama: (i) akurasi klasifikasinya menurun ketika atribut tidak independen, dan (ii) tidak dapat menangani nonparametric atribut kontinyu[5]. Kelemahan algoritma Naïve Bayes Classifier lainnya adalah dalam proses klasifikasi, algoritma Naïve Bayes Classifier hanya berdasar pada prior probability dan probability attribute. Salah satu hal yang berpotensi untuk meningkatkan akurasi dari Naïve Bayes Classifier adalah nilai korelasi attribute terhadap class. Dengan memperhitungkan korelasi value attribute terhadap class, maka yang menjadi dasar ketepatan klasisifikasi bukan hanya probability melainkan juga seberapa besar hubungan (korelasi) attribute dengan class. Analisa korelasi adalah alat statistik yang digunakan untuk mengetahui derajat hubungan linear antara variabel yang satu dengan yang lainnya. Analisa korelasi digunakan untuk mencari arah dan kuatnya hubungan antara dua variabel[6]. Koefisien korelasi adalah sebagai pengukur tinggi rendahnya derajad hubungan antara variabel-variabel yang diteliti dan koefisien korelasi merupakan pola suatu ukuran covariability (kovariabilitas) antara variabel x dan y tapi tidak menunjukan hubungan fungsional dari kedua variabel tersebut[7]. Tujuan analisa korelasi adalah untuk mencari hubungan variable bebas (X) dengan variable terikat (Y), dengan ketentuan data memiliki syarat-syarat tertentu. Berikut adalah persamaan untuk menentukan korelasi [8]:...(4) (r) memiliki ketentuan -1<= r <= 1 dan interpretasi koefisien korelasi nilai (r) dirangkum pada Tabel 1. Tabel 1.Tabel Koefisien Korelasi Interval Koefisien Tingkat Hubungan 0-0.199 Sangat rendah 0.20-0.299 Rendah 0.4-0.599 Cukup 0.6-0.799 Kuat 0.8-1 Sangat kuat Berdasarkan penjelasan sebelumnya, maka penulis merumuskan masalah sebagai berikut : 1. Bagaimana meningkatkan performa tingkat akurasi algoritma Naïve Bayes Classifier dengan korelasi? 2. Apakah improve dengan korelasi benar-benar significant meningkatkan akurasi algoritma Naïve Bayes Classifier? Tujuan yang diinginkan dari penelitian ini adalah untuk meng-improve algorima Naïve Bayes Classifier dengan korelasi untuk mendapatkan tingkat akurasi yang lebih tinggi. Purpose method dengan korelasi ini kedepannya akan disebut sebagai Correlated-Naïve Bayes Classifier. Tujuan yang lain adalah untuk membuktikan bahwa metode baru yang ditawarkan ( Correlated-Naïve Bayes Classifier) secara significant dapat meningkatkan akurasi dari metode Naïve Bayes Classifier. Untuk menguji hasil penelitian apakah significant atau tidak, maka dalam paper ini penulis melakukan uji hipotesis dengan uji z terhadap hasil penelitian. Formula untuk nilai Ratio Uji z ( )[9] : 2. Pembahasan (5) Berdasarkan pada persamaan (1) dan persamaan (2), maka untuk mendapat posterior probability(probability akhir) teorema bayes melakukan perhitungan antara prior probability dengan likelihood atau probability masing-masing attribute terhadap class. Persamaan Naïve Bayes Classifier yang mengadopsi teorema bayes yang ditunjukkan pada persamaan (3) untuk mendapatkan posterior probability atau probabilitas data dengan vector X pada kelas Y P(Y X) dapat diuraikan menjadi beberapa langkah sebagi berikut : 1. Menghitung prior probability (probability awal). 2. Menghitung probabilitas independen kelas Y dari semua fitur dalam vector X. 3. Karena nilai P(X) selalu tetap, maka tinggal menghitung perkalian. Dalam proses klasifiksi, algoritma Naïve Bayes Classifier dapat dijelaskan pada gambar 1. 2.1-44

Vektor X X terhadap kelas Y. Proses klasifikasi dengan Naïve Bayes Classifier yang memperhitungkan korelasi value (Correlated-Naïve Bayes Classifier) dapat dilihat pada Gambar 2. Vektor X Hitung Prior Probability P(Y) Hitung Prior Probability P(Y) Hitung probability independent kelas Y dari semua fitur vector X. Hitung probability independent kelas Y dari semua fitur vector X Hitung Perkalian Hitung korelasi dari semua fitur vector X terhadap kelas Y. Hitung nilai MAX dari posterior probability P(Y X) Hitung nilai total perkalian korelasi dengan probability Hasil Klasifikasi Gambar 1.Schematic Naïve Bayes Classifier Dengan melihat schematic Naïve Bayes Classifier pada Gambar 1 menunjukkan bahwa dalam proses klasifikasi Naïve Bayes Classifier berbasis pada probability. Dengan kata lain, untuk mendapatkan posterior probability P(Y X) hanya berbasis pada frequency kemunculan fitur vector X dalam data training. Untuk meningkatkan akurasi dilakukan improve pada saat proses perhitungan probabilitas independent kelas Y dari semua fitur vector X. Improve yang dilakukan adalah dengan memperhitungkan korelasi value dari fitur vector X terhadap kelas Y. Korelasi dari fitur vector X terhadap kelas Y dapat dihitung dengan persamaan (4). Dengan memperhitungkan korelasi value fitur vector X, maka untuk mendapatkan posterior probability selain memperhitungkan frequency kemunculan fitur vector X dalam data training juga memperhitungkan seberapa besar pengaruh fitur vector Hitung Perkalian Hitung nilai MAX dari posterior probability P(Y X) Hasil Klasifikasi Gambar 2.Schematic Correlated-Naïve Bayes Classifier 2.1-45

Berdasarkan pada proses kerja yang ditunjukkan pada Gambar 2. Maka dapat ditentukan persamaan untuk menentukkan posterior probability dengan memperhitungkan korelasi value dari masing-masing fitur vector X terhadap kelas Y sebagai berikut : Dimana : P(Y X) adalah probabilitas data dengan vector X pada kelas Y. P(Y) adalah probabilitas awal kelas Y. adalah jumlah total dari (6) perkalian antara probabilitas independent kelas Y dari fitur dalam vector X dengan nilai korelasi fitur dalam vector X terhadap kelas Y. P(X) adalah evidence atau probabilitas vector X. Setelah ditemukan persamaan untuk Correlated-Naïve Bayes Classsifier seperti yang ditunjukkan pada persamaan ( 6), kemudian dilakukan uji coba untuk mengetahui tingkat akurasi algoritma Correlated-Naïve Bayes Classifier. Uji coba dilakukan terhadap beberapa data set dengan teknik stage-fold 10% dan dilakukan sebanyak 30 kali pada setiap data set. Teknik stage-fold adalah sebuah teknik pengujian yang sering digunakan. Teknik stage-fold 10% berarti dalam pengujian, akan diambil data secara acak sebesar 10% data dari data set untuk dijadikan data testing. Kemudian sisa dari data set atau data yang tidak terambil sebagai data testing akan digunakan sebagai data training. Agar dapat diketahui bahwa improve yang dilakukan terhadap algoritma Naïve Bayes Classifier benar-benar significant meningkatkan akurasi algoritma tersebut, maka dilakukan uji hipotesis dengan menggunakan uji z dengan significant level 0.01 (z = 2.325). Dimana untuk mendapatkan z-score atau z hitung dapat menggunakan persamaan (5). Dimana untuk hipotesis yang akan diuji adalah sebagai berikut : H0 = akurasi Correlated-Naïve Bayes Classifier = akurasi Naïve Bayes Classifier. H1 = akurasi Correlated-Naïve Bayes Classifier > akurasi Naïve Bayes Classifier. Dalam pengimplementasian persamaan ( 6) terhadap 4 data set yang berbeda didapatkan hasil sebagai berikut : A. Pengujian pertama Hasil pengujian pertama ditunjukkan pada Tabel 2. Tabel 2.Tabel Hasil Pengujian Pertama µ akurasi NBC 91.7776667 µ akurasi C-NBC 94.22066667 5.36739 z tabel α = 0.01 2.325 z hitung 2.492992326 Dari hasil yang dilihat dari Tabel 2, menunjukkan bahwa diterima. Sehingga pada pengujian pertama improve yang dilakukan dengan memperhitungkan korelasi pada Naïve Bayes Classifier (Correlated-Naïve Bayes Classifier) dapat meningkatkan akurasi sebesar 2.443 % secara significant. B. Pengujian Kedua Hasil pengujian kedua ditunjukkan pada Tabel 3. Tabel 3.Tabel Hasil Pengujian Kedua µ akurasi NBC 51.44433333 µ akurasi C-NBC 80.11033333 4.92663 Z hitung 31.86968543 Dari hasil yang dilihat dari Tabel 3, menunjukkan bahwa diterima. Sehingga pada pengujian kedua improve yang dilakukan dengan memperhitungkan korelasi pada Naïve Bayes Classifier (Correlated-Naïve Bayes Classifier) dapat meningkatkan akurasi sebesar 28.666 % secara significant. C. Pengujian Ketiga Hasil pengujian ketiga ditunjukkan pada Tabel 4. Tabel 4.Tabel Hasil Pengujian Ketiga µ akurasi NBC 58.889 µ akurasi C-NBC 73.778 10.69718 Z hitung 7.623542989 Dari hasil yang dilihat dari Tabel 4, menunjukkan bahwa diterima. Sehingga pada pengujian ketiga improve yang 2.1-46

dilakukan dengan memperhitungkan korelasi pada Naïve Bayes Classifier (Correlated-Naïve Bayes Classifier) dapat meningkatkan akurasi sebesar 14.889 % secara significant. D. Pengujian Keempat Hasil pengujian keempat ditunjukkan pada Tabel 5. Tabel 5.Tabel Hasil Pengujian Keempat µ akurasi NBC 77.7773333 µ akurasi C-NBC 84.889 8.915 Z hitung 4.369288003 Dari hasil yang dilihat dari Tabel 5, menunjukkan bahwa diterima. Sehingga pada pengujian keempat improve yang dilakukan dengan memperhitungkan korelasi pada Naïve Bayes Classifier (Correlated-Naïve Bayes Classifier) dapat meningkatkan akurasi sebesar 7.111666667 % secara significant. Dari keempat pengujian yang dilakukan, keempat pengujian tersebut memberikan hasil untuk menolak H0 dan menerima H1. Sehingga terbukti bahwa Correlated- Naïve Bayes Classifier atau algoritma Naïve Bayes Classifier yang sudah dimodifikasi dengan memperhitungkan nilai korelasi setiap fitur vector X secara significant dapat meningkatkan akurasi dalam proses klasifikasi. 3. Kesimpulan Untuk meningkatkan akurasi pada algoritma Naïve Bayes Classifier, dapat dilakukan dengan memperhitungkan nilai korelasi dari masing-masing attribute vector X terhadap kelas Y. Sehingga yang menjadi parameter penentuan pemetaan suatu vector X yang belum diketahui kelasnya terhadap kelas yang sudah ditentukan menjadi dua hal, yaitu : Frequency kemunculan data dari setiap fitur vector X dalam data training (probability). Besar kecilnya pengaruh setiap fitur vector X terhadap kelas Y (korelasi). Setelah melihat hasil pengujian hipotesis terhadap 4 data set yang berbeda, maka terbukti improve yang dilakukan dengan menambahkan parameter perhitungan korelasi pada algoritma Naïve Bayes Classifier dapat meningkatkan akurasi secara significant. [2] Eko Prasetyo, Data Mining Konsep dan Aplikasi Menggunakan MATLAB, 1st ed. CV ANDI OFFSET, 2012. [3] F. A. Hermawati, Data Mining, 1st ed. Yogyakarta: CV ANDI OFFSET, 2013. [4] A. Nurnberger, C. Borgelt, and A. Klose, Improving naive Bayes classifiers using neuro-fuzzy learning, in Neural Information Processing, 1999. Proceedings. ICONIP 99. 6th International Conference on, 1999, vol. 1, pp. 154 159 vol.1. [5] M. Martinez-Arroyo and L. E. Sucar, Learning an Optimal Naive Bayes Classifier, in Pattern Recognition, 2006. ICPR 2006. 18th International Conference on, 0-0 0, vol. 3, pp. 1236 1239. [6] Mohammad Farhan Qudratullah, Sri Utami Zuliana, and Epha Diana Supandi, STATISTIKA, 1st ed. Yogyakarta: SUKA-Press UIN Sunan Kalijaga, 2012. [7] Samsubar Saleh, STATISTIK DESKRIPTIP, 1st ed. Yogyakarta: Unit Penerbit dan Percetakan (UPP) AMP YKPN, 1998. [8] B. D. A. Fadlisyah, Statistika : Terapannya di Informatika, 1st ed. Yogyakarta: Graha Ilmu, 2014. [9] Harinaldi, Prinsip - Prinsip Statistik untuk Teknik dan Sain, 1st ed. Yogyakarta: Penerbit Erlangga, 2005. Biodata Penulis Burhan Alfironi Muktamar, memperoleh gelar Sarjana Komputer (S.Kom), Jurusan Teknik Informatika STMIK AMIKOM Yogyakarta, lulus tahun 2013. Saat ini menjadi mahasiswa pascasarjana Jurusan Teknik Elektro dan Teknologi Informasi, Falkultas Teknik di Universitas Gadjah Mada. Noor Akhmad Setiawan, memperoleh gelar Sarjana Teknik (S.T.), Teknik Elektro Universitas Gadjah Mada Yogyakarta, lulus tahun 1998. Memperoleh gelar Magister Teknik (M.T.), Teknik Elektro Universitas Gadjah Mada Yogyakarta, lulus tahun 2003. Memperoleh gelar Doctor of Philosophy (Ph.D.), Electrical and Electronics Engineering Universiti Teknologi PETRONAS Malaysia, lulus tahun 2009. Saat ini menjadi Dosen di Jurusan Teknik Elektro dan Teknologi Informasi Universitas Gadjah Mada Yogyakarta. Teguh Bharata Adji, lahir di Yogyakarta, Indonesia pada tanggal 20 September 1969. Gelar Sarjana diperoleh dari Universitas Gadjah Mada pada tahun 1995, gelar Master diperoleh dari Doshisha University, Kyoto pada tahun 2001, sedangkan gelar Doktor diperoleh dari Universiti Teknologi Petronas, Malaysia pada tahun 2010. Penelitian-penelitian dan publikasipublikasinya banyak terdapat di bidang Pemrosesan Bahasa Alami ( Natural Language Processing), Pengolahan Citra (Image Processing), Komputasi Paralel (Parallel Computing), Pesawat Nirawak ( Unmanned Aerial Vehicle), Penambangan Data ( Data Mining), dan Teknologi Animasi (Animation Technology). Daftar Pustaka [1] Budi Santosa, Data Mining : Teknik Pemanfaatan Data untuk Keperluan Bisnis, 1st ed. Yogyakarta: Graha Ilmu, 2007. 2.1-47