ALGORITMA NAÏVE BAYES UNTUK MELIHAT FAKTOR-FAKTOR YANG MEMPENGARUHI KULIT TERBAKAR

dokumen-dokumen yang mirip
Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

BAB II LANDASAN TEORI

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Data Mining II Estimasi

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

Data Mining. Fajar Agung Nugroho, S.Kom, M.CS

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

ALGORITMA BAYESIAN CLASSIFICATION UNTUK MEMPREDIKSI HEREGRISTRASI MAHASISWA BARU DI STMIK WIDYA PRATAMA

Data Mining Outline BAB I Pendahuluan. Proses Data Mining. Recap

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG

MODEL DATA MINING CAPAIAN PEMBELAJARAN. N. Tri Suswanto Saptadi. Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 12/4/2015

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

APLIKASI DATA MINING UNTUK MENGHASILKAN POLA KELULUSAN SISWA DENGAN METODE NAÏVE BAYES

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB II TINJAUAN PUSTAKA

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

BAB 2 TINJAUAN PUSTAKA

Algoritma Data Mining

Kata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier.

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

2. Tahapan Penelitian pemahaman merupakan awal proses penelitian

CONTOH KASUS DATA MINING

Komparasi Algoritma Klasifikasi untuk dataset iris dengan rapid miner

KOMPARASI ALGORITMA NAÏVE BAYES DAN K- NEAREST NEIGHBOR UNTUK DETEKSI KANKER PAYUDARA

BAB II TINJAUAN PUSTAKA

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

BAB I PENDAHULUAN 1.1 Latar Belakang

SISTEM PENDUKUNG PENGAMBILAN KEPUTUSAN MENGGUNAKAN METODE NAIVE BAYES (STUDI KASUS KREDIT SEPEDA MOTOR)

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

BAB I PENDAHULUAN 1.1 Latar Belakang

PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA)

BAB I PENDAHULUAN. 1.1 Latar Belakang

SISTEM INFORMASI PENILAIAN SISWA UNTUK PENJURUSAN PADA SMA NEGERI 1 PLOSOKLATEN KEDIRI MENGGUNAKAN METODE NAIVE BAYES SKRIPSI

PERBANDINGAN 3 METODE DALAM DATA MINING UNTUK PREDIKSI PENERIMA BEASISWA BERDASARKAN PRESTASI DI SMA NEGERI 6 SURAKARTA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK MEMPREDIKSI DATA ULANG PENSIUN

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

TINJAUAN PUSTAKA. Definisi Data Mining

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

KLASIFIKASI SPAM MENGGUNAKAN NAÏVE BAYES

IMPLEMENTASI KNOWLEDGE DISCOVERY IN DATABASE (KDD) DALAM SERVICE LEVEL AGREEMENT (SLA) KLAIM PADA ASURANSI KESEHATAN

2. Tahapan Penelitian

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

Komparasi Algoritma Support Vector Machine, Naïve Bayes Dan C4.5 Untuk Klasifikasi SMS

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

BAB III METODE PENELITIAN

APLIKASI PENENTUAN ANGGOTA KELAS UNGGULAN DENGAN METODE NAÏVE BAYES

Analisis Frekuensi Pola Pembelian Konsumen Menggunakan Algoritma Frequent Pattern Growth Pada Data Transaksi Penjualan Bon Bon Resto Semarang

PERBANDINGAN DECISION TREE

BAB II LANDASAN TEORI

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

BAB 3 LANDASAN TEORI

BAB I PENDAHULUAN 1.1. Latar Belakang

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012

KLASIFIKASI JENIS BIMBINGAN DAN KONSELING SISWA SMKN 1 KEDIRI MENGGUNAKAN NAIVE BAYES CLASSIFIER DAN NEAREST NEIGHBOR

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

BAB 2 LANDASAN TEORI

PENERAPAN ALGORITMA NAIVE BAYES UNTUK KLASIFIKASI PENERIMA BEASISWA PRESTASI

2. Data & Proses Datamining

SISTEM PENDUKUNG KEPUTUSAN PENERIMA PROGRAM KELUARGA HARAPAN MENGGUNAKAN METODE NAIVE BAYES

BAB I PENDAHULUAN Latar Belakang

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

BAB 2 TINJAUAN PUSTAKA

Model Aplikasi Penentuan Jenis Beasiswa Berbasis Algoritma K-NN Termodifikasi

SAINTEKBU: Jurnal Sains dan Teknologi Volume 9 No.2 Mei 2017 EVALUASI INTERNAL PROGRAM STUDI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (NBC)

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)

Analisa Data Mining Menggunakan Metode Bayes Untuk Mengukur Tingkat Kerusakan Mesin Motor (Studi Kasus Pada AHASS Astra Motor Kudus)

PENGEMBANGAN PERANGKAT LUNAK DIAGNOSA PENYAKIT DIABETES MELLITUS TIPE II BERBASIS TEKNIK KLASIFIKASI DATA ABSTRACT

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

PEMBOBOTAN KORELASI PADA NAÏVE BAYES CLASSIFIER

BAB I PENDAHULUAN 1.1 Latar Belakang

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

BAB I PENDAHULUAN 1.1 Latar Belakang

SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN)

ANALISIS PERBANDINGAN TINGKAT AKURASI ALGORITMA NAÏVE BAYES CLASSIFIER DENGAN CORRELATED-NAÏVE BAYES CLASSIFIER

ALGORITMA NAÏVE BAIYES UNTUK PREDIKSI PROFESI BERDASARKAN SKILL JOB SEEKER

Sistem Pendukung Keputusan Untuk Mengevaluasi Internal Program Studi

BAB 1 PENDAHULUAN 1-1

Transkripsi:

JURNAL STMIK ANTAR BANGSA VOL. III NO. 2 AGUSTUS 2014 ALGORITMA NAÏVE BAYES UNTUK MELIHAT FAKTOR-FAKTOR YANG MEMPENGARUHI KULIT TERBAKAR Rahmawati Abstract The skin is the most outer part of the body that has a strategic position for all living creatures, especially humans. How to know the parts of the burned skin can be classified with method Simple Naïve Bayesian algorithm based on attributes attributes Heir, Height, Weight, Lotion. Simple Naïve Bayesian classifier is a potentially simple classification method based on the application of Bayes Theorem assuming an independent explanatory variables (independent). This algorithm utilizes probability and statistical methods proposed by the British scientist Thomas Bayes, which predicts the probability of the future based on the experience of earlier decades. In this case try to discuss the data sunburn where any factors that can affect the skin burned with Naïve Bayes algorithm and K-Nearest Neighbour. Intisari Kulit merupakan bagian yang paling luar dari tubuh yang mempunyai posisi yang strategis bagi semua makhluk hidup terutama manusia. Bagaimana cara untuk mengetahui bagian kulit yang terbakar dapat diklasifikasikan dengan metode algoritma Simple Naïve Bayesian berdasarkan atribut Hair, Height, Weight, Lotion. Simple Naïve Bayesian classifier merupakan salah satu metode pengklasifikasian berpeluang sederhana yang berdasarkan pada penerapan Teorema Bayes dengan asumsi antar variable penjelas saling bebas(independen). Algoritma ini memanfaatkan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi probabilitas dimasa depan berdasarkan pengalaman dimasa sebelumnya. Dalam kasus ini mencoba membahas tentang data sunburn dimana faktor-faktor apa saja yang dapat mempengaruhi kulit terbakar dengan algoritma Naïve Bayes dan K-Nearest Neighbour. Kata Kunci Algoritma Naïve Bayes, Faktor-Faktor yang Mempengaruhi Kulit Terbakar, K-Nearest Neighbour. I. PENDAHULUAN Data mining atau biasa disebut dengan Knowledge Discovery in Databases (KDD) adalah pengambilan informasi yang tersembunyi, dimana informasi tersebut sebelumnya tidak dikenal dan berpotensi bermanfaat. Dalam data mining memiliki beberapa tahap seleksi, Pra-pengolahan, Transformasi, Data mining, sampai dengan tahap Interpretasi/evaluasi untuk pencarian pola. Dalam tahap input diperlukan sebuah data untuk diolah dengan menentukan algoritma tertentu yang kemudian akan diproses untuk menghasilkan suatu output atau model yang akan bermanfaat dimasa mendatang. Dalam kasus ini menganalisa faktorfaktor yang mempengaruhi kulit terbakar menggunakan algoritma naïve bayes. Program Studi Manajemen Administrasi ASM BSI Jakarta, Jln. Jatiwaringin Raya No. 18 Jakarta Timur 10430 INDONESIA (telp: 021-8462039; e-mail: rahmawati.rmw@bsi.ac.id ) Data yang digunakan adalah data sunburn yang diperoleh dari repository. II. KAJIAN LITERATUR A. DEFINISI DATA MINING 1) Melakukan ekstraksi untuk mendapatkan informasi penting yang sifatnya implisit dan sebelumnya tidak diketahui, dari suatu data [1]. 2) Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar [2]. Data mining atau biasa disebut dengan Knowledge Discovery in Databases (KDD) adalah pengambilan informasi yang tersembunyi, dimana informasi tersebut sebelumnya tidak dikenal dan berpotensi bermanfaat [3] Proses KDD (Knowledge Discovery in Databases) mempunyai beberapa tahapan. Ada beberapa Tahapan-tahapan menurut Fayyad [4][5] dalam KDD sebagai berikut: a) Seleksi. Dalam tahap ini dilakukan pemahaman terhadap masalah yang akan dicari solusinya melalui penemuan pengetahuan, pengetahuan sebelumnya yang relevan, penentuan tujuan dan pemilihan data yang akan dianalisis. b) Pra-pengolahan. Dalam tahap ini dilakukan proses prapengolahan data, termasuk pembersihan data. c) Transformasi. Dalam tahap ini dilakukan pengurangan dan/atau pengubahan tipe data, sehingga data siap untuk dipresentasikan ke teknik-teknik data mining. d) Data mining. Dalam tahap ini dilakukan pemilihan tugas data mining yang sesuai dengan tujuan dan algoritma data mining untuk pencarian pola. e) Interpretasi/evaluasi. Dalam tahap ini dilakukan visualisasi dan interpretasi terhadap pola yang ditemukan untuk dijadikan pengetahuan. Pengetahuan didefinisikan sebagai pola yang memenuhi kriteria interestingness measure tertentu (kesederhanaan, kepastian, potensi pemanfaatan atau kebaruan). Dalam tahap ini dilakukan pemilihan tugas data mining yang sesuai dengan tujuan dan algoritma data mining untuk pencarian pola. Untuk contoh kasus yang akan dibahas akan dijelaskan di bagian pembahasan. Proses data mining meliputi : Sumber: Kusrini (2009) Gambar 1. Proses Data Mining 197 ISSN 2098-8711 ALGORITMA NAÏVE BAYES

VOL. III NO. 2 AGUSTUS 2014 JURNAL STMIK ANTAR BANGSA Dimana dalam tahapan input dibutuhkan sebuah data yang akan dibahas, kemudian dengan menentukan dengan algoritma tertentu akan diproses untuk menghasilkan suatu output atau model yang akan bermanfaat dimasa mendatang B. PERAN DATA MINING DAN ALGORITMA Bidang ilmu Data mining mempunyai perannya sendiri untuk memecahkan masalah yang terbagi menjadi beberapa, antara lain: 1) Estimation (Estimasi): Linear Regression, Neural Network, Support Vector Machine, etc 2) Prediction/Forecasting (Prediksi/Peramalan): Linear Regression, Neural Network, Support Vector Machine, etc 3) Classification (Klasifikasi): Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis, etc 4) Clustering (Klastering): K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means, etc 5) Association (Asosiasi): FP-Growth, A Priori, etc III. METODE PENELITIAN Dari fungsi-fungsi yang ada dalam data mining, metode yang digunakan pada paper ini untuk mengetahui faktor-faktor yang membuat kulit terbakar adalah algoritma Naïve Bayes dan K-Nearest Neighbour. Berikut penjelasannya. A. Algoritma Naïve Bayes Simple Naïve Bayesian classifier merupakan salah satu metode pengklasifikasian berpeluang sederhana yang berdasarkan pada penerapan Teorema Bayes dengan asumsi antar variable penjelas saling bebas(independen). Algoritma ini memanfaatkan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi probabilitas dimasa depan berdasarkan pengalaman dimasa sebelumnya Kelebihan : 1. Mudah diimplementasikan 2. Hasilnya cukup baik untuk sebagian besar kasus 3. Bila asumsi saling bebas dipenuhi, maka tingkat akurasinya sangat tinggi Kekurangan: a. Adanya asumsi saling bebas antar atributnya terkadang akan menurunkan tingkat akurasi b. Biasanya dalam kehidupan nyata selalu ada hubungan antar atribut sehingga asumsi saling bebas menjadi tidak terpenuhi Kelebihan klasifikasi Bayesian secara umum: 1. Tingkat performansinya dapat dibandingkan metode klasifikasi lainnya seperti dengan 2. Decission tree dan neural network (terutama untuk Naïve Bayesian). 3. Setiap training data secara incremental dapat menambah /mengurangi peluang hipotesa benar. 4. Metode Bayesian dapat memberikan standar tertentu untuk pembuatan keputusan yang optimal dibandingkan metode lainnya Dasar dari teorema Naïve digunakan dalam pemrograman adalah : P(A B) = (P(B A) * P(A))/P(B) Artinya Peluang kejadian A sebagai B ditentukan dari Peluang B saat A, Peluang A dan Peluang B P(C X) = P(X C) P(C) / P(X)Dimana : P(X) bernilai konstan utk semua klas P(C) merupakan frek relatif sample klas C Dicari P(C X) bernilai maksimum, sama halnya dengan P(X C) P(C) juga bernilai maksimum IV. HASIL DAN PEMBAHASAN Dalam kasus ini membahas tentang data sunburn dimana faktor-faktor apa saja yang dapat mempengaruhi kulit terbakar. Faktor-faktor tersebut terdiri dari atribut Heir, Height, Weight, Lotion. Berapa besar probabilitas faktor tersebut mempengaruhi kulit terbakar. Berikut pembahasannya Tabel 1. Data Sunburn No Condition Attributes Decision Attributes Name Hair Height Weight Lotion 1 Sarah blonde average Light no sunburned (positive) 2 Dana blonde tall Average yes none (negative) 3 Alex brown short Average yes none 4 Annie blonde short Average no sunburned 5 Emily red average Heavy no sunburned 6 George red average Heavy no none 7 Pete brown Tall Heavy no none 8 John brown average Heavy no none 9 Katie blonde Short Light yes none Sumber: Kjellerstrand (2003) Dari data tersebut dapat kita bagi menjadi beberapa data. Data konsisten : data yang setiap atributnya memiliki nilai target yang sama. Data tidak konsisten : jika data setiap ISSN 2089-8711 ALGORITMA NAÏVE BAYES... 198

JURNAL STMIK ANTAR BANGSA VOL. III NO. 2 AGUSTUS 2014 atributnya sama tapi nilai atributnya berbeda(memiliki nilai yang berbeda dalam satu keputusan). Data bias : memiliki target/keputusan yang berbeda sedangkan instance pada semua atributnya sama. Data set digunakan untuk memprediksi suatu kejadian dari fakta atau kenyataan yang diketahui sebelumnya. Prediksi dari suatu kejadian disebut Hipotesa. Hipotesa dituliskan dengan H(attribute 1, attribute 2,.., attribute n ) = keputusan Metode Bayes menggunakan proabilitas bersyarat sebagai dasarnya. Dalam ilmu probabilitas bersyarat dinyatakan sebagai: P(c x) posterior probability dari class (target) tiap predictor (attribute) P(c) prior probability dari class P(x c) likelihood : probability dari predictor tiap class P(x) prior probality dari predictor Pengujian rasio kemiripan(likelihood ratio test) adalah sebuah pengujian statistic dimana ratio dihitung diantara maksimum dari sebuah likelihood function dibawah null hypothesis dan maksimum dari batasannya. Posterior probability dapat dihitung dengan cara membuat frequency table atribut terhadap target. Table ini kemudian dijadikan likelihood tables. Kemudian dengan persamaan Naïve Bayes dihitung posterior probabilitynya. Class yang memiliki tertinggi adalah outcome dari prediksinya Dari Tabel 1 data sunburn maka dapat di analisa a. kemunculan setiap nilai untuk atribut Hair (A1) Tabel 3. Perhitungan atribut Hair Likelihood Table Blonde 2/6 2/3 5/9 Hair Brown 3/6 0/3 3/9 Red 1/6 1/3 2/9 Keterangan: The zero-frequency problem adalah kejadian dimana tidak frequency ada kemunculan sama sekali pada kejadian sebelumnya. Hal ini bisa diatasi dengan penambahan 1 untuk setiap atribut (laplace estimator). Contoh Hair=Brown tidak muncul pada kelasnya(0). frequency table / likelihood table untuk Hair P(x c) = P(Blonde None) = 2/6 = 0,33 P(x c) = P(Blonde Sunburned) = 2/3 = 0,67 P(x c) = P(Brown None) = 3/6 = 0,5 P(x c) = P(Brown Sunburned) = 0/3 = 0 P(x c) = P(Red None) = 1/6 = 0,17 P(x c) = P(Red Sunburned) =1/3 = 0,33 P(x) = P(Blonde) = 5/9 = 0,56 P(x) = P(Brown) = 3/9 = 0,33 P(x) = P(Red) = 2/9 = 0,22 P(None Blonde) P(Sunburned Blode) = 0,3948 = 0,3948 Tabel 2. atribut Hair Frequency Table Hair Blonde 2 2 Brown 3 0 Red 1 1 Perhitungan Hair P(None Brown) P(Sunburned Brown) P(None Red) P(Sunburned Red) = 0,3948 = 0 = 0,517 199 ISSN 2098-8711 ALGORITMA NAÏVE BAYES

VOL. III NO. 2 AGUSTUS 2014 JURNAL STMIK ANTAR BANGSA = 0,495 b. kemunculan setiap nilai untuk atribut Height (A2) = 0,33 Tabel 4. atribut Height Frequency Table Average 2 2 Height Tall 2 0 Short 2 1 Tabel 5. Perhitungan atribut Height Likelihood Table None Sunburned Height Average 2/6 2/3 4/9 Tall 2/6 0/3 2/9 Short 2/6 1/3 3/9 Perhitungan untuk Height frequency table / likelihood table untuk Height P(x c) = P(Average None) = 2/6 = 0,33 P(x c) = P(Average Sunburned) = 2/3 = 0,67 P(x c) = P(Tall None) = 2/6 = 0,33 P(x c) = P(Tall Sunburned) = 0/3 = 0 P(x c) = P(Short None) = 2/6 = 0,33 P(x c) = P(Short Sunburned) =1/3 = 0,33 P(x) = P(Average) = 4/9 = 0,44 P(x) = P(Tall) = 2/9 = 0,22 P(x) = P(Short) = 3/9 = 0,33 P(None Average) P(Sunburned Average) P(None Tall) P(Sunburned Tall) = 1,005 = 1, 020 = 1,020 P(None Short) P(Sunburned Short) = 0,67 = 0 = 0,33 c. kemunculan setiap nilai untuk atribut Weight (A3) = 0,2475 Tabel 6. atribut Wight Frequency Table Weight Average 2 1 Light 1 1 Heavy 3 1 Perhitungan untuk Wight Tabel 7. atribut Wight Likelihood Table None Sunburned Weight Average 2/6 1/3 3/9 Light 1/6 1/3 2/9 Heavy 3/6 1/3 4/9 frequency table / likelihood table untuk Weight P(x c) = P(Average None) = 2/6 = 0,33 P(x c) = P(Average Sunburned) = 1/3 = 0,33 P(x c) = P(Tall None) = 1/6 = 0,17 P(x c) = P(Tall Sunburned) = 1/3 = 0,33 P(x c) = P(Short None) = 3/6 = 0,5 P(x c) = P(Short Sunburned) =1/3 = 0,33 P(x) = P(Average) = 3/9 = 0,33 P(x) = P(Tall) = 2/9 = 0,22 P(x) = P(Short) = 4/9 = 0,44 P(None Average) P(Sunburned Average) = 1, 67 = 1,67 ISSN 2089-8711 ALGORITMA NAÏVE BAYES... 200

JURNAL STMIK ANTAR BANGSA VOL. III NO. 2 AGUSTUS 2014 P(None Tall) P(Sunburned Tall) P(None Short) P(Sunburned Short) = 0,2475 = 0,517 = 0,76 = 0,495 d. kemunculan setiap nilai untuk atribut Lotion (A4) = 1,5 Tabel 8. atribut Loiton Frequency Table None Sunburned Lotion Yes 3 0 No 3 3 Perhitungan Lotion Tabel 9. Perhitungan atribut Loiton P(Sunburned Yes) P(None No) P(Sunburned No) = 1,5227 = 1,5 = 0 kemunculan setiap nilai untuk atribut (A5) Tabel 8. kemunculan tiap atribut Jumlah kejadian yg dipilih 1 1 Menghitung probabilitas setiap kejadian None P(None Height=Average). P(None Height=Average) Sunburned Hasil yang ditampilkan Sebagai text view pada RapidMiner, dimana data kelas sunburned bernilai 0.111 Likelihood Table Non Sunburn e ed Lotion Yes 3/6 0/3 3/9 No 3/6 3/3 6/9 frequency table / likelihood table untuk Lotion P(x c) = P(Yes None) = 3/6 = 0,5 P(x c) = P(Yes Sunburned) = 0/3 = 0 P(x c) = P(No None) = 3/6 = 0,5 P(x c) = P(No Sunburned) =3/3 = 1 P(x) = P(Yes) = 3/9 = 0,33 P(x) = P(No) = 6/9 = 0,22 Gambar 2. Tampilan Sample Distribution Pada atribut Hair, blonde merupakan sunburned yang paling tinggi P(None Yes) = 1,015 201 ISSN 2098-8711 ALGORITMA NAÏVE BAYES

VOL. III NO. 2 AGUSTUS 2014 JURNAL STMIK ANTAR BANGSA Gambar 3. Tampilan hasil untuk atribut Hair Pada atribut Height, average merupakan sunburned yang paling tinggi. Gambar 4. Tampilan hasil untuk atribut Height Pada atribut Weight, light merupakan sunburned yang paling tinggi. Gambar 5. Tampilan hasil untuk atribut Weight Pada atribut Lotion, data sunburned yang paling tinggi adalah No Gambar 6. Tampilan hasil untuk atribut Lotion V. KESIMPULAN Berdasarkan data sunburned tersebut, dimana ada beberapa faktor yang menyebabkan yaitu 1. Data mining tidak hanya digunakan sebagai tempat penyimpanan data/informasi tetapi juga dapat menyelesaikan permasalahan 2. Algoritma Naïve Bayes digunakan untuk menghitung probabilitas kulit yang terbakar 3. Terdapat kesimpulan probabilitas lass sunburned bernilai 0,111 dan 0, 222 dan juga class none bernilai 0,667 4. Semakin banyak jumlah data yang digunakan untuk training maka semakin tinggi keakuratannya 5. Semakin sering dilakukan learning atau penambahan knowledge maka akan semakin cepat mendapatkan klasifikasi dengan benar. REFERENSI [1] Witten, Ian H., Frank Eibe, and Mark A. Hall., Data Mining Practical Machine Learning Tools and Technique 3rd edition. Elsevier, 2011. [2] Santosa, Budi, DataMiningTeknik Pemanfaatan Data untuk Keperluan Bisnis,Graha Ilmu: Yogyakarta, 2007. [3] Susanto, Sani dan Dedi Suryadi., Pengantar Data Mining Menggali Pengetahuan Dari Bongkahan Data. Andi Publisher : Jakarta, 2010. [4] Kusrini, Algoritma Data Mining, Andi Offcet : Yogyakarta, 2009. [5] Larose, Daniel T., Discovering Knowledge in Data: An introduction to Data Mining, Wiley: New Jersey, 2005. [6] Hakan Kjellerstrand. 2003. http://www.hakank.org/weka/ [Online]. Available: http://www.hakank.org/weka/sunburn.arff Rahmawati, M.Kom. Tahun 2014 lulus dari Program Strata Satu (S1) Program Studi Sistem Informasi STMIK Nusa Mandiri Jakarta. Tahun 2014 lulus dari Progranm Strata Dua (S2) Program Studi Ilmu Komputer STMIK Nusa Mandiri. Saat ini menjadi Staf Pengajar di Bina Sarana Informatika. ISSN 2089-8711 ALGORITMA NAÏVE BAYES... 202