KOMPARASI ALGORITMA NAÏVE BAYES DAN K- NEAREST NEIGHBOR UNTUK DETEKSI KANKER PAYUDARA

dokumen-dokumen yang mirip
DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP

Penerapan Algoritma C4.5 untuk Klasifikasi Tingkat Keganasan Kanker Payudara

PENINGKATAN METODE NAIVE BAYES CLASSIFICATION UNTUK PENENTUAN TINGKAT KEGANASAN KANKER PAYUDARA MENGGUNAKAN PARTICLE SWARM OPTIMIZATION

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

Optimasi Fitur Menggunakan Backward Elimination Dan Algoritma SVM Untuk Klasifikasi Kanker Payudara

Versi Online tersedia di : JURNAL TECH-E (Online)

PRESENTASI TUGAS AKHIR IMPLEMENTASI PENGGABUNGAN ALGORITMA SUPPORT VECTOR MACHINE DAN SIMULATED ANNEALING PADA PERMASALAHAN KLASIFIKASI POLA

Klasifikasi Penyakit Kanker Payudara Menggunakan Metode K-NN Berbasis Web

Penerapan Metode Neural Network Berbasis Algoritma Genetika Untuk Prediksi Penyakit Kanker Payudara

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5

BAB II LANDASAN TEORI

PERBANDINGAN DECISION TREE

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

Uji Kinerja Penggabungan Algoritma Support Vector Machine dan Simulated Annealing Pada Permasalahan Klasifikasi Pola

SISTEM PENDUKUNG KEPUTUSAN PENEMPATAN JURUSAN MAHASISWA BARU MENGGUNAKAN METODE K-NEAREST NEIGHBOR

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KAJIAN PENERAPAN ALGORITMA C4.5, NAIVE BAYES, DAN NEURAL NETWORK DALAM PEMILIHAN DOSEN TELADAN: STUDI KASUS UNIVERSITAS INDRAPRASTA

1. Model Prediksi Ini Menggunakan Tools RapidMiner

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

PERANCANGAN SISTEM PAKAR UNTUK MENENTUKAN ALAT KONTRASEPSI MENGGUNAKAN ALGORITMA C4.5

BAB I PENDAHULUAN. jurusan ditentukan berdasarkan standar kriteria tiap jurusan.

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN

BAB I PENDAHULUAN. Kanker adalah pertumbuhan yang tidak normal dari sel-sel jaringan tubuh

CONTOH KASUS DATA MINING

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

PENERAPAN DATA MINING UNTUK RENCANA SUKSESI SUMBER DAYA MANUSIA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOUR DI PT POS INDONESIA

BAB 3 METODE PENELITIAN

SKRIPSI TI S1 FIK UDINUS 1

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

KLASIFIKASI PADA TEXT MINING

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

SNIPTEK 2014 ISBN:

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

ALGORITMA BAYESIAN CLASSIFICATION UNTUK MEMPREDIKSI HEREGRISTRASI MAHASISWA BARU DI STMIK WIDYA PRATAMA

Abidah Elcholiqi, Beta Noranita, Indra Waspada

BAB III PEMBAHASAN. 1. Arsitektur Fuzzy Radial Basis Function Neural Network (FRBFNN) Fuzzy Radial Basis Function Neural Network (FRBFNN) merupakan

PENGKLASIFIKASIAN TINGKAT DANGEROUS DRIVING BEHAVIOR MENGGUNAKAN DATA ELEKTROENSEFALOGRAFI (EEG) DENGAN PENDEKATAN MACHINE LEARNING

BAB 2. Landasan Teori

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

Komparasi Algoritma Support Vector Machine, Naïve Bayes Dan C4.5 Untuk Klasifikasi SMS

Analisis perbandingan Klasifikasi penyakit jantung dengan menggunakan naïve bayes

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012

KLASIFIKASI PADA TEXT MINING

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

BAB II LANDASAN TEORI

PERANCANGAN SISTEM PAKAR PENENTU PROSES PERSALINAN DENGAN METODE NAIVE BAYES PADA KEPULAUAN DI DAERAH TERPENCIL PENEBEL TABANAN BALI

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

BAB I PENDAHULUAN 1.1 Latar Belakang

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

ANALISIS PENENTUAN KARYAWAN TERBAIK MENGGUNAKAN METODE ALGORITMA NAIVE BAYES (STUDI KASUS PT. XYZ)

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

ii

BAB I PENDAHULUAN. Peminatan atau bidang peminatan adalah sebuah jurusan yang harus di

APPLICATION OF DATA MINING ALGORITHM TO RECIPIENT OF MOTORCYCLE INSTALLMENT

BAB I PENDAHULUAN. masalah kecerdasan, desain, pemilihan, implementasi, dan monitoring (Tripathi,

KOMPARASI ALGORITMA BERBASIS NEURAL NETWORK DALAM MENDETEKSI PENYAKIT HEPATITIS

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

BAB III METODE PENELITIAN

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

BAB II TINJAUAN PUSTAKA

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG

BAB III METODE PENELITIAN

Review of Multiple Input Multiple Output Causal Strategies for Gene Selection

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika

LEARNING. Program Studi Ilmu Komputer FPMIPA UPI RNI IK460(Kecerdasan Buatan)

KOMPARASI ALGORITMA C4.5 DENGAN NAÏVE BAYES DALAM PENGKLASIFIKASIAN TINGKAT PENDIDIKAN ANAK MISKIN. Andi Nurhayati 1, Andi Baso Kaswar 2

BAB I PENDAHULUAN 1.1 Latar Belakang

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

BAB I 1 PENDAHULUAN. atas sekelompok vertebra, invertebrate discs, saraf, otot, medulla, dan sendi

Penentuan Jurusan Sekolah Menengah Atas Menggunakan Metode K-Nearest Neighbor Classifier Pada SMAN 16 Semarang

MODEL ALGORITMA K-NEAREST NEIGHBOR

PENERAPAN ALGORITMA K-NEAREST NEIGHBOR (K-NN) UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

REKOMENDASI TOPIK TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA DI UNIVERSITAS MUHAMMADIYAH JEMBER MENGGUNAKAN METODE NAÏVE BAYESIAN CLASSIFIER

Analisis Hubungan antar Faktor dan Komparasi Algoritma Klasifikasi pada Penentuan Penundaan Penerbangan

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

ANALISIS AKURASI ALGORITMA POHON KEPUTUSAN DAN K-NEAREST NEIGHBOR (k-nn) TESIS HULIMAN

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 3, Tahun 2015, Halaman Online di:

BAB III METODOLOGI PENELITIAN

SISTEM INFORMASI PENILAIAN SISWA UNTUK PENJURUSAN PADA SMA NEGERI 1 PLOSOKLATEN KEDIRI MENGGUNAKAN METODE NAIVE BAYES SKRIPSI

BAB I PENDAHULUAN. basis data dan mengubahnya menjadi informasi yang berguna. Metode data

Educational Data Mining untuk Mengetahui Pola Minat Kerja Mahasiswa

Transkripsi:

KOMPARASI ALGORITMA NAÏVE BAYES DAN K- NEAREST NEIGHBOR UNTUK DETEKSI KANKER PAYUDARA 3) Rayung Wulan 1), Mei Lestari 2), Ni Wayan Parwati Septiani Program Studi Informatika Universitas Indraprasta PGRI Jakarta Jl. Nangka No. 58C (TB Simatupang), Kel. Tanjung Barat, Kec. Jagakarsa, Jakarta Selatan 12530 1 rayung_wulan@unindra.ac.id, 2 mei_lestari@unindra.ac.id, 3 ni_wayanparwati@unindra.ac.id ABSTRAK Kanker adalah pertumbuhan sel yang abnormal. Di negara berkembang seperti Indonesia, kasus kanker telah meningkat seiring dengan perubahan gaya hidup. Tujuan dari makalah ini adalah untuk membandingkan metode klasifikasi data mining Naïve Bayes dan k-nearest Neighbor (k-nn) untuk mendeteksi kanker payudara. Dan untuk membangun sebuah aplikasi berdasarkan metode yang dipilih. Confusion Matrix digunakan untuk menghitung kinerja kedua metode tersebut, dan berdasarkan perhitungan metode naïve bayes memiliki kinerja yang lebih baik daripada metode k-nn, memiliki akurasi 98,51% dan 1.000 nilai Area Under Curve (AUC). Oleh karena itu aplikasi yang diajukan menerapkan metode naïve bayes untuk mendeteksi kanker payudara. Kata kunci : Breastcancer, Naïve Bayes, k-nn ABSTRACT Cancer is an abnormal growth of cells. In developing country like Indonesia, cancer case has increase inline with the lifestyles changes. Objectives of this paper is to compare data mining classification methods i.e. naive bayes and k-nearest Neighbor (k-nn) to detect breast cancer. and to built an application based on chosen methods. Confusion matrix is used to show the performance of both methods, and it shows that naive bayes has better performace than k-nn methods, it has 98,51% of accuracy and 1,000 of Area Under Curve (AUC). Therefore the proposed application applied naive bayes methods to detect breast cancer. Keywords : Breastcancer, Naïve Bayes, k-nn 1. PENDAHULUAN Di Indonesia ancaman terhadap kanker payudara terus meningkat seiring dengan perubahan gaya hidup. Organisasi penanggulangan kanker dunia dan badan kesehatan dunia memperkirakan terjadi peningkatan 300% pada tahun 2030 dan mayoritas terjadi di negara berkembang termasuk Indonesia. Pada tahun 2012, sekitar 8,2 juta kematian disebabkan oleh kanker. Kanker paru, kanker hati, kanker perut, kanker kolorektal, dan kanker payudara adalah penyebab kematian terbesar yang disebabkan oleh kanker setiap tahunnya (Kemenkes 2015). Sehingga perlu untuk mendeteksi kanker payudara sejak dini. Penggalian data atau data mining merupakan proses untuk mengidentifikasi dan mengekstrasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar. Proses data mining menggunakan statistik, matematika, kecerdasan buatan dan machine learning (Turban et al. 2011). Fungsi dasar pada data mining adalah (1) fungsi prediksi, digunakan untuk memprediksi variabel lain yang tidak diketahui jenis atau nilainya, (2) fungsi deskripsi, digunakan untuk menemukan karakteristik penting dari data dalam suatu basis data, (3)fungsi klasifikasi, digunakan untuk menemukan suatu model atau fungsi untuk menggambarkan class atau konsep dari suatu data, (4) fungsi asosiasi, digunakan untuk menemukan suatu hubungan yang terdapat pada nilai atribut dari sekumpulan data (Larose & Larose 219

2014). Pada penelitian ini digunakan fungsi klasifikasi data mining untuk mendeteksi penyakit kanker payudara. Metode klasifikasi yang digunakan adalah naïve bayes dan k- Nearest Neighbor. Metode klasifikasi naïve bayes dapat digunakan untuk memprediksi penggunaan listrik rumah tangga, hasil penelitian menunjukan metode naïve bayes dapat memprediksi besarnya penggunaan listrik rumah tangga dengan tingkat akurasi sebesar 78,3% (Saleh 2015). Penelitian menggunakan k-nearest neighbor pada bidang pendidikan dilakukan untuk memprediksi kelulusan mahasiswa, pada penelitian ini terdapat 2 kelas kelulusan yaitu tepat dan terlambat. Hasil yang didapat adalah tingkat akurasi pada k=5 adalah yang terbaik yaitu sebesar 85,15%(Rohman 2015).. 2. METODE PENELITIAN Metode penelitian yang dilakukan adalah metode Research and Development merupakan metode penelitian yang digunakan untuk menghasilkan suatu produk tertentu dan menguji keefektifan ptoduk tersebut. Borg and Gall mengungkapkan bahwa siklus R&D terdiri dari beberapa langkah penelitian, yaitu pengumpulan informasi, perencanaan, pengembangan produk, uji coba pendahuluan, perbaikan produk utama, uji coba utama, perbaikan produk operasional, uji coba operasional, perbaikan produk akhir, diseminasi dan pendistribusian (Gall et al. 2007). Kegiatan penelitian dimulai dengan melakukan riset dan analisa kebutuhan, pada tahap ini dilakukan komparasi antara dua metode klasifikasi pada data mining yaitu naïve bayes dan k-nearest neighbor, untuk itu perlu disiapkan data serta variabel-variabel yang digunakan. Data yang digunakan pada penelitian ini didapat dari UCI data repository yaitu berupa data kanker payudara yang terdiri dari 9 variabel yaitu Clump Thickness, Uniformity of cell size, Uniformity of cell shape, Marginal Adhesion, Single Ephithelial cell size, Bare nuclei, Bland Chromatin, Normal Nucleoli, Mitoses (UCI 2011). Tahap selanjutnya melakukan komparasi terhadap kedua metode klasifikasi naïve bayes dan k-nearest Neighbor untuk mendeteksi kanker payudara. Setelah dilakukan komparasi maka didapatkan algoritma terpilih dengan tingkat akurasi yang terbaik untuk diimplementasikan kedalam suatu aplikasi pendeteksi kankert payudara. Tahapan penelitian dapat dilihat pada gambar 2.1. 2.1 Metode klasifikasi data mining Gambar 2.1 Tahapan Penelitian Terdapat 2 langkah pada proses klasifikasi yaitu learning phase dan proses klasifikasi. Learning phase atau fase pembelajaran adalah proses dimana data training dianalisa dan dipresentasikan dalam bentuk rule klasifikasi, sedangkan pada fase klasifikasi menggunakan data uji (testing data) untuk memperkirakan akurasi dari rule klasifikasi (Jiawei et al. 2006). Terdapat 4 komponen proses klasifikasi yaitu, kelas, predictor, training dataset, testing dataset, dengan deskripsi sebagai berikut (Gorunescu 2011): 220

Kelas Predictor Tabel 2.1 Komponen pada metode klasifikasi data mining Komponen Training dataset Testing dataset Deskripsi Variabel dependen berupa kategorikal yang merepresentasikan label yang terdapat pada objek Variabel independen yang direpresentasikan oleh karakteristik atribut data Satu set data yang berisi nilai dari kedua komponen di atas yang digunakan untuk menentukan kelas yang cocok berdasarkan predictor Berisi data baru yang akan dikalsifikasikan oleh model yang terlah dibuat dan akurasi klasifikasi dievaluasi 3. HASIL DAN PEMBAHASAN Data yang digunakan pada penelitian ini didapat dari UCI data repository publik yang terdiri dari 536 data latih dan 134 data uji, yang kemudian diolah menggunakan metode naïve bayes dan metode k-nn. 3.1 Penerapan Metode Naïve Bayes Untuk menentukan apakah data tersebut masuk kedalam kanker payudara (malignant) atau tidak terkena kanker payudara (benign) langkah pertama yang dilakukan adalah menghitung probabilitas prior. Dari 536 data latih didapat probabilitas prior untuk kelas yang terkena kanker payudara P(malignant) = 0,380597 dan kelas yang tidak terkena kanker payudara P(benign) = 0,61403. Setelah itu mencari likelihood untuk tiap atribut. Tabel 3.1 merupakan tabel likelihood untuk atribut clump thickness. Tabel 3.1 Tabel likelihood untuk atribut clump thickness Malignant Benign Clump Thickness 1 0,027273 0,972727 2 0,075 0,925 3 0,144737 0,855263 4 0,122807 0,877193 5 0,379787 0,629213 6 0,566667 0,433333 7 1 0 8 0,897436 0,102564 9 1 0 10 1 0 Setelah didapat perhitungan likelihood untuk setiap atribut, selanjutnya dilakukan perhitungan probabilitas posterior untuk menentukan apakah data yang diuji masuk kedalam kelas malignant atau benign. Atribut Tabel 3.2 Probabilitas posterior Data X P(X Ci) Nilai Malignant Benign Clump Thickness 4 0,122807 0,877193 Uniformity of cell size 4 0,818182 0,181818 Uniformity of cell shape 2 0,136364 0,863636 221

Marginal Adhesion 1 0,094276 0,905724 Single Ephithelial cell Size 2 0,076087 0,923913 Bare Nuclei 5 0,666667 0,333333 Bland Chromatin 2 0,053571 0,946429 Normal Nucleoli 1 0,105919 0,894081 Mitoses 2 0,814815 0,185185 Setelah diketahui probabilitas setiap atribut terhadap probabilitas tiap kelas atau P(X Ci), maka langkah selanjutnya adalah menghitung total keseluruhan probabilitas tiap kelas P(X deteksi = malignant) = 0.122807x 0,818182x 0,136364x 0,094276x 0,076087x 0,666667x 0,053571x 0,105919x 0,814815= 3,0294E-07 P(X deteksi = benign) = 0,877193x 0,181818x 0,863636x 0,905724x 0,923913x 0,333333x 0,946429x 0,894081x 0,185185x 0,006021= 0,006021 P(X deteksi = malignant)p(malignant) = 3,0294E-07 x 0,380597 = 1,15298E-07 P(X deteksi = benign)p(benign) = 0,006021 x 0,619403= 0.0003729 Dari hasil perhitungan tersebut di atas diketahui nilai P(benign X) lebih besar daripada P(malignant X), sehingga untuk kasus tersebut dapat disimpulkan masuk kedalam kelas benign (tidak terdeteksi kanker payudara). 3.2 Penerapan Metode k-nearest Neighbor (k-nn) Pada penelitian ini penggunaaan nilai k untuk k-nn adalah 9. Untuk memprediksi ketetanggan pada data baru maka dilihat kelas yang sering muncul. Atribut Tabel 3.3 Data Latih dan Data Uji Nilai Data (x) Clump Thickness 1 5 Uniformity of Cell Size 1 1 Uniformity of cell Shape 1 1 Marginal Adhesion 1 1 Single Ephithelial cell size 2 2 Bare Nuclei 1 1 Bland Chromatin 3 3 Normal Nucleoli 1 1 Mitoses 1 1 Class 2 5 Nilai Data Latih Berdasarkan data pada tabel 3.3 maka perhitungan kedekatan antara data latih dan data uji adalah (5-1) 2 +(1-1) 2 +(1-1) 2 +(1-1) 2 +(2-1) 2 +(1-1) 2 +(3-3) 2 +(1-1) 2 +(1-1) 2 =16. Setelah seluruh data latih dihitung kedekatannya dengan data uji, diurutkan nilai kedekatan data latih dan data uji tersebut sehingga didapat 9 data dengan nilai kedekatan terkecil. Dari 9 data latih tersebut dilihat label yang sering muncul benign sehingga data x pada tabel 3.3 diklasifikasikan sebagai benign (tidak terkena kanker payudara), dengan nilai kedekatan sebagai berikut: Tabel 3.4 Kedekatan data x dengan data latih dengan nilai k=9 CT UC Size UC Shape M A SEC Size BN BC NN MI class kedekatan 222

3.3 Evaluasi dan Validasi Evaluasi dilakukan dengan menggunakan confusion matrix dan ROC curve dengan hasil seperti tabel berikut: Tabel 3.5 Perbandingan nilai akurasi dan AUC Naïve Bayes k-nn Akurasi 98.51% 98.51% AUC 1,000 0,999 3.4 Implementasi Metode Terpilih Berdasarkan perhitungan dan evaluasi terhadap metode klasifikasi naïve bayes dan k-nn didapat nilai akurasi yang sama untuk kedua metode yaitu 98,51%. Tetapi metode k-nn memiliki nilai AUC yang lebih tinggi dibandingkan dengan metode Naïve bayes, sehingga metode yang diterapkan pada sistem pendeteksi kanker payudara adalah metode naïve bayes. Bahasa pemrograman yang digunakan untuk implementasi sistem adalah bahasa java. Dengan algoritma sebagai berikut: Gambar 3.1 Flowchart sistem pendeteksi kanker payudara Pada sistem pendeteksi kanker payudara ini dapat mengklasifikasikan data sebagai malignant dan benign, serta menyimpan data hasil klasifikasi tersebut sebagai data latih. Data training baru atau penambahan data training juga dapat dilakukan dengan memilih menu INPUT DATA TRAINING. Gambar 3.2 menunjukan antarmuka sistem pendeteksi kanker payudara. 223

4. PENUTUP Penelitian ini menyajikan komparasi metode klasifikasi Naïve bayes dan k-nn untuk mendeteksi kanker payudara. Hasil komparasi menunjukan metode naïve bayes memiliki tingkat akurasi yang sama dengan algoritma k-nearest Neighbor yaitu 98,51%, sedangkan untuk nilai Area Under ROC Curve (AUC) metode naïve bayes lebih tinggi dibandingkan algoritma k-nn yaitu 1,000. Sehingga metode Naïve bayes menjadi metode terpilih untuk diterapkan pada sistem pendeteksi kanker payudara. Untuk penelitian selanjutnya diharapkan pengembangan sistem berbasis web sehingga dapat digunakan oleh masyarakat umum, atau dapat dikembangkan lagi menjadi sebuah sistem yang interaktif serta dapat menyimpan data pasien dan berguna dibidang medis, 5. DAFTAR PUSTAKA Gambar 3.2 Antarmuka sistem pendeteksi kanker payudara [1]. Gall, M.D., Gall, J.P. & Borg, W.R., 2007. An Introduction to Educational Design Research. East, p.129. [2]. Available at: www.slo.nl/organisatie/international/publications. [3]. Gorunescu, F., 2011. Data Mining: Concepts and Techniques, Available at: http://link.springer.com/10.1007/978-3-642-19721-5. [4]. Jiawei, H. et al., 2006. Data Mining: Concepts and Techniques, Available at: http://scholar.google.com/scholar?hl=en&btng=search&q=intitle:data+mining+concepts+and+tec hniques#1%5cnhttp://scholar.google.com/scholar?hl=en&btng=search&q=intitle:data+mining+co ncepts+and+techniques%231%5cnhttp://scholar.google.com/scholar?hl=en&btng=se. [5]. Kemenkes, 2015. Infodatin. Journal of Chemical Information and Modeling, 53, p.160. [6]. Larose, D.T.. & Larose, C.D.., 2014. Discovering Knowledge in Data: An Introduction to Data Mining: Second Edition, [7]. Rohman, A., 2015. Model Algoritma K-Nearest Neighbor (K-Nn) Untuk Prediksi Kelulusan Mahasiswa. Neo Teknika, 1(1). [8]. Saleh, A., 2015. Implementasi Metode Klasifikasi Naïve Bayes dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga. Citec Journal, 2(3), pp.207 217. Available at:ojs.amikom.ac.id/index.php/citec/article/download/375/355. [9]. Turban, E., Sharda, R. & Delen, D., 2011. Decision Support and Business Intelligence Systems, Available at: http://portal.acm.org/citation.cfm?id=1840968. [10]. UCI, 2011. UCI Machine Learning Repository: Breast Cancer Wisconsin (Diagnostic) Data Set.http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%2528Diagnostic%2529.Ava ilable at: http://archive.ics.uci.edu/ml/datasets/breast+cancer+wisconsin+%28diagnostic%29. 224