DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP

dokumen-dokumen yang mirip
KOMPARASI ALGORITMA NAÏVE BAYES DAN K- NEAREST NEIGHBOR UNTUK DETEKSI KANKER PAYUDARA

BAB I PENDAHULUAN 1.1 Latar Belakang

PENINGKATAN METODE NAIVE BAYES CLASSIFICATION UNTUK PENENTUAN TINGKAT KEGANASAN KANKER PAYUDARA MENGGUNAKAN PARTICLE SWARM OPTIMIZATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

BAB I PENDAHULUAN. Kanker adalah pertumbuhan yang tidak normal dari sel-sel jaringan tubuh

BAB III METODOLOGI PENELITIAN. Dataset

Penerapan Metode Neural Network Berbasis Algoritma Genetika Untuk Prediksi Penyakit Kanker Payudara

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

Optimasi Fitur Menggunakan Backward Elimination Dan Algoritma SVM Untuk Klasifikasi Kanker Payudara

CARA MENGGUNAKAN APLIKASI

BAB 1 PENDAHULUAN. terjadi terhadap para wanita semenjak beberapa dekade terakhir ini. Tentunya hal ini

Klasifikasi Penyakit Kanker Payudara Menggunakan Metode K-NN Berbasis Web

PRESENTASI TUGAS AKHIR IMPLEMENTASI PENGGABUNGAN ALGORITMA SUPPORT VECTOR MACHINE DAN SIMULATED ANNEALING PADA PERMASALAHAN KLASIFIKASI POLA

BAB III ANALISIS DAN DESAIN SISTEM

Penerapan Algoritma C4.5 untuk Klasifikasi Tingkat Keganasan Kanker Payudara

BAB IV HASIL DAN UJI COBA

SISTEM PAKAR DIAGNOSA PENYAKIT KANKER PAYUDARA MENGGUNAKAN CERTAINTY FACTOR

BAB I PENDAHULUAN. informasi namun juga untuk menyelesaikan masalah dalam kehidupan sehari-hari.

BAB II LANDASAN TEORI

BAB III ANALISIS DAN PERANCANGAN

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI

BAB III ANALISIS DAN PERANCANGAN

Uji Kinerja Penggabungan Algoritma Support Vector Machine dan Simulated Annealing Pada Permasalahan Klasifikasi Pola

Aplikasi Klasifikasi Penentuan Pengajuan Kartu Kredit Menggunakan Metode Naive Bayes di Bank BNI Syariah Surabaya

BAB 1 PENDAHULUAN. Data medis manusia adalah salah satu data yang paling bermanfaat

BAB I PENDAHULUAN. WHO Department of Gender, Women and Health mengatakan dalam. jurnal Gender in lung cancer and smoking research bahwa kematian yang

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

Analisis perbandingan Klasifikasi penyakit jantung dengan menggunakan naïve bayes

BAB III PEMBAHASAN. 1. Arsitektur Fuzzy Radial Basis Function Neural Network (FRBFNN) Fuzzy Radial Basis Function Neural Network (FRBFNN) merupakan

BAB 3 METODE PENELITIAN

APLIKASI PENENTUAN ANGGOTA KELAS UNGGULAN DENGAN METODE NAÏVE BAYES

khazanah Aplikasi Pemrediksi Masa Studi dan Predikat Kelulusan Mahasiswa Informatika Universitas Muhammadiyah Surakarta Menggunakan Metode Naive Bayes

BAB III ANALISIS DAN DESAIN SISTEM

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB III PERANCANGAN DAN PEMBUATAN PERANGKAT LUNAK

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK)

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

CONTOH KASUS DATA MINING

BAB III ANALISIS DAN DESAIN SISTEM

BAB I PENDAHULUAN. Peminatan atau bidang peminatan adalah sebuah jurusan yang harus di

PEMILIHAN JENIS ASURANSI BERDASARKAN DEMOGRAFI CALON PEMEGANG POLIS DENGAN METODE NAÏVE BAYES CLASSIFIER

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

SISTEM UNTUK DETEKSI KERUSAKAN MESIN DIESEL MOBIL PANTHER DENGAN METODE NAÏVE BAYES

BAB 2 TINJAUAN PUSTAKA

BAB II KAJIAN TEORI. Kanker payudara adalah tumor ganas yang terbentuk dari sel-sel payudara

( ) ( ) (3) II-1 ( ) ( )

BAB II LANDASAN TEORI

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI PROFIL LULUSAN STMIK LPKIA

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-222

BAB I PENDAHULUAN diantaranya meninggal akibat penyakit tersebut (Lester, 2004 ;

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MENGKLASIFIKASI DATA NASABAH ASURANSI

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PENERAPAN NAIVE BAYES CLASSIFIER DALAM IDENTIFIKASI PENYAKIT ANTRAKS PADA SAPI ABSTRAK

ALGORITMA NAÏVE BAIYES UNTUK PREDIKSI PROFESI BERDASARKAN SKILL JOB SEEKER

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB 2. Landasan Teori

BAB I PENDAHULUAN Latar Belakang

PENERAPAN DATA MINING UNTUK KLASIFIKASI PENJURUSAN SEKOLAH MENENGAH ATAS PADA SMA 1 KAJEN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES CLASSIFIER

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA BAB I PENDAHULUAN

Implementasi Algoritma Naïve Bayes dalam Proses Analisis Efisiensi Jasa Servis Bengkel Daihatsu Cabang Salatiga Artikel Ilmiah

BAB III METODE PENELITIAN

SISTEM PAKAR UNTUK DIAGNOSIS DISMENORE MENGGUNAKAN METODE NAÏVE BAYES

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO

KLASIFIKASI UNTUK DIAGNOSA DIABETES MENGGUNAKAN METODE BAYESIAN REGULARIZATION NEURAL NETWORK (RBNN)

SISTEM REKOMENDASI PENJURUSAN PADA SEKOLAH MENENGAH ATAS MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK MENENTUKAN POTENSI HUJAN HARIAN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES

BAB IV HASIL DAN UJI COBA

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

BAB IV ANALISA DAN PERANCANGAN

BAB III ANALISIS DAN DESAIN SISTEM

I. PENDAHULUAN. pada wanita dengan penyakit payudara. Insidensi benjolan payudara yang

REPRESENTASI PENGETAHUAN (KNOWLEDGE) BERBASIS RULE (RULE-BASED) DALAM MENGANALISA KEKURANGAN VITAMIN PADA TUBUH MANUSIA

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

BAB II TEORI PENUNJANG

BAB IV HASIL DAN UJI COBA

Berdasarkan sistem yang sedang berjalan, tahapan-tahapan proses. deteksi adanya viskositas darah dalam tubuh adalah sebagai berikut :

BAB 1 PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG

BAB III ANALISIS DAN DESAIN SISTEM

BAB III ANALISIS DAN DESAIN SISTEM

KANKER PAYUDARA dan KANKER SERVIKS

BAB I PENDAHULUAN. Tumor secara umum merupakan sekumpulan penyakit. yang membuat sel di dalam tubuh membelah terlalu banyak

Kata Kunci : Optimasi, Naïve Bayes, Risiko Kredit, Algoritma Genetika, Seleksi Fitur.

Prosiding Statistika ISSN:

1. PENDAHULUAN 1.1. Latar Belakang

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

BAB II TINJAUAN PUSTAKA

PROBABILITAS DAN TEOREMA BAYES

Implementasi Metode Naïve Bayes-Certainty Factor Untuk Identifikasi Penyakit Kanker Pada Sistem Reproduksi Wanita

BAB III ANALISA DAN DESAIN SISTEM

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. sistem perangkat lunak komputer yang menggunakan ilmu, fakta, dan teknik

Transkripsi:

1 DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP Achmad Ramadhan Safutra 1, Dwi Wahyu Prabowo 1 1 Jurusan Sistem Informasi, Fakultas Ilmu Komputer Universitas Darwan Ali, Sampit Email: apakatarama@gmail.com, dwi.wahyu9@gmail.com Abstraksi - Kanker payudara (Carcinoma mamae) dalam bahasa inggrisnya disebut breast cancer merupakan kanker pada jaringan payudara. Saat ini, kanker payudara merupakan penyebab kematian kedua akibat kanker pada wanita, setelah kanker leher rahim, dan merupakan kanker yang paling banyak ditemui diantara wanita. Ada beberapa tahapan pemeriksaan lebih lanjut dalam mendeteksi penyakit kanker payudara apakah termasuk dalam kategori jinak atau ganas. Pemeriksaan Patologi Anatomi dilakukan di laboratorium dengan memeriksa contoh jaringan tumor yang diambil melalui biopsi. Dalam pemberian keputusan, dokter patalogi anatomi harus menghitung apa yang telah dihasilkan oleh laboratorium dalam pemeriksaan seorang pasien. Perhitungan tersebut memerlukan waktu yang tidak singkat karena menyangkut vonis seorang pasien kanker payudara. Tujuan dari penelitian ini adalah melakukan diagnosis penyakit kanker payudara berbasis komputer (aplikasi) yang dapat menghasilkan vonis apakah seorang pasien masuk dalam kategori jinak atau ganas. Aplikasi diagnosis penyakit kanker payudara ini menggunakan dataset Wisconsin Diagnostic sebagai data pembelajarannya. Metode Naïve Bayes diterapkan dalam aplikasi diagnosis penyakit kanker payudara karena teknik klasifikasi dari Naïve Bayes tersebut dapat menghasilkan hasil diagnosis yang akurat sebesar 98,6726%. Kata Kunci Penyakit Kanker Payudara, Wisconsin Diagnostic, Naïve Bayes I. PENDAHULUAN Kanker adalah penyakit yang kurang disadari oleh sebagian masyarakat, karena sebagian masyarakat yang terkena penyakit ini kurang mengetahui kanker itu sendiri dan kurangnya melakukan deteksi dini terhadap kanker. Akibatnya sebagian besar kanker ditemukan pada stadium lanjut dan sulit ditanggulangi sehingga memberikan beban yang besar bagi pasien kanker. Kanker buah dari perubahan sel yang mengalami pertumbuhan tidak normal dan tidak terkontrol [1]. Kanker Payudara (Carcinoma mamae) dalam Bahasa inggrisnya disebut breast cancer merupakan kanker pada jaringan payudara [2]. Saat ini, kanker payudara merupakan penyebab kematian kedua akibat kanker pada wanita, setelah kanker leher rahim, dan merupakan kanker yang paling banyak ditemui diantara wanita. Berdasarkan data dari American Cancer Society, sekitar 1,3 juta wanita terdiagnosis menderita kanker payudara, dan tiap tahunnya diseluruh dunia kurang lebih 465.000 wanita meninggal oleh karena penyakit ini [1]. Ada beberapa tahapan pemeriksaan lebih lanjut dalam mendeteksi penyakit kanker payudara apakah termasuk dalam kategori jinak atau ganas. Pemeriksaan patologi anatomi dilakukan di laboratorium dengan memeriksa contoh jaringan tumor yang diambil melalui biopsi. Biopsi adalah pemeriksaan dengan mengambil sampel jaringan dari benjolan yang dicurigai kanker untuk kemudian diperiksa di bawah mikroskop apakah terdapat sel kanker atau tidak. Tujuan dari pemeriksaan Patologi Anatomi ini adalah untuk menentukan apakah jenis sel kanker masuk dalam kategori jinak atau ganas melalui keputusan yang diberikan oleh dokter patologi anatomi [3]. Dalam hal pemberian keputusan, dokter patologi anatomi harus menghitung apa yang sudah dihasilkan oleh laboratorium patologi anatominya. Perhitungan dokter memerlukan waktu yang tidak singkat karena menyangkut vonis seorang pasien kanker payudara. Oleh karena itu, hal ini memotivasi pengembangan suatu metode komputer (aplikasi) yang dapat mendiagnosis keberadaan penyakit kanker payudara. Aplikasi ini dapat menyediakan prosedur diagnosis penyakit kanker payudara terhadap pasien dengan waktu yang singkat dan memudahkan pekerjaan dokter. Dewasa ini terdapat penelitian yang mengembangkan teknik komputasi cerdas untuk mendiagnosis penyakit kanker payudara, salah satu yang pernah diusulkan adalah dengan menggunakan metode Naïve Bayes. Metode Naïve Bayes [4] diusulkan untuk mendiagnosis penyakit kanker payudara. Penelitian terdahulu menggunakan dataset Wisconsin Prognostic sebagai data pembelajaran dan menghasilkan akurasi sebesar 74,24%. Namun jika dilihat dari akurasi tersebut, akurasi sebesar 74,24% belum cukup baik dalam hal performa. Penelitian yang akan dikembangkan akan menggunakan dataset Wisconsin Diagnostic [5] sebagai data pembelajarannya. Dataset Wisconsin Diagnostic merupakan dataset populer dan secara luas digunakan oleh peneliti data mining untuk mendiagnosis penyakit kanker payudara. Penggunaan dataset Wisconsin Diagnostic ini diharapkan dapat meningkatkan akurasi diagnosis. Oleh karena itu, pada penelitian ini diusulkan pembuatan aplikasi berbasis desktop dengan menggunakan metode Naïve Bayes untuk mendiagnosis penyakit kanker payudara. A. Kanker Payudara II. LANDASAN TEORI

2 Kanker payudara adalah keganasan yang berasal dari sel kelenjar, saluran kelenjar dan jaringan penunjang payudara,tidak termasuk kulit payudara [2]. Saat ini, kanker payudara merupakan penyebab kematian kedua akibat kanker pada wanita, setelah kanker leher rahim, dan merupakan kanker yang paling banyak ditemui diantara wanita. Berdasarkan data dari American Cancer Society, sekitar 1,3 juta wanita terdiagnosis menderita kanker payudara,dan tiap tahunnya diseluruh dunia kurang lebih 465.000 wanita meninggal oleh karena penyakit ini [1]. B. Kecerdasan Buatan Kecerdasan buatan berasal dari bahasa inggris Artificial Intelligence atau disingkat AI, yaitu intelligence adalah sifat yang berarti cerdas, sedangkan artificial artinya buatan. Kecerdasan buatan yang dimaksud di sini merujuk pada mesin yang mampu berpikir, menimbang tindakan yang akan diambil, dan mampu mengambil keputusan seperti yang dilakukan oleh manusia. Rich dan Knight mendefinisikan kecerdasan buatan sebagai sebuah studi tentang bagaimana membuat komputer melakukan hal-hal yang pada saat ini dapat dilakukan lebih baik oleh manusia [6]. C. Metode Konvensional untuk mendiagnosis penyakit kanker payudara Ada beberapa metode konvensional yang biasa dilakukan untuk mendiagnosis penyakit kanker payudara, antara lain : 1. Biopsi Biopsi merupakan metode diagnosis penyakit kanker payudara dengan melakukan pengambilan sampel jaringan dari benjolan yang dicurigai kanker untuk kemudia diperiksa dibawah mikroskop apakah terdapat sel kanker atau tidak. Kelemahannya biopsi bersifat invansive, mahal serta menimbulkan luka terhadap pasien [7]. 2. Patologi Anatomi Pemeriksaan Patologi Anatomi dilakukan di laboratorium dengan memeriksa contoh jaringan tumor yang diambil melalui teknik biopsi. Tujuan dari pemeriksaan Patologi Anatomi ini adalah untuk menentukan apakah jenis sel kanker masuk dalam kategori jinak atau ganas melalui keputusan yang diberikan oleh dokter patologi anatomi [8]. D. Metode Naïve Bayes Naive Bayes merupakan salah satu algoritma yang terdapat pada teknik klasifikasi. Naïve Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive dimana diasumsikan kondisi antar atribut saling bebas. Klasifikas i Naive Bayes diasumsikan bahwa ada atau tidak ciri tertentu dari sebuah kelas tidak ada hubungannya dengan ciri dari kelas lainnya [9]. Persamaan (1) dari teorema Bayes (Bustami) adalah: P(H X) = P (X H). P(H) P(X) (1) Keterangan: X : Data dengan class yang belum diketahui H : Hipotesis data X merupakan suatu class spesifik P(H X) : Probabilitas hipotesis H berdasar kondisi X (posteriori probability) P(H) : Probabilitas hipotesis H (prior probability) P(X H) : Probabilitas X berdasarkan kondisi pada hipotesis H P(X) : Probabilitas X Karena dalam klasifikasi nilai P(X) selalu konstan untuk semua kelas, maka: P(H X) = P(X H). P(H) (2) E. Akurasi Diagnosis terhadap kanker payudara memiliki empat buah kemungkinan yang dapat dicapai yaitu true positive (TP), true negative (TN), false positive (FP), dan false negative (FN). True positive dan true negative merupakan hasil diagnosis yang benar. False positive adalah kesalahan prediksi yang terjadi ketika seorang pasien mengalami kanker payudara tipe jinak tetapi diprediksi mengalami kanker payudara tipe ganas. False negative adalah kesalahan prediksi yang terjadi ketika seorang pasien mengalami kanker payudara tipe ganas tetapi diprediksi mengalami kanker payudara tipe jinak [10]. Tabel 1 menunjukkan confusion matrix yang memberikan perbandingan antara true positive, true negative, false positive, dan false negative. TABEL 1 CONFUSION MATRIX DARI HASIL DIAGNOSIS Kelas hasil prediksi Kanker Kanker Jinak Ganas Kanker TP FN Kelas Jinak Sebenarnya Kanker FP TN Ganas Persamaan (3) menunjukkan perhitungan akurasi dalam suatu aplikasi. TP + TN Akurasi = TP + FN + FP + TN x100% (3) III. ANALISIS DAN PERANCANGAN SISTEM A. Dataset Wisconsin Diagnostic Penelitian ini menggunakan data dari dataset Wisconsin Diagnostic yang digunakan sebagai data training untuk mendiagnosis kanker payudara. Total atribut yang dimiliki oleh dataset Wisconsin Diagnostic adalah sebanyak 10 atribut [5]. Tabel berikut menjelaskan tentang setiap atribut dalam dataset Wisconsin.

3 TABEL 2 RINGKASAN ATRIBUT DATASET WISCONSIN Atribut Nilai Clump Thickness 1 10 Uniformity of 1 10 Cell Size Uniformity of 1 10 Cell Shape Marginal Adhesion 1 10 Single Epithelial 1 10 Cell Size Bare Nuclei 1 10 Bland Chromatin 1 10 Normal Nucleoli 1 10 Mitoses 1 10 Class 2 for benign, 4 for malignant B. Metode 1) Data Preprocessing Data preprocessing merupakan langkah awal dalam mendiagnosis kanker payudara. Pada penelitian ini data preprocessing terbagi menjadi data cleaning (menghapus id pasien dan missing value) dan diskritisasi. Gambar 1 memperlihatkan langkah-langkah pada tahap data preprocessing. START 2) Diagnosis Kanker Payudara Data processing dilakukan setelah pembuatan data preprocessing untuk mendiagnosis kanker payudara. Diagnosis kanker payudara berbasis komputer dilakukan dengan cara mengklasifikasikan Dataset Wisconsin menggunakan metode Naive Bayes. Gambar 3 memperlihatkan langkah-langkah pada tahap diagnosis kanker payudara. START Data Hasil Pre-processing Diagnosis Menggunakan Naive Bayes Hasil Diagnosis END Gambar 2 Data Processing (Alir diagnosis kanker payudara) Berdasarkan Gambar 3, alir dimulai dari input hasil data preprocessing, kemudian data tersebut diproses menggunakan metode Naive Bayes, dan setelah itu akan didapatkan suatu hasil dari diagnosis tersebut apakah kanker yang diderita termasuk tipe jinak atau ganas. Kategori 0 YA Dataset Wisconsin Data Cleaning (Hapus Id Pasien) Data Cleaning (Hapus Missing Value) Diskritisasi Data hasil Pre-Processing END Gambar 1 Data Preprocessing Langkah selanjutnya adalah diskritisasi data. Gambar 2 memperlihatkan langkah-langkah pada tahap diskritisasi data. Start Dataset Wisconsin Atribut <=5 TIDAK Kategori 1 End Gambar 1 Diskritisasi Data 3) Contoh Kasus Berikut adalah langkah perhitungan probabilitas diagnosis kanker payudara dari contoh kasus berdasarkan aturan yang sudah ada di tabel : Kasus saudara Tika dengan hasil laboratorium sebagai berikut: TABEL 3 CONTOH KASUS Nama Atribut Hasil Pemeriksaan Clump Thickness 1-5 Uniformity of Cell Size 1-5 Uniformity of Cell Shape 6-10 Marginal Adhesion 1-5 Single Epithelial Cell Size 1-5 Bare Nuclei 1-5 Bland Chromatin 1-5 Normal Nucleoli 1-5 Mitoses 1-5 1. Memisahkan 2 Class menjadi untuk Kanker Positif = Jinak dan untuk Kanker Positif = Ganas 2. Mencari Prior Probability: a. Probabilitas Kanker Positif dengan hasil Jinak Kanker Positif dengan hasil Jinak () = Total Record 456 = 0,592105263

4 b. Probabilitas Kanker Positif dengan hasil Ganas Kanker positif dengan hasil Ganas () = Total Record 456 = 0,407894737 3. Mencari Likelihood dari setiap atribut a. Clump thickness Mencari Likelihood pada atribut clump thickness dilakukan dalam dua tahap, yakni: 1. Likelihood clump thickness Jinak (karena di kasus, hasil yang diperoleh adalah 0) dengan hasil class (Kanker Positif Jinak). Likelihood clump thickness Jinak = 257 = 0,951852 2. Likelihood clump thickness Jinak (karena di kasus, hasil yang diperoleh adalah 0) dengan hasil class (Kanker Positif Ganas). Likelihood clump thickness Ganas = 0,27957 b. Uniformity of Cell Size 1. Likelihood Uniformity of cell size Jinak = 52 = 0,988889 2. Likelihood Uniformity of cell size Ganas = 0,462366 c. Uniformity of Cell Shape 1. Likelihood Uniformity of cell shape Jinak = 0,018519 2. Likelihood Uniformity of cell shape Ganas = 0,580645 d. Marginal Adhesion 1. Likelihood Marginal Adhesion Jinak = 0,992593 2. Likelihood Marginal Adhesion Ganas = 0,564516 e. Single Epithelial Cell Size 1. Likelihood Single Epithelial Cell Size Jinak 2. = 0,981481 = 267 = 86 = 5 = 268 = 108 = 105 = 265 Likelihood Single Epithelial Cell SizeGanas = 0,55914 f. Bare Nuclei 1. Likelihood Bare Nuclei Jinak 2. Likelihood Bare NucleiGanas = 104 = 265 = 0,981481 = 50 = 0,268817 g. Bland Chromatin 1. Likelihood Bland Chromatin Jinak = 0,977778 2. Likelihood Bland Chromatin Ganas = 0,526882 h. Normal Nucleoli 1. Likelihood Normal Nucleoli Jinak = 0,974074 2. Likelihood Normal Nucleoli Ganas = 0,462366 i. Mitoses 1. Likelihood Mitoses Jinak 2. Likelihood Mitoses Ganas = 264 = 98 = 263 = 86 = 269 = 0,996296 = 160 = 0,860215 4. Mencari Likelihood Probability: a. Probabilitas Diagnosis dengan hasil Kanker Positif Jinak berdasarkan 9 Likelihood Probability dari setiap atribut. 0,951852 * 0,988889 * 0,018519 * 0,992593 * 0,981481 * 0,981481 * 0,977778 * 0,974074 * 0,996296 = 0,015815 b. Probabilitas Diagnosis dengan hasil Kanker Positif Ganas berdasarkan 9 Likelihood Probability dari setiap atribut. 0,27957 * 0,462366 * 0,580645 * 0,564516 * 0,55914 * 0,268817 * 0,526882 * 0,462366* 0,860215 = 0,001335 5. Menghitung Posterior Probability: a. Likelihood * 0,015815* 0,592105263 = 0,009364 b. Likelihood * 0,001335 * 0,407894737 = 0,000544

5 Akhirnya diketahui hasil diagnosis dengan membandingkan hasil Posterior probability = 0,009346 dan = 0,000544, sehingga hasil diagnosis adalah, atau Kanker Positif= Jinak, karena lebih besar dari. 2) Menu Master Data Pasien 4) Confusion Matrix Confusion matrix digunakan untuk pengukuran efektifitas klasifikasi. Dengan menggunakan persamaan (2-3), dilakukan proses perhitungan akurasi untuk 226 data uji. Vonis diagnosis dengan kelas sebenarnya dimasukkan dalam tabel testing, sedangkan Vonis diagnosis dengan kelas hasil aplikasi dimasukkan dalam tabel hasil diagnosis. Dari 226 data uji, diperoleh nilai TP = 51, TN = 172, FP = 1, FN = 2. Langkah berikutnya yaitu menggunakan persamaan (3), maka perhitungan nilai akurasi sebagai berikut: 51 + 172 224 Akurasi = x100% = 51 + 2 + 1 + 172 226 = 0,986726 = 98,6726% Kesimpulan yang diperoleh yaitu, dari 226 data uji diperoleh akurasi kecocokan kelas sebenarnya terhadap kelas prediksi dengan Naïve Bayes sebesar 99%. Gambar 5 Form input data pasien 3) Menu Transaksi Diagnosis IV. IMPLEMENTASI A. Implementasi Aplikasi Diagnosis Implementasi aplikasi diagnosis adalah menerangkan tentang penjelasan seputar cara untuk menjalankan sebuah sistem yang bertujuan untuk membentuk suatu hubungan yang komunikatif antara pengguna dengan aplikasi. 1) Menu Login Menu ini menampilkan form login yang berfungsi untuk mengontrol pengaksesan pengguna (user) pada saat menjalankan aplikasi. Proses pertama pada saat form login berjalan, pengguna (user) diminta untuk memasukkan kode aksesnya pada kotak isian Username dan kotak isian Password. Adapun form login dapat dilihat sebagai berikut : Gambar 6 Form transaksi diagnosis 4) Menu Akurasi Menu ini akan menampilkan form akurasi yang berfungsi untuk meningkatkan performa suatu aplikasi. Form akurasi tersebut dapat dilihat sebagai berikut : Gambar 4 Form login Gambar 7 Form akurasi

6 V. KESIMPULAN DAN SARAN A. Kesimpulan Kesimpulan yang dapat diambil dari perancangan sistem ini adalah: 1. a. Penerapan metode Naïve Bayes pada aplikasi diagnosis kanker payudara diawali dengan pemilihan dataset Wisconsin Diagnostic sebagai data training untuk mendiagnosis penyakit kanker payudara. Dataset ini harus terlebih dahulu dilakukan tahapan saringan seperti tahapan preprocessing sebelum digunakan dalam diagnosis. b. Setelah dilakukan tahapan preprocessing, maka penerapan metode Naïve Bayes dapat diterapkan pada aplikasi diagnosis. Adapun tahapan metode Naïve Bayes untuk mendapatkan hasil kelas jinak atau ganas yaitu dengan mencari prior probability, kemudian mencari likelihood probability setiap atribut dan menghitung posterior probability. 2. Perancangan dan pembuatan aplikasi dilakukan dengan cara menyediakan hasil perhitungan kemungkinan kanker jinak dan ganas dalam setiap diagnosis seorang pasien. Dalam perhitungan tersebut, nilai kemungkinan yang tertinggi dapat menjadi kesimpulan hasil diagnosis. 3. Pembuatan persentase kemungkinan penyakit kanker payudara dapat dilakukan dengan perhitungan akurasi. Perhitungan akurasi ini menggunakan metode Confusion Matrix yang digunakan untuk pengukuran efektifitas klasifikasi. Hasil dari penggunaan metode Confusion Matrix telah menujukkan bahwa aplikasi diagnosis penyakit kanker payudara dapat menghasilkan persentase kemungkinan yang akurat yaitu sebesar 98,6726%. Diagnostic menjadi kategori 0 dan kategori 1. Proses diskritisasi tersebut masih bersifat subjektif yang artinya hasil diskritisasi masih bergantung pada peneliti. Untuk memberikan hasil diskritisasi yang objektif, maka disarankan untuk penelitian selanjutnya menggunakan metode-metode diskritisasi yang sudah ada. REFERENSI [1] I. Rasjidi, Deteksi Dini dan Pencegahan Kanker Pada Wanita, Jakarta: Sagung Seto, 2009. [2] A. Aswita and D. F. A. Putri, Sistem Pakar Diagnosa Penyakit Kanker Payudara Menggunakan Certainty Factor. [3] C. E. Speicher, Pemilihan Uji Laboratorium yang Efektif, S. B. Kresno, Ed., Jakarta: Penerbit Buku Kedokteran EGC, 1994. [4] D. Dumitru, "Prediction of Recurrent Events in Breast Cancer Using the Naive Bayesian Classification," vol. 36(2), 2009. [5] "Breast Cancer Wisconsin Dataset," [Online]. Available: https://archive.ics.uci.edu/ml/machine-learning-databases/breastcancer-wisconsin/. [Accessed 4 Oktober 2015]. [6] T. Sutojo, E. Mulyanto and V. Suhartono, Kecerdasan Buatan, Yogyakarta: Penerbit ANDI, 2011. [7] S. R. Wardhani, Biopsi Dalam Bidang Dermatologi, p. 14. [8] P. R. Indonesia, Ed.Kanker Payudara. [9] Bustami, Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data Nasabah Asuransi. [10] A. Indriani, Klasifikasi Data Forum dengan menggunakan Metode Naive Bayes Classifier, 2014. B. Saran Pada penelitian ini proses diskritisasi dilakukan dengan cara mengkonversi data setiap atribut pada dataset Wisconsin