PERBANDINGAN K-MEANS DAN FUZZY C-MEANS CLUSTERING PADA MODEL RADIAL BASIS FUNCTION NEURAL NETWORK (RBFNN) UNTUK KLASIFIKASI STADIUM KANKER PAYUDARA SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai Salah Satu Persyaratan Guna Memperoleh Gelar Sarjana Sains Disusun oleh: Aziza Ratna Kumala 12305144038 PROGRAM STUDI MATEMATIKA JURUSAN PENDIDIKAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI YOGYAKARTA 2016 i
PERSETUJUAN Skripsi yang berjudul PERBANDINGAN K-MEANS DAN FUZZY C-MEANS CLUSTERING PADA MODEL RADIAL BASIS FUNCTION NEURAL NETWORK (RBFNN) UNTUK KLASIFIKASI STADIUM KANKER PAYUDARA Oleh: Aziza Ratna Kumala NIM 12305144038 Telah disetujui pada tanggal... Untuk diujikan di hadapan dewan penguji Skripsi Program Studi Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Yogyakarta, 8 Juni 2016 Dosen Pembimbing Dr. Dhoriva Urwatul Wutsqa NIP. 19660331 199303 2 001 ii
HALAMAN PENGESAHAN Skripsi yang berjudul PERBANDINGAN K-MEANS DAN FUZZY C-MEANS CLUSTERING PADA MODEL RADIAL BASIS FUNCTION NEURAL NETWORK (RBFNN) UNTUK KLASIFIKASI STADIUM KANKER PAYUDARA Yang disusun oleh: Nama : Aziza Ratna Kumala NIM : 12305144038 Prodi : Matematika Skripsi ini telah diujikan di depan Dewan Penguji Skripsi pada tanggal 16 Juni 2016 dan dinyatakan LULUS. DEWAN PENGUJI Nama Jabatan Tanda Tangan Tanggal Dr. Dhoriva Urwatul W. Ketua Penguji...... 196603311993032001 Husna Arifah, S.Si. M.Sc. Sekretaris Penguji...... 197810152002122001 Dr. Agus Maman Abadi Penguji Utama...... 197008281995021001 Retno Subekti, M.Sc. Penguji Pendamping...... 198111162005012002 Yogyakarta, 2016 Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Dekan, Dr. Hartono NIP. 196203291987021002 iii
HALAMAN PERNYATAAN Yang bertanda tangan di bawah ini, saya: Nama : Aziza Ratna Kumala NIM : 12305144038 Program Studi : Matematika Fakultas : Matematika dan Ilmu Pengetahuan Alam Judul Skripsi : PERBANDINGAN K-MEANS DAN FUZZY C-MEANS CLUSTERING PADA MODEL RADIAL BASIS FUNCTION NEURAL NETWORK (RBFNN) UNTUK KLASIFIKASI STADIUM KANKER PAYUDARA Menyatakan bahwa skripsi ini benar-benar karya saya sendiri dan sepanjang pengetahuan saya, tidak terdapat karya atau materi yang ditulis atau digunakan sebagai persyaratan penyelesaian studi di perguruan tinggi, kecuali pada bagianbagian tertentu yang diambil sebagai acuan atau kutipan dengan mengikuti tata penulisan karya ilmiah yang telah lazim. Apabila ternyata terbukti pernyataan saya tidak benar, maka sepenuhnya menjadi tanggung jawab saya, dan saya bersedia menerima sanksi sesuai ketentuan yang berlaku. Yogyakarta, 7 Juni 2016 Yang Menyatakan, Aziza Ratna Kumala NIM 12305144038 iv
MOTTO Karena sesungguhnya sesudah kesulitan itu ada kemudahan. Sesungguhnya sesudah kesulitan itu ada kemudahan. (QS. Al-Insyirah: 5-6) Bahwa tiada yang orang dapatkan, kecuali yang ia usahakan, Dan bahwa usahanya akan kelihatan nantinya. (Q.S. An Najm ayat 39-40) If plan A didn't work, the alphabet has 25 more letters. Stay cool and don t give up! v
HALAMAN PERSEMBAHAN Alhamdulillah, puji syukur kehadirat Allah SWT, akhirnya saya dapat menyelesaikan skripsi ini. Karya sederhana ini saya persembahkan untuk: Kedua orang tuaku, Bapak Sukijan dan Ibu Wiwik Sri Wahyuni, bapak dan mama tercinta yang memberiku semangat, bimbingan, dukungan dan doa yang tak pernah putus siang dan malam sehingga aku dapat menyelesaikan karya ini dengan baik. Kakak dan adik-adikku, Mas Jati, Ayin, dan Aya yang selalu memberi semangat dan dukungan serta bersedia mendengarkan keluh kesahku. Sepingpingku. Dek Epi dan Dek Ami, partners in crime yang selalu ada disaat aku butuh bantuan. Mbak Sari, Mbak Tami, Dek Ilham sepingping seperjuangan, semangat! Kita pasti bisa! Mada, Ratih, dan Marwah sesama pejuang skripsi, akhirnya kita bisa melalui semua masalah dan menyelesaikan skripsi ini. Anita, Septi, Zen, Lela, Rini, Dinda, teman-teman main dan nonton, yang telah memberikan banyak kenangan indah dan tak terlupakan selama ini. Teman-teman Matematika Swadana 2012 yang memberikan kenangan, ilmu, pengalaman dan kebersamaan selama 4 tahun ini. Semoga silaturahmi kita semua tidak akan pernah putus sampai kapanpun. See you on top guys.. vi
PERBANDINGAN K-MEANS DAN FUZZY C-MEANS CLUSTERING PADA MODEL RADIAL BASIS FUNCTION NEURAL NETWORK (RBFNN) UNTUK KLASIFIKASI STADIUM KANKER PAYUDARA Oleh: Aziza Ratna Kumala 12305144038 ABSTRAK Kanker payudara adalah kanker yang paling sering terjadi pada wanita baik di negara maju dan berkembang. Oleh karena itu, pemeriksaan deteksi dini perlu dilakukan agar kanker payudara dapat disembuhkan. Radial Basis Function Neural Network (RBFNN) merupakan salah satu model Neural Network (NN) yang dapat digunakan untuk mendiagnosa kanker payudara. Penelitian ini bertujuan untuk menjelaskan prosedur dan membandingan hasil klasifikasi stadium kanker payudara menggunakan model RBFNN dengan metode K-Means dan Fuzzy C-Means clustering. Prosedur awal klasifikasi kanker payudara menggunakan RBFNN adalah melakukan preprocessing citra berupa cropping dan penghilangan background hitam pada citra mammogram payudara. Setelah itu dilakukan ekstraksi citra mammogram untuk mendapatkan parameter statistik, yaitu energi, kontras, korelasi, sum of squares, inverse difference moment, sum average, sum variance, sum entropy, entropi, difference variance, difference entropy, probabilitas maksimum, homogenitas dan dissimilarity. Variabel input yang digunakan adalah parameter-parameter hasil ekstraksi citra menggunakan Gray Level Co-occurance Matrix (GLCM), sedangkan target dan variabel output berupa vektor yang mewakili masing-masing stadium kanker payudara. Pembagian data menjadi dua, yaitu 80% data training dan 20% data testing. Sebelum dilakukan pembelajaran, input dinormalisasi. Pembentukan model terbaik dilakukan dengan menentukan banyaknya neuron terbaik pada lapisan tersembunyi yang menghasilkan nilai akurasi tertinggi dari kedua metode clustering yang digunakan dan menentukan bobot-bobotnya menggunakan kriteria GCV (Generalised Cross-Validation) pada Global Ridge Regression. Fungsi aktivasi yang digunakan adalah fungsi Gaussian pada lapisan tersembunyi. Klasifikasi stadium kanker payudara menggunakan model RBFNN menghasilkan jaringan terbaik dengan 14 neuron input, lapisan tersembunyi dengan 11 neuron, dan 2 neuron output. Pengujian ketepatan model RBFNN untuk klasifikasi diukur melalui nilai sensitivitas, spesifisitas, dan akurasi. Hasil metode K-Means clustering dengan nilai sensitivitas, spesifisitas, dan akurasi secara berurutan adalah 75%, 93,75%, dan 80,21% untuk data training dan 81,25%, 75%, dan 79,17% untuk data testing, lebih baik daripada hasil metode Fuzzy C-Means (FCM) clustering yaitu 67,19%, 90,62%, dan 75% untuk data training dan 75%, 75%, dan 75% untuk data testing. Kata Kunci : Radial Basis Function Neural Nework (RBFNN), K-Means cluster, Fuzzy C-Means cluster, klasifikasi, kanker payudara vii
KATA PENGANTAR Alhamdulillah, puji syukur kehadirat Allah SWT atas segala nikmat-nya, akhirnya penulis mampu menyelesaikan penulisan Skripsi dengan judul Perbandingan K-Means dan Fuzzy C-Means Clustering pada Model Radial Basis Function Neural Network (RBFNN) untuk Klasifikasi Stadium Kanker Payudara. Terima kasih penulis sampaikan kepada Ibu Dr. Dhoriva U. W., selaku dosen pembimbing yang telah sangat sabar memberikan bimbingan, pengarahan, dan semangat dalam penyusunan skripsi ini. Skripsi ini disusun untuk memenuhi persyaratan guna memperoleh gelar Sarjana Sains Program Studi Matematika di Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta. Penyusunan skripsi ini tidak lepas dari dukungan, motivasi, kerjasama maupun bimbingan dari berbagai pihak secara langsung maupun tidak langsung. Oleh karena itu, penulis menyampaikan terima kasih kepada: 1. Bapak Dr. Hartono, selaku Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam yang telah memberikan kelancaran dalam urusan akademik di tingkat fakultas. 2. Bapak Dr. Ali Mahmudi, selaku Ketua Jurusan Pendidikan Matematika yang telah memberikan kelancaran dalam pelayanan akademik di tingkat jurusan. 3. Bapak Dr. Agus Maman Abadi, selaku Ketua Program Studi Matematika Universitas Negeri Yogyakarta atas bimbingan dan pengarahan dalam penulisan skripsi ini, serta dukungan akademik kepada penulis. viii
4. Ibu Nur Insani, M.Sc, selaku Dosen Pembimbing Akademik yang telah memberikan pengarahan dan bimbingan selama proses studi. 5. Seluruh Dosen Jurusan Pendidikan Matematika yang telah memberikan arahan dan ilmu yang bermanfaat bagi penulis. 6. Seluruh pihak yang telah membantu dan memberikan dukungan dalam penulisan skripsi ini hingga akhir. Penulis menyadari bahwa masih banyak kekurangan dan kesalahan dalam skripsi ini. Oleh karena itu, kritik dan saran yang membangun penulis harapkan sebagai sebuah koreksi dan untuk perbaikan skripsi ini. Demikian skripsi ini penulis susun, semoga dapat memberikan manfaat bagi penulis dan pembaca. Yogyakarta, 7 Juni 2016 Penulis, Aziza Ratna Kumala ix
DAFTAR ISI HALAMAN JUDUL... i HALAMAN PERSETUJUAN... ii HALAMAN PENGESAHAN... iii HALAMAN PERNYATAAN... iv MOTTO... v HALAMAN PERSEMBAHAN... vi ABSTRAK... vii KATA PENGANTAR... viii DAFTAR ISI... x DAFTAR TABEL... xiv DAFTAR GAMBAR... xvi DAFTAR LAMPIRAN... xvii BAB I PENDAHULUAN A. Latar Belakang... 1 B. Pembatasan Masalah... 8 C. Rumusan Masalah... 9 D. Tujuan Penelitian... 9 E. Manfaat Penelitian... 10 BAB II KAJIAN TEORI A. Kanker Payudara (Breast Cancer)... 11 1. Pengertian Kanker Payudara... 11 2. Gejala Kanker Payudara... 11 3. Penyebab Kanker Payudara... 12 x
4. Klasifikasi Kanker Payudara... 17 5. Cara Pendeteksian Kanker Payudara... 17 B. Pengolahan Citra Digital... 20 1. Citra Biner... 21 2. Citra Grayscale... 21 3. Citra Warna... 22 C. Ekstraksi Citra... 22 D. Neural Network (NN)... 29 1. Arsitektur... 32 2. Fungsi Aktivasi... 34 3. Algoritma Pembelajaran... 36 E. Metode Clustering... 37 1. K-Means Clustering... 37 2.Fuzzy C-Means Clustering... 39 F. Ridge Regression... 43 G. Ketepatan Hasil Klasifikasi... 47 BAB III PEMBAHASAN A. Arsitektur dan Model Radial Basis Neural Network (RBFNN) untuk Klasifikasi Stadium Kanker Payudara... 51 1. Arsitektur Radial Basis Function Neural Network... 51 2. Model Radial Basis Function Neural Network... 53 3. Algoritma Pembelajaran Radial Basis Function Neural Network... 54 B. Prosedur Pemodelan Radial Basis Function Neural Network (RBFNN) untuk Klasifikasi Stadium Kanker Payudara... 72 xi
1. Preprocessing Citra... 72 2. Ekstraksi Citra... 72 3. Pendefinisian Variabel Input dan Target... 73 4. Pembagian Data Input... 73 5. Normalisasi Data... 73 6. Pembelajaran Radial Basis Function Neural Network... 75 7. Menentukan Jaringan Optimum... 76 8. Klasifikasi... 77 C. Hasil Model Radial Basis Function Neural Network untuk Klasifikasi Kanker Payudara... 78 1. Preprocessing Citra... 78 a. Proses Pemotongan Citra... 78 b. Proses Penghilangan Background... 79 2. Ekstraksi Citra... 80 3. Pendefinisian Variabel Input dan Target... 82 4. Pembagian Data Input... 82 5. Normalisasi Data... 83 6. Pembelajaran Radial Basis Function Neural Network... 84 7. Menentukan Jaringan Optimum... 85 D. Hasil Klasifikasi... 89 1. K-Means Clustering... 89 2. Fuzzy C-Means Clustering... 97 E. Ketepatan Hasil Klasifikasi... 111 1. K-Means Clustering... 111 2. Fuzzy C-Means Clustering... 113 xii
BAB IV PENUTUP A. Kesimpulan... 116 B. Saran... 118 DAFTAR PUSTAKA... 119 LAMPIRAN... 125 xiii
DAFTAR TABEL Tabel 2.1. Fungsi Aktivasi Neural Network... 34 Tabel 2.2. Hasil Klasifikasi Uji Diagnosa... 48 Tabel 3.1. Data Pengamatan... 56 Tabel 3.2. Koordinat Pusat Cluster partisi pertama... 56 Tabel 3.3. Koordinat Pusat Cluster Partisi Kedua... 58 Tabel 3.4. Pusat cluster pertama yang dihasilkan pada iterasi ke-1... 60 Tabel 3.5. Pusat cluster kedua yang dihasilkan pada iterasi ke-1... 60 Tabel 3.6. Perhitungan Fungsi Objektif pada iterasi ke-1... 61 Tabel 3.7. Perhitungan matriks partisi pada iterasi ke-1... 61 Tabel 3.8. Pusat cluster pertama yang dihasilkan pada iterasi ke-2... 62 Tabel 3.9. Pusat cluster kedua yang dihasilkan pada iterasi ke-2... 62 Tabel 3.10. Perhitungan Fungsi Objektif pada iterasi ke-2... 63 Tabel 3.11. Perhitungan matriks partisi pada iterasi ke-2... 64 Tabel 3.12. Derajat Keanggotaan Setiap Objek pada Iterasi Terakhir... 65 Tabel 3.13. Hasil Ekstraksi Citra mdb004.png... 81 Tabel 3.14. Pola Target Vektor Klasifikasi Stadium Kanker Payudara... 82 Tabel 3.15. Hasil Normalisasi Citra mdb004.png... 83 Tabel 3.16. Hasil Jarak dan Pusat Cluster... 84 Tabel 3.17. Persentase Akurasi Data Training dan Data Testing... 86 Tabel 3.18. Pembulatan Hasil Perhitungan Klasifikasi... 110 xiv
Tabel 3.19. Performance Measure Model RBFNN Metode K-Means clustering... 111 Tabel 3.20. Performance Measure Model RBFNN Metode C-Means clustering... 113 xv
DAFTAR GAMBAR Gambar 2.1. Syaraf Secara Biologi... 30 Gambar 2.2. Neural Network Sederhana... 30 Gambar 2.3. Jaringan Layar Tunggal... 32 Gambar 2.4. Jaringan Layar Jamak... 33 Gambar 2.5. Jaringan Layar Kompetitif... 34 Gambar 3.1. Arsitektur Radial Basis Function... 52 Gambar 3.2. Diagram Alir Prosedur Pemodelan RBFNN... 77 Gambar 3.3. Pemotongan citra mammogram payudara; (a) mdb004 sebelum dipotong, (b) mdb004 setelah dipotong... 79 Gambar 3.4. Proses menghilangkan background citra mammogram payudara;(a) mdb004 dengan background hitam, (b) mdb004 dengan background putih... 80 Gambar 3.5. Arsitektur RBFNN untuk klasifikasi stadium kanker payudara dengan 11 cluster... 88 xvi
DAFTAR LAMPIRAN Lampiran 1. Citra Mammogram pada Data Latih (Training)... 126 Lampiran 2. Citra Mammogram pada Data Uji (Testing)... 135 Lampiran 3. Script M-file GLCM Ekstraksi Gambar... 138 Lampiran 4. Hasil Ekstraksi Citra pada Data Latih (Training)... 144 Lampiran 5. Hasil Ekstraksi Citra pada Data Uji (Testing)... 149 Lampiran 6. Hasil Normalisasi Citra pada Data Latih (Training)... 151 Lampiran 7. Hasil Normalisasi Citra pada Data Uji (Testing)... 156 Lampiran 8. Program RbfDesign... 158 Lampiran 9. Program GlobalRidge... 161 Lampiran 10.Script MATLAB untuk klasifikasi kanker payudara menggunakan metode RBFNN... 168 Lampiran 11.Nilai pusat dan jarak 11 cluster metode K-Means clustering... 170 Lampiran 12. Nilai pusat dan jarak 11 cluster metode Fuzzy C-Means clustering... 171 Lampiran 13.Hasil Perhitungan fungsi Gaussian 11 cluster dengan metode K-Means clustering... 172 Lampiran 14. Hasil Perhitungan fungsi Gaussian 11 cluster dengan metode Fuzzy C-Means clustering... 176 Lampiran 15.Hasil perhitungan RBFNN menggunakan metode K-Means clustering 11 cluster... 180 xvii
Lampiran 16.Hasil perhitungan RBFNN menggunakan metode Fuzzy C- Means clustering 11 cluster... 182 Lampiran 17.Pembulatan hasil perhitugan dan klasifikasi stadium kanker payudara menggunakan metode K-Means clustering 11 cluster model RBFNN... 184 Lampiran 18.Pembulatan hasil perhitugan dan klasifikasi stadium kanker payudara menggunakan metode Fuzzy C-Means clustering 11 cluster model RBFNN... 188 xviii