BAB IV PEMBAHASAN Bab IV berisi pembahasan yang meliputi proses penelitian yakni hasil model Radial Basis Function Neural Network untuk diagnosa kanker otak, hasil klasifikasi, dan ketepatan hasil klasifikasinya. A. Hasil Model Radial Basis Function Neural Network (RBFNN) untuk diagnosa kanker otak Langkah-langkah untuk diagnosa kanker otak mengunakan Radial Basis Function Neural Network (RBFNN) diantaranya adalah: 1. Pengolahan Citra Pengolahan citra dilakukan pada citra MRI otak yang diperoleh dari Rumah Sakit Panti Rapih Yogyakarta. Citra MRI otak masing-masing berukuran 1113 x 636 pixel dengan format (JPG). Pada tugas akhir ini, data yang digunakan sebanyak 114 data citra MRI otak yang terdiri dari 57 data citra MRI otal normal dan 57 data citra MRI kanker otak. Pengolahan citra yang dilakukan berupa pemotongan (cropping) citra dan penghilangan background hitam pada citra. Citra hasil proses pemotongan dan penghilangan background dapat dilihat pada lampiran (2) dan (3 ). Pengolahan citra ini dilakukan dengan bantuan perangkat lunak Corel PHOTO-PAINT X7. Berikut adalah langkah-langkah pengolahan citra: a. Proses Pemotongan Citra Proses pemotongan citra dilakukan dengan bantuan perangkat lunak Corel PHOTO-PAINT X7. Proses pemotongan citra dilakukan untuk 6
memperoleh citra otak yang sesuai dan menghilangkan informasi indentitas dari setiap pasien yang akan mempengaruhi hasil ekstraksi. Berikut proses pemotongan citra pada salah satu data citra MRI yakni 2731.jpg: Gambar 4.1 Citra MRI otak sebelum dipotong Gambar 4.2 Citra MRI otak selelah dipotong Dalam proses pemotongan, diusahakan citra tetap berbentuk persegi panjang sesuai dengan bentuk awal citra, namun dalam proses pemotongan ini tidak bisa sesuai dengan pixel awal karena citra akan berubah menjadi lonjong atau informasi pasien masih ada pada citra setelah pemotongan. Sehingga dalam proses pemotongan ini, dilakukan pemotongan berbentuk persegi panjang namun pixelnya diubah menjadi 65 x 55 pixel. 61
b. Proses Penghilangan Background Citra MRI hasil pemotongan masih memiliki background berwarna hitam yang dianggap mempengaruhi hasil dignosa. Proses penghilangan background dilakukan dengan bantuan perangkat lunak Corel PHOTO-PAINT X7. Sehingga background menjadi berwarna putih dan dapat mengurangi pengaruh pada proses ekstraksi citra. Beikut proses penghilangan background pada citra MRI: Gambar 4.3 Citra MRI sebelum dilakukan penghilangan Background Gambar 4.4 Citra MRI setelah dilakukan penghilangan Background Setelah proses menghilangkan background dilakukan, citra disimpan dengan format JPG dan pixel citra disesuaikan setelah proses pemotongan yakni menjadi 65 x 55 pixel. 62
2. Ekstraksi Citra Setelah melakukan pengolahan citra MRI, langkah selanjutnya adalah melakukan ekstraksi citra. Proses ekstraksi merupakan salah satu karakteristik penting yang digunakan dalam mengidentifikasi objek atau pola citra, karena metode ekstraksi citra yang tepat akan mampu memberikan informasi yang detail tentang kelas suatu citra. Proses ekstraksi citra dapat dilakukan dengan Gray Level Coocurrence Matrix (GLCM). Parameter-parameter hasil ekstraksi citra yang digunakan dalam tugas akhir ini adalah 14 fitur yang nantinya digunakan sebagai variabel input dalam proses diagnosa. Fitur tersebut yaitu energi, kontras, korelasi, sum of squares, inverse difference moment, sum average, sum variance, sum entropy, entropi, difference variance, difference entropy, probabilitas maksimum, homogenitas dan dismilarity. Proses ekstraksi citra untuk mendapatkan parameter-parameter tersebut dapat dilakukan dengan bantuan MATLAB R213a. Berikut adalah contoh hasil ekstraksi citra untuk data citra MRI otak 2731.jpg yang ditunjukkan pada Tabel 4.1: Tabel 4.1 Hasil Ekstraksi Citra 2731.jpg No Fitur Hasil Ekstraksi 1 Energi,292947 2 Kontras,38517 3 Korelasi,978821 4 Sum of Squares 37,66693 5 Inverse difference moment,995588 6 Sum Average 11,5545 7 Sum Variance 115,3538 63
8 Sum Entropy 1,753428 9 Entropi 1,947261 1 Difference Variance,38517 11 Difference entropy,522479 12 Probabilitas Maksimum,554 13 Homogenitas,918169 14 Dissimilarity,192586 Selanjutnya, untuk hasil ekstraksi citra dari 114 data citra MRI secara lengkap dapat dilihat pada Lampiran (5). 3. Pendefinisian Variabel Input dan Variabel Target Pendefinisian variabel input dan target digunakan sebagai input dan target jaringan. Input berasal dari 14 parameter hasil dari ekstraksi citra menggunakan Gray Level Co-occurance Matrix (GLCM) secara lengkap dapat dilihat pada Lampiran (3) dan (6), sehingga banyaknya neuron pada lapisan input adalah 14 neuron. Variabel target berasal dari keterangan diagnosa masing-masing citra yakni citra MRI normal dan citra MRI kanker. Target dan output berupa vektor yang mewakili masing-masing diagnosa. Pola target yang digunakan sebagai berikut: Tabel 4.2 Pola Target Vektor Diagnosa Kanker Otak No Diagnosa Vektor Target 1 Normal 2 Kanker 1 64
Hasil diagnosa yang didapatkan merupakan bilangan desimal. Pendiagnosaan dilakukan dengan membulatkan bilangan desimal tersebut dengan kriteria, jika <.5 maka dibulatkan menjadi, sedangkan apabila.5 maka hasil perhitungan dibulatkan menjadi 1. 4. Pembagian Data Input Langkah selanjutnya adalah pembagian data input yang berupa data training dan testing. Pembagian data input dilakukan secara acak ( random). Pada tugas akhir ini yang digunakan untuk data training adalah 9 sampel data dari 114 total sampel data dan data testing yang digunakan adalah 24 sampel data dari 114 total sampel data. Hasil pembagian data input terlampir pada Lampiran (7) untuk data training dan Lampiran (8) untuk data testing. 5. Normalisasi Data Setelah proses pembagian data input, langkah selanjutnya adalah normnalisasi data. Data input dinormalisasi dengan membawa data ke bentuk normal baku, yakni dengan mean/rata-rata = dan standar deviasi = 1. Hasil normalisasi data training dan data testing secara urut masing-masing terlampir pada Lampiran ( 9) dan Lampiran ( 1). Berikut adalah salah satu hasil normalisasi citra 2731.jpg: Tabel 4.3 Hasil Normalisasi Citra 2731.jpg No Fitur Hasil Normalisasi 1 Energi -,2189 2 Kontras -,29747 3 Korelasi,368651 4 Sum of Squares,535738 65
5 Inverse difference moment,229242 6 Sum Average,451897 7 Sum Variance,2615 8 Sum Entropy,841416 9 Entropi,75563 1 Difference Variance -,29747 11 Difference entropy,423728 12 Probabilitas Maksimum,461948 13 Homogenitas -,58674 14 Dissimilarity,29753 6. Pembelajaran Radial Basis Function Neural Network Data training hasil normalisasi digunakan dalam proses clustering. Proses clustering yang digunakan adalah metode k-means clustering. Proses k- means clustering dilakukan dengan menggunakan perangkat lunak MINITAB sehingga didapatkan pusat masing-masing cluster dan jarak yang digunakan dalam proses RBFNN. Tabel 4.4 merupakan hasil jarak dan pusat clustering dengan 1 cluster. Tabel 4.4 Hasil Jarak dan Pusat Clustering Clus ter Pusat Cluster Jarak X1 X2 X3 X4 X5 X6 X7 1-1,545 1,395-1,31 -,155 -,145 1,114 -,288 2 -,72,737 -,851,636 -,852,869,217 3 1,249 -,949,95 -,437,343 -,699 -,795,667 4 1,159 -,688 1,616-2,13 1,835-1,742-1,87 5 -,536,36 -,669 1,26 -,951,7 1,265 6 -,252,41 -,128 -,265,185,53 -,83 66
7,24 -,49 -,1,448 -,325,11,536 8-1,681 1,467-1,912 1,769-2,14 1,914,969,354 9,713-1,765 1,11 -,263,935-1,25,47 1 -,996,916 -,816,245 -,134,684,621 Clus ter Pusat Cluster Jarak X8 X9 X1 X11 X12 X13 X14 1 -,291 -,29 -,28,113-1,545-1,269 1,542 2,39,1,232 -,811 -,72 -,872,747 3 -,774 -,699 -,74,193 1,249,859-1,25,667 4-1,727-1,675-1,896 1,82 1,159 1,62-1,242 5 1,112 1,2 1,219 -,971 -,536 -,677,558 6 -,158 -,21 -,197,255 -,252 -,69,244 7,593,641,591 -,392,24 -,18 -,187 8,595,56 1,53-2,76-1,681-2,75 1,738,354 9 1,235 1,431,799,831,713 1,146 -,796 1,496,411,433,18 -,996 -,754,981 Hasil jarak dan pusat cluster secara lengkap terlampir pada Lampiran (11). Setelah masing-masing pusat cluster dan jarak didapatkan, selanjutnya dilakukan proses RBFNN dengan menggunakan rbfdesign dan globalridge. Program rbfdesign dan globalridge masing-masing secara urut terlampir pada Lampiran ( 12) dan Lampiran ( 13). Proses RBFNN dilakukan menggunakan MATLAB R213a. 7. Menentukan Jaringan Optimum Proses selanjutnya adalah pengoptimalan jaringan dan pengoptimalan bobot menggunakan persamaan ( 2.52). Jaringan optimum dilakukan dengan menentukan jumlah neuron pada lapisan tersembunyi. Banyaknya neuron 67
pada lapisan tersembunyi yang dapat menghasilkan jaringan optimum adalah neuron yang menghasilkan akurasi terbaik. Dengan menggunakan metode trial and error, beberapa cluster dicoba pada program RBFNN menggunakan MATLAB R213a. Hasil akurasi dari beberapa cluster menggunakan k-means clustering yang dicoba menggunakan MATLAB R213a sebagai berikut: Tabel 4.5 Hasil Akurasi dari Beberapa Cluster Hasil Akurasi Jumlah Data Training Data Testing Cluster (%) (%) 2 51,1111 58,3333 3 57,7778 37,5 4 25,5556 33,3333 5 64,4444 7,8333 6 65,5556 58,3333 7 68,8889 75 8 75,5556 7,8333 9 72,2222 7,8333 1 83,3333 91,6667 11 66,6667 79,1667 12 64,4444 7,8333 13 76,6667 7,8333 14 15 Dari cluster yang digunakan pada Tabel 4.5 dapat dilihat bahwa nilai akurasi data training dan data testing berpola tidak beraturan. Hasil akurasi data training dan data testing yang terbaik didapatkan dengan cluster 68
sebanyak 1 cluster karena menghasilkan niai akurasi terbesar. Sehingga jaringan dengan 1 cluster merupakan jaringan optimum dengan nilai akurasi data training sebesar 83,3333% dan 91,6667% untuk data testing. Dengan demikian model RBFNN terbaik untuk mendiagnosa kanker otak mempunyai arsitektur 14 neuron pada lapisan input, 1 neuron pada lapisan tersembunyi, dan 1 neuron pada lapisan output. Arsitektur RBFNN jaringan terbaik yang digunakan untuk diagnosa kanker otak dengan 14 neuron pada lapisan input yakni (,,..., ), 1 neuron pada lapisan tersembunyi yakni (,,..., ), dan 1 neuron pada lapisan output yakni ( ) dapat dilihat pada Gambar 4.5 berikut: Lapisan Input Lapisan Tersembunyi Lapisan Output..... ( ) 1 Bias Gambar 4.5 Arsitektur RBFNN untuk Diagnosa Kanker Otak 69
Pada lapisan tersembunyi, fungsi aktivasi yang digunakan adalah fungsi aktivasi Gaussian dan fungsi yang diguakan pada lapisan output menggunakan fungsi linear atau identitas. B. Hasil Klasifikasi Arsitektur RBFNN jaringan terbaik terdiri dari 14 neuron pada lapisan input, 1 neuron pada lapisan tersembunyi, dan 1 neuron pada lapisan output. Selanjutnya, penentuan bobot yang dihasilkan dari metode global ridgeregression pada fungsi aktivasi gaussian serta model RBFNN yang didapat. Bobot antara neuron pada lapisan tersembunyi dan neuron pada lapisan output dicari dengan persamaan (2.52) yakni, = ( ) dengan, = parameter regulasi = vektor bobot diagnosa = vektor target diagnosa = fungsi aktivasi neuron tersembunyi = matriks identitas berukuran. Berdasarkan pusat, jarak, dan bobot yang dihasilkan, maka model RBFNN ( ) adalah ( ) = ( ) 7
dengan fungsi aktivasi gaussian, ( ) = exp dengan jarak cluster,. = ;. = ;. =,667;. = ;. = ;. = ;. = ;. =,354;. = ;. =. Dimana = 1, 2,..., 14 Pusat cluster 1:. = 1,54534;. = 1,395237;. = 1,3132;. =,15578;. =,14569;. = 1,11482;. =,28856;. =,29168;. =,2997;. =,2857;. =,113831;. = 1,54534;. = 1,26924;. = 1,54259. Hasil cluster secara lengkap terlampir pada Lampiran (11). Bobot ( ): = 1,7646; = 2,7443; = 2,1944; = ; =,7784; =,42; =,44; =,2819; =,659; = 1,1516; dengan bobot bias =,5494 71
Perhitungan fungsi aktivasi gaussian untuk data 2731.jpg sebagai berikut: ( ) = ( ) = (,2974 ( 1,5453)) (,297 ( 1,313)) (,755 (,1456)) (,4619 (,2885)) (,4518 (,299)) (,8414,1138) (,4237 ( 1,269)) (,2974 (,729)) (,297 (,8519)) (,755 (,8523)) (,4619,272) (,2615,2325) (,2974 (,729) (,2292,7472) (,3686 1,3952) (,218 (,1557)) (,5867 1,1148) (,5357 (,2916) (,2615 (,285)) (,2974 ( 1,5453)) (,2292 1,542) (,3686,7372) (,218,6367) (,5867,8694) (,5357,398) (,8414 (,8112) (,4237 (,8726) =,3436 =,29498 (,4518,1) 72
( ) = ( ) = (,2974 1,2495),667 (,297,957),667 (,755,3431),667 (,4619 (,7956)),667 (,4518 (,6992)),667 (,8414,19399),667 (,4237,85966),667 = 8,8343 16 (,2974 1,1597) (,297 1,6168) (,755 1,8359) (,3686 (,9497)),667 (,218 (,43726)),667 (,5867 (,6996)),667 (,5357 (,7748),667 (,2615 (,742)),667 (,2974,8596),667 (,2292 ( 1,256)),667 (,3686 (,6887)) (,218 ( 2,13)) (,5867 ( 1,742)) (,4619 ( 1,872)) (,5357 ( 1,7275) (,4518 ( 1,6751)) (,2615 ( 1,8968)) (,8414 1,827) (,2974 1,1597) (,2292 ( 1,2426)) = (,4237 1,622) 73
( ) = ( ) = (,2974 (,536)) (,297 (,6693)) (,755 (,9516)) (,4619 1,2653) (,2615 1,219) (,3686,367) (,218 1,268) (,5867,73) (,5357 1,1126) (,8414 (,9713)) (,2974 (,536)) (,4237 (,677)) (,2292,558) (,2974 (,25253)) (,297 (,1287)) (,755,1854) (,4619 (,839)) (,4518 (,217)) (,8414,2558) (,4237 (,69)) =,13339 (,3686,416) (,218 (,2658)) (,5867,539) (,5357 (,1587)) (,2615 (,1976)) (,2974 (,2525)) (,2292,2448) (,4518 1,25) =,53851 74
( ) = (,2974,2418) (,3686 (,498)) (,297 (,19)) (,755 (,3258)) (,218,4487) (,5867,113) (,4619,5368) (,5357,5934) (,4518,6417) (,2615,5918) (,2974,241) (,8414 (,3924)) (,4237 (,18)) (,2292 (,1874)) =,65251 ( ) = (,2974 ( 1,681)),354 (,3686 1,4672),354 (,297 ( 1,9126)),354 (,755 ( 2,144)),354 (,218 1,7697),354 (,5867 1,9143),354 (,4619,9694),354 (,5357,5956),354 (,4518,568),354 (,2615 1,531),354 (,8414 ( 2,76)),354 (,2974 ( 1,6811)),354 (,4237 ( 2,754)),354 (,2292 1,7385),354 = 1,829 161 75
( ) = ( ) = (,2974,7138) (,297 1,111) (,755,9351) (,4619,476) (,2615,7999) (,4237 1,1467) (,2974 (,996)) (,297 (,8165)) (,755 (,1344)) (,4619,6219) (,2615,4337) (,3686 ( 1,7655)) (,218 (,2633)) (,5867 ( 1,251)) (,5357 1,2358) (,8414,831) (,2292 (,7962)) (,3686,91622) (,218,2457) (,5867,6847) (,5357,4961) (,8414,187) (,2974 (,996)) (,4237 (,7544)) (,2292,9813) =,1714 (,4518 1,4315) (,2974,7138) =,12449 (,4518,4114) Hasil perhitungan fungsi aktivasi gaussian pada model RBFNN secara lengkap terlampir pada lampiran (14). Berdasarkan hasil perhitungan nilai fungsi aktivasi gaussian, dilakukan perhitungan untuk menentukan hasil diagnosa menggunakan persamaan (2.25). ( ) =,29498 (1,7646) (,3436 ( 2,7447)) (8,8343 16 ( 2,19377)) ( ),13339 (,7783),5385 (,4196) (,6525 (,4399)) (1,829 161 (,281649)),12449 (,659),17147 (1,15159) (1,54935) =,692947 76
Hasil perhitungan diagnosa secara lengkap terampir pada lampiran (16). Berikut hasil diagnosa data 2731.jpg yang dibulatkan sesuai dengan kriterianya. Tabel 4.6 Hasil Perhitungan Diagnosa secara Manual Output Perhitungan Manual Pembulatan Status Output,692947 1 Kanker Sedangkan berikut merupakan hasil diagnosa data 2731.jpg yang diselesaikan menggunakan bantuan MATLAB R213a, yakni Tabel 4.7 Hasil Perhitungan Diagnosa menggunakan MATLAB R213a Output Perhitungan Pembulatan Status Output,6929 1 Kanker Berdasarkan Tabel 4.6 dan Tabel 4.7, hasil output untuk diagnosa data 2731.jpg nilainya hampir mendekati sama. Sehingga perhitungan data yang lainnya dilakukan dengan bantuan MATLAB R213a. Hasil pembulatan diagnosa secara lengap terlampir pada lampiran (17). Berdasarkan lampiran (17), dapat dihitung ketepatan hasil diagnosa kanker otak dengan model RBFNN. C. Ketepatan Hasil Klasifikasi Ketepatan hasil klasifikasi/diagnosa dapat dihitung berdasarkan sensitivitas, spesifisitas, dan akurasi. Nilai akurasi telah diketahui melalui program MATLAB yang telah dilakukan sebelumnya, selanjutnya untuk 77
menghitung nlai sensitivitas dan nilai spesifitas, ditentukan terlebih dahulu nilai True Positive (TP), True Negative (TN), False Positive (FP), dan False Negative (FN). Berikut Jumlah hasil diagnosa kanker otak menggunakan RBFNN. Tabel 4.8 Jumlah Hasil Diagnosa Kanker Otak Menggunakan RBFNN Target Normal Hasil Diagnosa Abnormal Jumlah Normal 37(TN) 8(FP) 45 Data Training Abnormal 7(FN) 38(TP) 45 Jumlah 9 Normal 1(TN) 2(FP) 12 Data Testing Abnormal (FN) 12(TP) 12 Jumlah 24 Jumlah Data Training dan data Testing 114 Berdasarkan Tabel 4.8, dapat dihitung sensitivitas dan spesifisitas hasil diagnosa model RBFNN dengan persamaan (2.55) dan persamaan (2.56) sebagai berikut: 1. Data Training a) Sensitivitas = 1% = 1% = 84,4444% b) Spesifisitas = 1% = 1% = 82,2222% 2. Data Testing a) Sensitivitas = 1% = 1% = 1% 78
b) Spesifisitas = 1% = 1% = 83,3333% Pada data training, nilai sensitivitas 84,4444% artinya untuk pasien yang memiiki kanker otak kemungkinan model RBFNN mendiagnosa dengan tepat adalah sebesar 84,4444%. Sedangkan nilai spesifisitas 82,2222% artinya untuk pasien yang tidak memiliki kanker otak kemungkinan model RBFNN mendiagnosa dengan tepat sebesar 82,2222%. Nilai akurasi pada data training 83,3333% artinya hasil diagnosa dengan model RBFNN akurat sebesar 83,3333%, baik untuk pasien yang tidak memiliki kanker otak (normal), maupun pasien yang memiliki kanker otak. Pada data testing, nilai sensitivitas 1% artinya untuk pasien yang memiiki kanker otak kemungkinan model RBFNN mendiagnosa dengan tepat adalah sebesar 1%. Sedangkan nilai spesifisitas 83,3333% artinya untuk pasien yang tidak memiliki kanker otak kemungkinan model RBFNN mendiagnosa dengan tepat sebesar 83,3333%. Nilai akurasi pada data testing 91,6666% artinya hasil diagnosa dengan model RBFNN akurat sebesar 91,6666%, baik untuk pasien yang tidak memiliki kanker otak (normal), maupun pasien yang memiliki kanker otak. 79