BAB I PENDAHULUAN 1.1 Latar Belakang Jantung adalah organ dalam tubuh manusia yang memiliki peran penting pada sistem peredaran darah. Jantung merupakan pompa paling efisien dan tahan lama yang dikenal manusia. Jantung telah diketahui mampu memompa lebih dari 100 tahun tanpa istirahat satu detik-pun pada suatu waktu, sebuah kemampuan yang belum dapat dicapai oleh perangkat buatan manusia. Namun, seperti perangkat elektromekanis lainnya jantung dapat menjadi kurang efisien atau rusak [1]. Ketika kinerja jantung terganggu, maka hal ini dapat menyebabkan penyakit jantung. Coronary artery disease (CAD), terkadang disebut juga Coronary Heart Disease (CHD) [2], atau Ischemic Heart Disease [3] adalah contoh penyakit yang banyak diderita oleh manusia. Penyakit ini memiliki angka kematian yang sangat tinggi, contohnya pada tahun 2008 diperkirakan 7,3 juta kematian di dunia disebabkan oleh penyakit jantung koroner [4]. Penyakit jantung koroner terjadi ketika atherosclerosis (timbunan lemak) menghalangi aliran darah ke otot jantung pada arteri koronaria [2]. Diagnosis klinis terhadap penyakit jantung koroner dilakukan dengan mendeteksi keberadaan gejala nyeri dada atau angina. Namun, prosedur diagnosis penyakit jantung koroner menggunakan gejala ini mungkin sulit dilakukan. Rasa tidak nyaman nyeri dada tidak selalu dialami dengan cara yang sama dan gejala pada pasien mungkin terlihat samar-samar. Nyeri dada juga dapat terjadi dalam berbagai kondisi yang mungkin atau tidak disertai penyakit jantung koroner. Oleh karena itu, penting bagi dokter untuk membedakan antara nyeri angina dan nyeri dada dari sumber lain [1]. Diagnosis awal biasanya menggunakan riwayat medis dan pemeriksaan fisik, kemudian uji lanjutan dapat dilakukan. Uji lanjutan yang dilakukan yaitu electrocardiography (ECG), echocardiogram, stress test, nuclear imaging, dan 13
coronary angiography [5]. Dari uji lanjutan ini, coronary angiography merupakan metode gold standard untuk mendiagnosis penyakit jantung koroner [6]. Uji coronary angiography lebih dipilih oleh ahli jantung untuk mendiagnosis keberadaan penyakit jantung koroner pada pasien dengan akurasi yang tinggi meskipun invasive, mempunyai risiko, dan mahal [5]. Jika dilihat dari kekurangan uji ini, perlu dikembangkan sebuah metode yang mampu mendiagnosis penyakit jantung koroner sebelum dilakukan uji coronary angiography. Tujuannya adalah untuk menghindari prosedur diagnosis penyakit jantung koroner yang invasive, memiliki risiko, dan mahal terhadap pasien. Oleh karena itu, hal ini memotivasi pengembangan suatu metode komputer untuk dapat mendiagnosis keberadaan penyakit jantung koroner. Metode komputer dapat menyediakan prosedur diagnosis penyakit jantung koroner terhadap pasien dengan cara yang non-invasive, aman, dan lebih murah. Banyak penelitian yang mengembangkan berbagai macam teknik komputasi cerdas untuk mendiagnosis penyakit jantung. Metode neural network [7], metode fuzzy [8] [10], dan data mining [11], [12] diusulkan untuk mendiagnosis penyakit jantung koroner. Pada diagnosis medis, reduksi data merupakan masalah yang penting. Data medis sering mengandung sejumlah fitur yang tidak relevan, redundant, dan sejumlah kasus yang relatif sedikit sehingga dapat mempengaruhi kualitas diagnosis penyakit [13]. Oleh karena itu, proses seleksi fitur dapat digunakan untuk menyeleksi fitur-fitur yang relevan pada data medis. Proses seleksi fitur diusulkan dalam banyak penelitian untuk meningkatkan akurasi pada proses diagnosis penyakit jantung koroner [13] [15]. Dataset Cleveland merupakan dataset yang populer dan secara luas digunakan oleh peneliti data mining untuk mendiagnosis penyakit jantung koroner. Dataset ini berisi database diagnosis penyakit jantung [16] sehingga dapat digunakan untuk mendiagnosis penyakit jantung koroner. Nahar dkk. [15] mengombinasikan proses seleksi fitur berdasarkan pakar medis dan komputer. Nahar dkk. melakukan proses seleksi fitur menggunakan metode correlation based feature selection (dengan strategi pencarian BestFirst). 14
Dalam penelitian sebelumnya, Nahar dkk. [15] hanya menggunakan satu metode seleksi fitur berbasis komputer. Oleh karena itu, hal ini tidak memberikan informasi mengenai penggunaan metode seleksi fitur lainnya. Selain itu, penelitian ini juga menemukan perbedaan karakteristik pada dataset Cleveland yang digunakan dengan penelitian sebelumnya. Perbedaan ini jelas dapat mempengaruhi hasil seleksi fitur dan performa diagnosis. Kemudian tingkat signifikansi performa dari skema pembelajaran belum diperhatikan. 1.2 Perumusan masalah Berdasarkan latar belakang tersebut, dapat diketahui bahwa data medis sering mengandung sejumlah fitur yang tidak relevan dan redundant, sehingga mempengaruhi kualitas performa diagnosis. Oleh karena itu, proses reduksi data atau seleksi fitur pada data medis perlu dilakukan untuk meningkatkan performa diagnosis penyakit jantung koroner. Pada penelitian sebelumnya yang dilakukan oleh Nahar dkk. [15], terdapat beberapa masalah yang belum diperhatikan dan masih perlu untuk diteliti pengaruhnya terhadap performa diagnosis penyakit jantung koroner. Beberapa masalah tersebut adalah sebagai berikut. 1. Metode seleksi fitur berbasis komputer yang digunakan hanya satu dan tidak memberikan informasi mengenai penggunaan metode seleksi fitur lainnya. 2. Tingkat signifikansi performa diagnosis dari skema pembelajaran tidak diketahui. 1.3 Keaslian penelitian Terdapat banyak penelitian yang dilakukan untuk mendiagnosis penyakit jantung dengan menggunakan berbagai macam metode komputer. Pada bagian ini, diberikan kajian dari beberapa penelitian sebelumnya mengenai diagnosis penyakit jantung koroner. Kajian dilakukan untuk memberikan informasi mengenai perbedaan dan kebaruan antara penelitian-penelitian sebelumnya 15
dengan penelitian yang dilakukan pada saat ini. Penelitian-penelitian yang telah dilakukan sebelumnya menggunakan bermacam-macam pendekatan untuk mendiagnosis penyakit jantung koroner. Shouman dkk. [11] mengusulkan teknik hybrid data mining untuk mengidentifikasi pengobatan (treatment) yang sesuai bagi pasien penyakit jantung. Hal ini bertujuan untuk menghilangkan perbedaan antara hasil pada diagnosis penelitian penyakit jantung dengan prosedur pengobatan yang hendak dilakukan kepada pasien. Khatibi dan Montazer [8] menggunakan metode fuzzy untuk menanggulangi kesamaran dan ketidakpastian dalam hal penilaian risiko CAD. Pal dkk. [10] menggunakan metode fuzzy untuk melakukan proses screening sehingga CAD dapat dideteksi sedini mungkin. Lahsasna dkk. [9] menggunakan metode fuzzy untuk mendiagnosis penyakit jantung koroner dengan memperhatikan transparansi dari proses pengambilan keputusan. Permasalahan mengenai reduksi data penyakit jantung juga menjadi topik yang diperhatikan pada diagnosis penyakit jantung koroner. Proses reduksi data dilakukan untuk mengurangi dimensi dari data yang digunakan, sehingga hal ini dapat mengurangi beban komputasi dan mampu meningkatkan performa diagnosis penyakit jantung koroner. Babaoglu dkk. [17] melakukan reduksi data dengan menggunakan principle component analysis (PCA) untuk menemukan model SVM yang optimal dalam proses diagnosis CAD. Rajeswari, dkk. [18] menggunakan ANN untuk mereduksi fitur dan akurasi yang diperoleh semakin meningkat dibandingkan dengan proses diagnosis tanpa reduksi fitur. Alizadehsani dkk. [12] menggunakan confidence dari suatu rule dan information gain untuk menentukan efektivitas suatu fitur dari data penyakit jantung koroner. Kemudian diusulkan algoritme feature creation untuk membentuk fitur baru yang memiliki pengaruh signifikan terhadap kemampuan prediksi. Selanjutnya teknik data mining digunakan untuk mendiagnosis penyakit jantung koroner. Zuo dkk. [14] menggunakan algoritme seleksi fitur berdasarkan Markov Blanket dan information gain pada klasifikasi sindrom dari penyakit jantung koroner. Khemphila dan Boonjing [7] menggunakan information gain sebagai 16
metode seleksi fitur dan artificial neural network (ANN) digunakan untuk mengklasifikasikan penyakit jantung. Hasil yang dilaporkan pada penelitian tersebut menunjukkan bahwa seleksi fitur meningkatkan akurasi dan efisiensi komputasi. Nahar dkk. [15] melakukan seleksi fitur berbasis komputer dan pakar medis untuk mendiagnosis penyakit jantung koroner. Hasil yang diperoleh menunjukkan bahwa seleksi fitur berbasis komputer dan pakar mampu meningkatkan performa diagnosis. Kombinasi seleksi fitur berbasis komputer dan pakar medis juga dilakukan pada penelitian tersebut, hasil yang diperoleh menunjukkan peningkatan performa pada beberapa penggunaan algoritme seperti Naïve Bayes, IBk, dan SMO. Berdasarkan hasil kajian dari beberapa penelitian tersebut, reduksi data atau seleksi fitur memegang peranan penting dalam hal peningkatan performa diagnosis penyakit jantung koroner. Oleh karena itu, pada penelitian ini diteliti dan dikombinasikan metode-metode seleksi fitur untuk meningkatkan performa diagnosis. Dengan meningkatnya performa diagnosis, diharapkan diagnosis berbasis metode komputer mampu memberikan masukan kepada dokter sebelum melakukan uji coronary angiography sehingga dapat menghindari prosedur yang invasive, memiliki risiko, dan mahal. 1.4 Tujuan Penelitian Tujuan utama pada penelitian ini adalah melakukan reduksi data atau seleksi fitur untuk memilih fitur-fitur yang relevan, sehingga perfoma diagnosis penyakit jantung koroner dapat ditingkatkan. Data penyakit jantung yang digunakan pada penelitian ini adalah dataset Cleveland. Berdasarkan dari beberapa masalah penting yang belum diperhatikan pada penelitian sebelumnya, pada penelitian juga memiliki tujuan sebagai berikut. 1. Meneliti dan mengombinasikan metode-metode seleksi fitur untuk meningkatkan performa diagnosis penyakit jantung koroner. 2. Menentukan tingkat signifikansi performa untuk menentukan skema pembelajaran yang terbaik pada diagnosis penyakit jantung koroner. 17
1.5 Manfaat Penelitian Hasil dari penelitian ini diharapkan dapat membantu peneliti untuk merancang sistem diagnosis penyakit jantung koroner berbasis komputer yang memberikan hasil diagnosis tidak bias. Selain itu, hasil penelitian ini juga dapat menjadi masukan bagi dokter untuk mendiagnosis penyakit jantung koroner sebelum dilakukan metode gold standard. Oleh karena itu, prosedur diagnosis penyakit jantung koroner yang invasive, memiliki risiko, dan mahal terhadap pasien dapat dihindari lebih dini. 18