BABI PENDAHULUAN 1.1 Latar Belakang Tubuh manusia tersusun atas berbagai macam organ vital yang menunjang kehidupan. Salah satu contoh organ vital manusia adalah jantung. Jantung bertugas memompa darah dari dan keseluruh tubuh. Jika jantung mengalami kelainan dan gangguan, maka distribusi nutrisi dan oksigen yang terkandung di dalam darah menjadi tidak normal, sehingga menyebabkan tubuh terganggu. Kondisi jantung dapat diamati berdasarkan cardiac action potential, suatu sinyal elektronis yang timbul akibat adanya kontraksi mekanis sel jantung yang diberikan stimulasi berupa arus listrik. [1], [2]. Electrocardiogram (ECG), merupakan salah satu isyarat fisiologi utama yang dihasilkan dari kerja elektrik jantung ketika fase repolarisation dan depolarisation[1] [11]. ECG pertama kali diperkenalkan oleh Augustus Waller pada tahun 1887 [1]. Sejak saat itu, ECG menjadi salah satu isyarat yang penting dan paling sering digunakan untuk melakukan analisis terhadap perilaku jantung[1], [2], [5] [7], [12] [16]. ECG dapat dengan mudah diperoleh dengan perantara elektroda yang dipasang pada dada pasien [2]. Isyarat ECG menghasilkan data satu dimensi yang menunjukkan perubahan tegangan listrik yang dideteksi dari kulit manusia, pada rentang waktu tertentu [17], [18]. ECG termasuk metode non-invasive[9], [10], [19], [20], sehingga tidak menimbulkan efek samping terhadap pasien. Jantung, sebagaimana organ tubuh yang lain, kinerjanya dapat menurun dan terserang penyakit. Salah satu penyakit jantung yang mempunyai angka kematian tinggi adalah CVD (cardiovascular disease). Berdasarkan data WHO, pada tahun 2007, dari setiap 100 ribu populasi, rata-rata terdapat 251 orang meninggal akibat CVD [20]. Pada tahun 2010, hampir 180.000 meninggal akibat CVD di Inggris [21], sedangkan di Brazil, CVD merupakan penyebab kematian tertinggi [22]. Salah satu komplikasi dari CVD antara lain adalah atrial dan 1
ventriculararrhythmia, yang terjadi akibat gangguan irama jantung atau cardiacarryhthmia[20], [21]. Cardiac arrhythmia, atau biasa disebut dengan arrhythmia saja, terjadi akibat adanya inisiai impuls dan konduksi yang tidak normal [1]. Terdapat berbagai jenis arrhythmia yang dapat dibagi berdasarkan asal mula gangguan di jantung (site of origin), atau dapat pula dikelompokkan berdasarkan kecepatan rata-rata detak jatungnya [1], [23]. Atrial Fibrillation (AF), salah satu dari penyebab cardiacarrhythmia, merupakan gangguan yang paling sering ditemui [23] [25]. AF banyak ditemui pada kasus arrhythmia yang terjadi pada pasien dewasa, dengan tingkat prevalence secara umum adalah 1%, tetapi presentase tersebut meningkat tajam pada pasien yang berusia diatas 80 tahun, dengan presentase mencapai 7-14% pada pasien yang tinggal di kawasan western, dan 2-3% di Jepang [23]. Penelitian lain menyebutkan bahwa anak-anak dapat pula gangguan arrhythmia, dengan tingkat prevalence sekitar 1,25% pada anak sekolah dasar, dan 2,32% pada anak setingkat SLTP [1]. Gejala arrhythmia dapat didiagnosis berdasarkan bentuk morfologi dari ECG yang diperoleh dari pasien [2], [19]. Untuk memperoleh informasi yang detail, jantung pasien harus diamati secara kontinyu, yang mana membutuhkan perhatian khusus dari para dokter. Oleh karena banyaknya jumlah pasien yang membutuhkan monitoring dari para dokter secara kontinyu, dikembangkanlah sistem deteksi ECG secara umum, dan deteksi arrhythmia secara khusus, yang bersifat otomatis [5], [18], [19], [22], [26]. Sistem deteksi atau klasifikasi arrhythmia secara otomatis banyak dikembangkan dengan basis machine learning. Secara umum, sistem pemodelan klasifikasi dalam machine learning dapat dibagi menjadi tiga kelompok, yaitu decision tree classifier, rule-based classifier, dan mathematical / functional model classifier. Di antara ketiga kelompok tersebut, decisiontree classifier dan rulebased classifier secara umum lebih mudah dipahami karena representasi knowledge dalam bentuk tree atau rule lebih sesuai dengan intuisi manusia [27]. Namun, mathematical modelclassifier mempunyai keunggulan lebih baik dari segi 2
performa, dan oleh karenanya banyak digunakan sebagai core dalam penelitian sistem otomatisasi deteksi arrhythmia, antara lain menggunakan algoritme klasifikasi ANN (Artificial Neural Network) dan variannya [5], [7] [9], [11], [13], [19], [20], [22], [28], [29], SVM (Support Vector Machine) [13] [15], [18], [20], dan KNN (K-Nearest Neighbour) [29], [30]. Fenomena perkembangan machine learning yang berkaitan dengan dunia medis tersebut diamati oleh Kononenko[31], seorang profesor dari Slovenia. Hasil pengamatannya adalah berupa kriteria yang seharusnya dipenuhi sistem machine learning sebagai alat bantu diagnosis dokter dan tenaga medis. Kriteria tersebut yang pertama, sistem mampu menghasilkan performa yang baik dan mampu mengurangi durasi atau jumlah interaksi dengan pasien. Kriteria lain yang menjadi pertimbangan adalah sistem machine learning tersebut harus mampu menjelaskan keputusan yang dihasilkan kepada tenaga medis. Knowledge yang dihasilkan oleh sistem harus dapat dianalisis dan dipahami oleh tenaga medis. Kondisi ini akan membantu tenaga medis untuk mengambil keputusan berdasarkan berbagai point of view, sehingga memperkaya knowledge dalam menangani kasus tertentu. Selain itu, dengan knowledge yang lebih transparan akan mengantisipasi bila terdapat ditemukan hasil keputusan sistem yang tidak masuk akal, tenaga medis mampu melihat lebih detail langkah pengambilan keputusan tersebut dan mengetahui kekurangan sistem. Jika hal ini tidak terpenuhi, maka akan dimungkinkan terjadi penurunan tingkat kepercayaan tenaga medis terhadap hasil keputusan sistem. Transparansi knowledge pada sistem machine learning yang berkaitan dengan dunia medis dapat terpenuhi jika sistem dibangun menggunakan model klasifikasi rule-based dan decision tree. Seperti yang telah dijelaskan, model rulebased dan decision tree lebih mudah dipahami dan sesuai dengan intuisi manusia. Akan tetapi, model-model tersebut belum mampu menghasilkan performa yang mendekati hasil klasifikasi menggunakan mathematical model. Untuk mengatasi hal ini, salah satu strateginya adalah meningkatkan performa klasifikasi dengan trade-off berupa transparansi model. Hal ini dapat dipenuhi dengan 3
mengimplementasikan struktur cascade atau bertingkat pada model klasifikasi berbasis rule dan decision tree. Base Classifier Decision Atribut-1 Atribut-2 Atribut-3... Meta Classifier Atribut-n Gambar 1.1 Ilustrasi struktur cascade classifier Struktur cascade [32], sebagaimana yang diilustrasikan pada Gambar 1.1 diatas, merupakan suatu cara menyusun model klasifikasi secara bertingkat. Proses klasifikasi yang dilakukan tidak hanya sekali, melainkan dua kali atau lebih. Adapun metode yang digunakan dapat disesuaikan, bisa sama ataupun berbeda. Data mula-mula diklasifikasikan menggunakan meta-classifier. Output hasil model meta-classifier, ditambahkan ke dataset awal sebagai atribut baru. Data yang baru tersebut kemudian di klasifikasikan menggunakan base-classifier, selanjutnya keluaran base-classifier menjadi keluaran akhir sistem. 1.2 Perumusan masalah Berdasarkan paparan diatas, dapat disimpulkan sebuah permasalahan yang masih dihadapi oleh sebagian besar sistem berbasis machine learning berkaitan dengan data medis, yaitu transparansi sistem. Sistem machine learning yang dikembangkan untuk mendeteksi penyakit arrhythmia secara otomatis sebagian besar menggunakan mathematical model classifier, yang secara umum lebih sulit dipahami oleh manusia, terutama bagi mereka yang tidak mempunyai backgroundilmu keteknikan. Oleh karena itu, untuk meningkatkan pemahaman dokter dan tenaga medis terhadap sistem klasifikasi, sebagaimana yang disarankan oleh Kononenko[31], perlu dikembangkan sistem klasifikasi yang lebih mudah dipahami knowledge-nya, yaitu menggunakan klasifikasi berbasisdecision tree 4
ataurule. 1.3 Keaslian penelitian Penyakit jantung, khususnya arrhythmia, memiliki tingkat prevalence yang tinggi. Salah satu metode untuk mendiagnosis penyakit jantung dilakukan menggunakan ECG. Diagnosis hasil ECG pada secara umum dilakukan secara manual, akan tetapi karena kebutuhan yang tinggi, diperlukan sistem otomatis untuk membantu dalam pengambilan keputusan. Sistem otomatis diagnosis ECG berbasis machine learning telah banyak diteliti dan dikembangkan, seperti yang disajikan pada Tabel 1.1. Tabel 1.1 Tabel penelitian-penelitian sebelumnya Tahun Metode Klasifikasi Ektraksi Fitur 2000 2004 2010 2012 2012 2012 2013 Artificial Neural Network[22] Fuzzy Neural Network[28] Ant Colony OptimizationClustering; Artificial Neural Network[33] Radial Basis Function[11] ANN,Fuzzy KNN; Fuzzy Inference System[9] K-Nearest Neighbour[30] Artificial Neural Network, Support Vector Machine, Probabilistic Neural Network[20] LPF Beat Extraction using decimation; R-peak Wavelet; Normalize PCA; Wavelet; Interval komponen ECG Wavelet; Beat Extraction PQRST detect; Beat Segmentation; Normalize Statistik dari Wavelet Packet Decomposition WPD Pan Tompkin; Ekstrak 200 detak; PCA,LDA,ICA Kelas Klasifikasi 3 class dengan semua data 7 rekaman pasien 6 kelas 5 kelas @ 100 detak 5 kelas @ 100 detak AAMI, 5 kelas, 5.887 detak AAMI, 5 kelas, 110.094 detak Hasil 99,2% 99,79% Overallakurasi 92 % 99.6% 98 % 90% SEN, 98% SPE, 92% SEL Overallakurasi 99,28% dengan ICA + PNN Secara umum, sistem diagnosis arrhythmia yang telah diteliti menghasilkan performa yang memuaskan. Penelitian [30] menggunakan KNN, 5
diperoleh hasil sensitivity sebesar 98%. Selain itu, terdapat pula penelitian menggunakan ANN, SVM dan PNN (Probabilistic Neural Network) [20] yang menghasilkan akurasi terbaik mencapai 99,28%. Kedua penelitian tersebut mengklasifikasikan kelompok lima kelas dari 16 kelas yang ada, sesuai dengan standar AAMI (Association for the Advancement of Medical Instrumentation). Selain itu, klasifikasi arrhythmia juga dilakukan dengan lima kelas, akan tetapi tidak semua kelas penyakit digunakan seperti pada [11][9]. Dari semua penelitian yang dipaparkan padatabel 1.1, terdapat celah yang masih dapat dikembangkan.pertama, penelitian-penelitian tersebut menggunakan algoritme klasifikasi dengan luaran berupa model yang tidak mudah untuk dipahami, apalagi oleh dokter dan tenaga medis. Hal ini cukup bertolak belakang dengan saran mengenai transparansi model oleh Kononenko [31]. Oleh karena itu, diperlukan disain dan implementasi sistem klasifikasi penyakit arrhythmia dengan yang transparan.celah lain yang dapat dikembangkan adalah pada penelitian sebelumnya, data ekstraksi ciri digunakan tanpa mempertimbangkan informasi dari data original.data originaldan data hasil ekstraksi ciri memiliki kandungan informasi berbeda, sehingga penggabungan atribut akan memberikan informasi yang lebih lengkap. Sehingga, secara ringkas penelitian ini memberikan beberapa kontribusi, yaitu : 1. Mengembangkan metode klasifikasi transparan dengan performa yang reasonable, dengan menerapkan algoritme klasifikasi berbasis decision tree dan rule-based classifier, 2. Menggabungkan data hasil ekstraksi ciri dengan data original, dan implementasi struktur cascade untuk meningkatkan performa klasifikasi. 1.4 Tujuan penelitian Tujuan dari penelitian ini adalah merancang dan mengimplementasikan sebuah sistem machine learning untuk klasifikasi arrhythmia berdasar EKG yang transparan, dengan tetap menghasilkan performa yang baik. Transparansi sistem 6
dapat ditingkatkan dengan berbagai cara, salah satunya adalah menggunakan classifier berupa decision tree atau rule. 1.5 Manfaat penelitian Hasil penelitian ini dapat bermanfaat terhadap keilmuan mengenai pengembangan machine learning menggunakan model algoritme klasifikasiyang lebih mudah dipahami knowledge-nya, serta melakukan implementasi strategi cascade untuk meningkatkan akurasi klasifikasi. Transparansi sistem machine learning akan meningkatkan pemahaman engineer dan tenaga medis terhadap model yang dibentuk oleh sistem, sehingga mampu memahami alasan di balik diambilnya sebuah keputusan oleh sistem. 7