METODE REGRESI LOGISTIK UNTUK MENGANALISIS FAKTOR RISIKO PENYAKIT JANTUNG KORONER Astri Atti* ABSTRACT Coronary heart disease (CHD) is an anomaly that caused by constriction of artery. CHD is influenced by hypercholesterol, hypertension, diabetes mellitus, smoking, obesity, sport less, genetic, stress, age, and even sex. Logistic regression method was used for describing association between dependent variable and independent variables to categorical data. There are 827 respondents consist of 52% CHD patient and 48% non CHD patient. The goal of this research are to investigate risk factor that influences CHD by logistic regression method, also to determine result of classification it. The result of logistic regression method shows that CHD status are influenced by hypercholesterol, diabetes, body mass index (BMI) and age with total misclassification rate is about 32,8%. Keywords : logistic regression, coronary heart disease, misclassification ABSTRAK Penyakit jantung koroner (PJK) adalah suatu kelainan yang disebabkan oleh penyempitan atau penghambatan pembuluh arteri. PJK dipengaruhi oleh beberapa faktor di antaranya hipertensi, hiperkolesterol, diabetes mellitus, merokok, obesitas, kurang olah raga, riwayat keluarga, stress, umur, dan bahkan jenis kelamin. Metode regresi logistik merupakan metode yang dapat digunakan untuk mengungkapakan asosiasi antara peubah respon dan peubah penjelas untuk data-data kategorik. Penelitian ini menggunakan 827 responden terdiri atas 52% penderita PJK dan 48% bukan penderita PJK. Tujuan penelitian ini yaitu, untuk menelusuri faktor risiko yang mempengaruhi PJK dengan menggunakan metode regresi logistik, serta mementukan hasil klasifikasinya. Hasil metode regresi logistik menunjukkan bahwa faktor yang mempengaruhi PJK adalah hiperkolesterol, diabetes, Indeks Massa Tubuh (IMT) dan umur dengan total kesalahan klasifikasi sebesar 32,8%. Kata Kunci : regresi logistik, penyakit jantung koroner, kesalahan klasifikasi 33
Badan Kesehatan Dunia (WHO), mencatat lebih dari 7 juta orang meninggal akibat penyakit jantung koroner di seluruh dunia pada tahun 22. Angka ini diperkirakan akan meningkat hingga juta orang pada tahun 22. Badan Kesehatan Dunia memperkirakan bahwa penyakit jantung koroner dan stroke pada tahun 22 akan menjadi penyebab terbanyak kasus kematian di seluruh dunia, seiring dengan perubahan pola hidup masyarakat (Fitriani 27). Pada tahun 2 kasus penyakit jantung koroner di Rumah Sakit Medistra sebanyak 73 kasus, tahun 2 terdapat 58 kasus, sedangkan tahun 22 jumlah kasus PJK sebanyak 23 kasus. Selanjutnya, data penyakit jantung koroner di Rumah Sakit Dr. Wahidin Sudirohusodo tahun 24 sebanyak 336 kasus, tahun 25 sebanyak 3 kasus dan tahun 26 sebanyak 332 kasus (Data morbiditas rekam medik rawat inap dalam Fitriani (27). Menurut Palilati (23), berbagai faktor dapat menjadi penyebab penyakit jantung koroner di antaranya hipertensi, hiperkolesterol, diabetes mellitus, merokok, obesitas, kurang olah raga, riwayat keluarga, stres, umur dan bahkan jenis kelamin.permasalahan yang kadang dihadapi para peneliti dalam bidang kesehatan maupun dalam bidang penelitian lain yaitu bagaimana seorang peneliti bisa mengungkapkan keterkaitan atau hubungan antara dua kelompok peubah, yaitu peubah respon dengan sekelompok peubah penjelas termasuk untuk data-data kategorik. Penerapan metode analisis statistika banyak digunakan dalam penelitian berbagai disiplin ilmu seperti pertanian, sosial, dan kesehatan/kedokteran. Regresi logistik adalah salah satu dari metode analisis statistika yang ada. Penelitian ini bertujuan untuk menelusuri faktor risiko yang secara nyata mempengaruhi PJK dengan menggunakan metode regresi logistik serta menentukan hasil klasifikasi metode tersebut. MATERI DAN METODE Data yang digunakan dalam penelitian ini adalah data sekunder dari hasil penelitian yang dilakukan di Rumah Sakit Umum Dr. Wahidin Sudirohusodo Makassar tahun 24-27 oleh Kamar (24) dan Fitriani (27) terhadap pasien yang dirawat di rumah sakit tersebut yang datang berobat ke poliklinik penyakit dalam yang dinyatakan menderita penyakit jantung koroner (PJK) dan yang tidak menderita PJK dengan jumlah pasien sebanyak 827 orang. Peubah yang diamati adalah pasien yang menderita penyakit jantung koroner (y=) dan yang tidak (y=) menurut kartu rekam medik pasien. Peubah-peubah penjelasnya adalah: 332
Peubah penjelas Hipertensi Hiperkolesterol Diabetes Kate gori Ya Tidak Ya Tidak Ya Tidak D D 2 D 3 D 4 Pembanding IMT (Indeks Massa Kurus Tubuh) Normal Tabel Pengkodean peubah penjelas kategorik 333
Gemuk Umur < 4 4-49 5-59 6-69 > 69 Jenis kelamin Laki-laki Perempua n Keterangan : D : Peubah dummy : Sebagai pembanding Metode Regresi Logistik Analisis regresi logistik adalah analisis yang digunakan untuk melihat hubungan antara peubah respon berupa data kualitatif dengan peubah-peubah penjelas yang berupa data kualitatif maupun data kuantitatif. Peubah respon dalam regresi logistik dapat dalam bentuk dikotom (biner) maupun polikotom (ordinal atau nominal). Fungsi regresi logistik antara π(x) dan x adalah : g( ) exp x) x... () exp g( x Menurut Hosmer & Lemeshow (2), hasil pengamatan yang memiliki p peubah penjelas yang ditunjukkan oleh vektor x = (X,X 2,,X p ) yang berpasangan dengan peubah respon Y yang bernilai dan, di mana y= menyatakan bahwa respon memiliki kriteria yang ditentukan dan y= tidak memiliki kriteria yang ditentukan merupakan regresi logistik peubah respon biner. Fungsi regresi di atas berbentuk curvilinear sehingga untuk membuatnya menjadi fungsi linier dilakukan transformasi logit sebagai berikut (Agresti 99) : ( x) logit[ ( x)] ln g(x) ( x) dimana g(x) X 2X2... pxp.. (2) merupakan logit (Hosmer & Lemeshow 2). 332
Pengujian kesesuaian model dilakukan secara simultan dengan menggunakan statistik uji-g dan secara parsial menggunakan statistik uji Wald. Pemilihan peubah penjelas menggunakan metode backward elimination, diawali dengan semua peubah dimasukkan ke dalam model kemudian peubah akan diuji satu persatu. Jika ditemukan peubah yang tidak nyata pada nilai α yang ditentukan maka peubah tersebut dikeluarkan dari model dan jika nyata maka akan tetap berada dalam model (Gonzales 23). Menurut Hosmer dan Lemeshow (2), rasio odds dilambangkan sebagai ψ=exp(β i ) dan diinterpretasikan sebagai kecenderungan y= pada x= sebesar ψ kali dibandingkan pada x=. Selang kepercayaan (-α)% bagi rasio odds adalah : exp[ ˆ i Z / 2ŜE(ˆ i )]...(3) sedangkan selang kepercayaan (-α)% bagi π(x) yaitu : dimana : e e ĝ(x) Z / 2 ĝ(x) Z / 2 ŜE[ĝ(x)] ŜE[ĝ(x)]...(4) Vâr ĝ(x) ŜE ĝ(x)... (5) p 2 dan Vâr[ĝ(x)] x Vâr(ˆ ) 2x x Côv(ˆ, ˆ j j j k j k )... (6) j j k j p p Ketepatan dan Kesalahan Klasifikasi Menurut Hosmer dan Lemeshow (2) salah satu ukuran kebaikan model dalam regresi logistik adalah jika memiliki peluang salah klasifikasi yang minimal. Ketepatan dan kesalahan klasifikasi dari model dapat diketahui dengan mengunakan tabel klasifikasi (classification table). Tabel klasifikasi untuk peubah respon dikotom terdiri atas dua kolom nilai dugaan dan dua baris nilai 33 amatan. Untuk memperoleh ketepatan klasifikasi (correct classification) terhadap amatan harus menentukan nilai cutpoint (c) dan dibandingkan dengan peluang dugaan π(x). Jika π(x) lebih besar atau sama dengan c maka nilai dugaan termasuk pada respon y = dan selain itu y =. Ketepatan klasifikasi (correct classification) terbagi atas dua yaitu specificity dan sensitivity. Specificity atau
ketepatan klasifikasi dalam menduga kejadian bahwa respon tidak memiliki kriteria yang ditentukan (y=) dinyatakan sebagai persentase dari dugaan terkoreksi atau nilai dugaan yang sama dengan nilai amatan pada kategori nilai amatan y=. Pengertian yang sama juga berlaku untuk mengevaluasi ketepatan klasifikasi dalam menduga kejadian bahwa respon memiliki kriteria yang ditentukan (y=) atau disebut juga sensitivity, sedangkan total correct classification yaitu ketepatan klasifikasi dalam menduga kejadian secara keseluruhan. Selain ketepatan klasifikasi dapat pula diketahui besarnya kesalahan klasifikasi (misclassification rate). Kesalahan klasifikasi dalam menduga kejadian respon terdiri atas kesalahan positif dan kesalahan negatif. Kesalahan positif dinyatakan sebagai persentase besarnya kesalahan ketika respon diduga memiliki kriteria yang ditentukan (y=) tapi amatan sebenarnya bernilai y= dan sebaliknya kesalahan negatif dinyatakan sebagai persentase besarnya kesalahan ketika respon diduga tidak memiliki kriteria yang ditentukan (y=) namun amatan sebenarnya bernilai y=. Total misclassification rate diartikan sebagai kesalahan klasifikasi dalam menduga kejadian secara keseluruhan. HASIL DAN PEMBAHASAN Hasil metode regresi logistik Model yang dihasilkan dengan melibatkan semua peubah penjelas dapat dilihat pada Tabel 2. Pengujian secara simultan menunjukkan bahwa model nyata pada α = 5%. Hal ini dapat dilihat dari statistik-g sebesar 47,4 dengan nilai-p sebesar,. Berdasarkan uji Wald terlihat bahwa peubah hipertensi, IMT(kurus) dan jenis kelamin tidak nyata pada model sehingga akan dilakukan pereduksian terhadap peubah-peubah tersebut. Pereduksian model dilakukan dengan metode backward elimination. Berdasarkan Tabel 2, diperoleh tiga tahap pereduksian yaitu tahap pertama dengan menghilangkan IMT(kurus) yang mempunyai nilai-p terbesar, tahap kedua dengan menghilangkan peubah hipertensi dan tahap ketiga dengan menghilangkan peubah jenis kelamin. Tahap ketiga adalah tahap terakhir yang merupakan model terbaik yang diperoleh dari hasil pereduksian. Tabel 2 Hasil analisis regresi logistik model penuh Peubah Penjelas β i SE Wald Ni Rasio SK 95% untuk lai-p Odds Rasio Odds Intersep -2,9,33-6,336,, - - 332
Hipertensi -,63,59 -,25,36,85,623,6 Hiperkolesterol,38,59 8,679,* 3,975 2,9 5,43 Diabetes,46,7 2,696,7*,586,34 2,26 IMT(Gemuk),78,68 4,643,* 2,82,57 3,33 IMT(Kurus) -,4,64 -,23,982,986,32 3,29 Umur(>69),,387 2,845,4* 3,7,49 6,46 Umur(6-69),953,325 2,932,3* 2,593,37 4,95 Umur(5-59),995,35 3,59,2* 2,73,457 5,6 Umur(4-49),897,322 2,786,5* 2,453,35 4,6 Jenis Kelamin -,222,54 -,442,5,8,593,84 Statistik-G = 47,4 * Nyata pada α = 5% Nilai-p =, Tabel 3 Hasil analisis regresi logistik model Backward Elimination (tahap III) Peubah Nilaip Odds Rasio Odds Rasio SK 95% untuk β i SE Wald Penjelas Intersep -2,23,323-6,82,, - - Hiperkolesterol,392,58 8,755,* 4,24 2,949 5,49 Diabetes,435,7 2,559,*,544,6 2,56 IMT,78,65,* 2,83,58 3,7 (Gemuk) 4,733 Umur,23,382,7* 2,782,35 5,885 (>69) 2,678 Umur,86,39,7* 2,364,265 4,48 (6-69) 2,696 332
Umur,929,32,3* 2,53,373 4,666 (5-59) 2,978 Umur,839,39,9* 2,34,238 4,327 (4-49) 2,63 Statistik-G = 44,42 * Nyata pada α = 5% Nilai-p =, Dari hasil model reduksi (Tabel 3) diperoleh nilai statistik-g sebesar 44,42 dengan nilai-p sebesar, yang berarti secara simultan menunjukkan bahwa model nyata pada α = 5%. Hasil uji Wald juga menunjukkan bahwa peubah PJK dipengaruhi oleh faktor hiperkolesterol, diabetes, IMT(gemuk), Umur(>69), Umur(6-69), Umur(5-59) dan Umur(4-49) pada α = 5%. Berdasarkan nilai selang kepercayaan 95% bagi rasio odds menunjukkan bahwa penderita hiperkolesterol dibandingkan yang tidak hiperkolesterol berisiko paling rendah 2,949 kali dan paling tinggi 5,49 kali untuk menderita PJK. Penderita diabetes berisiko antara,6 kali sampai 2,56 kali untuk menderita PJK dibandingkan yang bukan penderita diabetes. Untuk pasien yang tergolong gemuk, risiko terkena PJK dibandingkan yang tidak gemuk sebesar,58 kali sampai 3,7 kali. Pasien yang berumur >69 tahun berisiko antara,35 kali sampai 5,885 kali untuk terkena PJK, sedangkan yang berumur 6-69 tahun berisiko antara,265 kali sampai 4,48 kali. Untuk umur 5-59 tahun berisiko paling rendah,373 kali dan paling tinggi 4,666 kali, dan pasien yang berumur 4-49 tahun berisiko antara,238 kali sampai 4,327 kali untuk menderita PJK. Semua kategori umur dibandingkan dengan umur <4 tahun. Untuk menduga peluang seseorang akan terkena PJK diperlukan matriks kovarian dugaan. Setelah dianalisis dengan menggunakan persamaan (2), persamaan (4), persamaan (5) dan persamaan (6) maka diperoleh nilai selang kepercayaan (SK) 95% bagi π(x). SK tersebut menyatakan nilai dugaan peluang terkena PJK (untuk 5 kombinasi kategori) berdasarkan peubah penjelas yang nyata (Tabel 4). Berdasarkan kasus yang terjadi di RSU Dr. Wahidin Sudirohusodo Makassar dapat diduga bahwa seseorang yang menderita hiperkolesterol, diabetes, berbadan gemuk dan berusia di atas 69 tahun, berpeluang antara 69,64% sampai 88,35% untuk menderita PJK. Sedangkan yang tidak menderita hiperkolesterol dan tidak diabetes dengan berat badan yang tergolong kurus atau normal dan mempunyai umur di bawah 4 tahun akan berpeluang sangat kecil untuk menderita PJK yaitu antara 5,54% sampai 7,22%. 333
Untuk kombinasi kategori yang lain dapat dilihat pada Tabel 4. Tabel 4 Dugaan peluang terkena PJK berdasarkan peubah penjelas yang nyata No Hiper kolesterol Diabetes IMT Umur ˆ (x) SK 95% bagi π(x) Bawah Ya Tidak Gemuk 6-69,6964,683,7646 2 Ya Tidak Tidak gemuk <4,377,873,465 3 Ya Ya Tidak gemuk <4,47,2559,5782 4 Ya Ya Tidak gemuk 4-49,637,4987,774 5 Ya Ya Gemuk >69,866,6964,8835 6 Ya Tidak Gemuk <4,4925,3536,6325 7 Ya Ya Gemuk 6-69,7799,74,843 8 Ya Tidak Tidak gemuk >69,5528,434,6843 9 Tidak Tidak Tidak gemuk 4-49,236,428,288 Tidak Ya Gemuk 4-49,463,355,5747 Tidak Ya Tidak gemuk 6-69,2874,275,3833 2 Tidak Tidak Tidak gemuk 6-69,27,464,2843 3 Tidak Ya Tidak gemuk <4,458,84,2474 4 Tidak Ya Gemuk >69,59,362,6544 5 Tidak Tidak Tidak gemuk <4,995,554,722 Atas Tabel 5 Klasifikasi metode regresi logistik Dugaan (%) Correct Amatan (PJK) Total Ya Tidak classification Ya 32 9 43 74,7 Tidak 62 235 397 59,2 Logistik Total 483 344 827 67,2 (%) Misclassification rate 33,5 3,7 32,8 Tabel 5 menunjukkan bahwa dengan menggunakan nilai cutpoint sebesar,5 maka berdasarkan metode regresi logistik diperoleh nilai sensitivity sebesar 74,7% dan nilai specificity sebesar 59,2% dengan nilai kesalahan positif dan kesalahan 332
negatif masing-masing sebesar 33,5% dan 3,7%. Sedangkan nilai total correct classification adalah sebesar 67,2%. Nilai total misclassification rate untuk metode regresi logistik sebesar 32,8%. SIMPULAN Hasil yang diperoleh dari metode regresi logistik menunjukkan bahwa faktor yang mempengaruhi seseorang menderita PJK adalah hiperkolesterol, diabetes, IMT dan umur. Berdasarkan nilai rasio odds, diketahui bahwa penderita hiperkolesterol lebih berisiko terkena PJK dibandingkan yang tidak hiperkolesterol, begitu pula pada penderita diabetes dibandingkan yang tidak diabetes. Pasien yang mempunyai IMT gemuk lebih berisiko terkena PJK dibandingkan yang tidak gemuk, dan pasien yang umurnya >=4 tahun juga lebih berisiko terkena PJK dibandingkan yang berumur <4. Berdasarkan hasil klasifikasi metode regresi logistik, diperoleh nilai sensitivity sebesar 74,7% dan nilai specificity sebesar 59,2%. Besarnya nilai misclassification rate adalah sebesar 32,8%. 332
DAFTAR PUSTAKA Agresti A. 99. Categorical Data Analysis. New York: John Wiley & Sons. Bustan MN. 997. Epidemologi Penyakit Tidak Menular. Jakarta: Rineka Cipta. Fitriani. 27. Analisis Faktor Risiko Kejadian Penyakit Jantung Koroner di Rumah Sakit Dr.Wahidin Sudirohusodo Makassar. [Tesis]. Makassar: Program Pascasarjana, UNHAS. Gonzales MP. 23. A Model for Profiling Radio Station Listeners using Logistic Regression, CART and CHAID for a given data set. University of the Philippines. Hosmer DW, Lemeshow S. 2. Applied Logistic Regression. New York: John Wiley & Sons. Kamar N. 24. Beberapa Faktor yang Berhubungan dengan Penyakit Jantung Koroner pada Pasien Rawat Inap di RSUP Dr. Wahidin Sudirohusodo Makassar. [Skripsi]. Makassar: Program Sarjana, UNHAS. Palilati H. 23. Beberapa Faktor Risiko Penyakit Jantung Koroner pada Pasien Rawat Inap di RSUP Dr. Wahidin Sudirohusodo Makassar. [Skripsi]. Makassar: Program Sarjana, UNHAS. * Staf Pengajar Jurusan Matematika, Fakultas Sains dan Teknik-Undana 33