ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 5, Nomor 2, Tahu 2016, Halama 299-309 Olie di: http://ejoural-s1.udip.ac.id/idex.php/gaussia PERBANDINGAN KLASIFIKASI PENYAKIT HIPERTENSI MENGGUNAKAN REGRESI LOGISTIK BINER DAN ALGORITMA C4.5 (Studi Kasus UPT Puskesmas Pojog I, Guugkidul) Wella Rumaeda 1, Yuciaa Wiladari 2, Diah Safitri 3 1 Mahasiswa Jurusa Statistika FSM Uiversitas Dipoegoro 2,3 Staff Pegajar Jurusa Statistika FSM Uiversitas Dipoegoro rumaedawella@yahoo.com ABSTRACT Hypertesio is a major problem i the world today. I Idoesia prevalece of hypertesio is still high. There are two types of hypertesio based o cause, primary ad secodary hypertesio. I this thesis focused o the classificatio of types of hypertesio based o the cause usig biary logistic regressio ad C4.5 algorithms with case studies i UPT Puskesmas Pojog I, Guugkidul of October-November 2015. Biary logistic regressio is a method that describes the relatioship betwee the respose variable ad several predictor variables with the variable equal to 1 to declare the existece of a characteristic ad the value 0 to declare the absece of a characteristic. C4.5 algorithm is oe method of classificatio of data miig is used to create a decisio tree. The predictor variables were used i this thesis are geder, age, systolic blood pressure, diastolic blood pressure, treatmet history, as well as diseases ad or other complaits. Based o this aalysis, classificatio of hypertesio by biary logistic regressio method obtaied value APER=27,4648% ad 72,5352% of accuracy, while the value obtaied usig the algorithm C4.5 APER=35,9155% ad the accuracy 64,0845 %. I two differet test proportio was foud that there were sigificat differeces of the two methods. Keywords : Types of Hypertesio, Classificatio, C4.5 Algorithm, Bier Logistic Regressio, APER 1. PENDAHULUAN 1.1 Latar Belakag Sampai saat ii, hipertesi atau peyakit darah tiggi masih mejadi masalah utama di duia, baik di egara maju maupu di egara berkembag. Meurut World Health Orgaizatio (2013), peyakit yag dijuluki the silet killer of death ii merupaka peyebab kematia omor satu di duia. Di Idoesia sediri, meurut Riset Kesehata Dasar (2013) bahwa prevelesi hipertesi di Idoesia terbilag masih cukup tiggi yaitu sebesar 25,8 %. Berdasarka data UPT Puskesmas Pojog I tahu 2015, peyakit hipertesi primer sepajag tahu 2014, berada diuruta pertama pada sepuluh besar peyakit yag bayak diderita oleh masyarakat, yaitu sebayak 3.112 jiwa. Meurut Masjoer dkk (2001), hipertesi sediri tidak meujukka gejala tertetu. Terdapat sekitar 95% kasus hipertesi yag tidak diketahui peyebabya, sedagka sisaya ditimbulka akibat adaya peyakit lai. Meurut Kemeteria Kesehata RI (2013), berdasarka peyebabya, hipertesi dibagi mejadi, yaitu hipertesi primer da hipertesi sekuder. Hipertesi primer adalah suatu kodisi dimaa terjadi tekaa darah tiggi yag tidak diketahui peyebabya secara pasti. Sedagka hipertesi sekuder merupaka suatu kodisi terjadiya tekaa darah tiggi yag peyebabya secara spesifik diketahui seperti adaya peyakit lai. Ada beberapa metode statistika yag dapat diguaka utuk megetahui faktorfaktor yag mempegaruhi jeis hipertesi, diataraya yaitu model regresi logistik bier
da algoritma C4.5. Hosmer da Lemeshow (2000) megataka bahwa model regresi logistik bier merupaka metode regresi logistik yag diguaka utuk megaalisis hubuga atara satu variabel respo da beberapa variabel prediktor, dega variabel respoya berupa data kualitatif dikotomi yaitu berilai 1 utuk meyataka keberadaa sebuah karakteristik da berilai 0 utuk meyataka ketidakberadaa sebuah karakteristik. Kusrii da Luthfi (2009) meyebutka, algoritma C4.5 adalah salah satu metode klasifikasi dari data miig yag diguaka utuk megkostruksika poho keputusa (decisio tree). Sehubuga dega peelitia ii, kedua metode tersebut diguaka karea keduaya dapat megatasi data yag bertipe kategorik. Selai itu regresi logistik bier diguaka utuk megidetifikasi dua variabel respo bertipe kategorik dalam peelitia ii variabel hipertesi primer da sekuder. Semetara algoritma C4.5 memiliki perhituga sederhaa dalam megklasifikasika jeis peryakit hipertesi da dapat megatasi data bertipe kotiu. 1.2 Tujua Peelitia Tujua dari peulisa peelitia ii adalah: 1. Meetuka faktor-faktor yag mempegaruhi terjadiya jeis peyakit hipertesi di UPT Puskesmas Pojog I 2. Medapatka permodela peyebab terjadiya jeis peyakit hipertesi megguaka metode regresi logistik bier serta megukur ketepata klasifikasiya 3. Membetuk poho klasifikasi megguaka metode Algoritma C4.5 da megukur ketepata klasifikasiya 4. Membadigka ketepata klasifikasi atara metode regresi logistik bier dega metode Algoritma C4.5. 2. TINJAUAN PUSTAKA 2.1 Hipertesi Meurut World Health Orgaizatio (2013), hipertesi merupaka suatu kodisi dimaa pembuluh darah terus-meerus megalami peigkata tekaa. Adaya peigkata tekaa pada pembuluh darah megakibatka kerja jatug utuk memompa darah semaki keras/cepat. Hipertesi juga dapat didefiisika sebagai peigkata tekaa sistolik lebih besar atau sama dega 140 mmhg da atau tekaa diastolik sama atau lebih besar 90 mmhg. Meurut Masjoer dkk (2001), berdasarka peyebabya hipertesi dibagi mejadi dua gologa, yaitu hipertesi primer adalah hipertesi yag tidak diketahui peyebabya secara pasti da hipertesi sekuder adalah hipertesi yag diketahui secara spesifik peyebabya. 2.2 Model Regresi Logistik Bier Hosmer da Lemeshow (2000) meyataka bahwa regresi logistik bier diguaka utuk mejelaska hubuga atara beberapa variabel predikor X terhadap variabel respo Y yag bersifat dikotomi atau bier. Dikotomi artiya variabel respo Y haya berilai 1 utuk keberadaa suatu karakteristik da berilai 0 utuk ketidakberadaa suatu karakteristik. Model probabilitas regresi logistik adalah: dega JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 300
2.2.1 Estimasi Parameter Meurut Agresti (1990),utuk meetuka estimasi parameter regresi logistik bier dapat diguaka metode Maximum Likelihood Estimatio (MLE) yag membutuhka turua pertama da turua kedua dari fugsi likelihood. Hosmer da Lemeshow (2000) megataka, pada dasarya fugsi maksimum likelihood megguaka estimasi ilai utuk memaksimalka fugsi log likelihoodya sebagai berikut : Hosmer da Lemeshow (2000) meyeburka, utuk medapatka ilai yag memaksimalka ilai, maka dituruka terhadap,,,..., dega hasil sama dega ol. Sehigga hail turua pertama dalam betuk matriks adalah dega: da Oleh sebab turua pertama dari fugsi log likelihood tidak berbetuk closed form, maka estimasi parameter dilakuka dega metode umerik, sehigga dibutuhka turua kedua dalam betuk matriks adalah sebagai berikut: dega: Meurut Hastie, et al. (2009), utuk medapatka estimasi parameter diguaka metode Newto Raphso dega lagkah-lagkah sebagai berikut: a. Meetuka ilai taksira awal utuk b. Meghitug da ivers dari c. Meghitug taksira baru utuk setiap d + 1 dega rumus: d. Proses iterasi berheti bila didapat hasil yag koverge, 2.2.2 Uji Rasio Likelihood Hosmer da Lemeshow (2000) megataka bahwa, uji rasio likelihood merupaka uji sigifikasi parameter secara keseluruha atau bersama-sama. Hipotesis : H 0 : β 1 = β 2 =... = β p = 0 H 1 : palig sedikit salah satu dari β j 0 dega j = 1,2,...,p Statistik uji : dega: l likelihood tapa variabel bebas l likelihood dega variabel bebas JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 301
Kriteria uji : H 0 ditolak jika ilai G > χ 2 (α,p) 2.2.3 Uji Wald Meurut Hosmer da Lemeshow (2000), uji Wald merupaka uji sigifikasi parameter utuk masig-masig variabel prediktor, yag diperoleh dega cara megkuadratka rasio estimasi parameter dega estimasi stadar errorya. Hipotesis : H 0 : β j = 0 dega j= 1, 2,..., p H 1 : β j 0 dega j= 1, 2,..., p Statistik uji : W j ˆ j ˆ SE j Kriteria uji : H 0 ditolak jika W j > χ 2 (α,1) 2 2.2.4 Uji Goodess of Fit Hosmer da Lemeshow (2000), megataka bahwa uji goodess of fit merupaka uji yag dilakuka utuk megetahui apakah ada perbedaa atara prediksi da hasil observasi (model sesuai atau tidak). Statistik uji utuk uji goodess of fit adalah sebagai berikut : Hipotesis : H 0 : Model sesuai (tidak ada perbedaa atara hasil observasi dega hasil prediksi) H 1 : Model tidak sesuai (ada perbedaa atara hasil observasi dega hasil prediksi) Statistik uji : dimaa: da g = bayakya grup = bayakya observasi pada grup ke-b Kriteria uji: H 0 ditolak jika 2.3 Algoritma C4.5 Meurut Kusrii da Luthfi (2009), algoritma C4.5 merupaka salah satu algoritma yag dapat dipakai dalam pembetuka poho keputusa (decisio tree). Algoritma C4.5 diperkealka oleh Quila (1993) sebagai versi perbaika dari Algoritma Iterative Dichotomiser 3 (ID3). Meurut Witte et al., (2011), algoritma C4.5 memiliki keuggula dibadigka dega ID3 yaitu mampu megatasi ilai yag hilag (missig value), megatasi data bertipe kotiu, da melakuka pemagkasa poho (pruig trees). Meurut Quila (1993), algoritma C4.5 megguaka kriteria gai dalam meetuka pemecah ode pada poho keputusa. Rokach da Maimo (2008) meyebutka, iformatio gai atau yag bisa disebut dega gai ifo adalah kriteria pemisaha yag megguaka pegukura etropy. Etropy adalah rataa jumlah iformasi yag dibutuhka utuk megidetifikasika kelas pada kasus ke dalam himpua T. Nilai dari setiap peghituga etropy memiliki satua bits atau biary digits. Etropy diguaka sebagai suatu parameter utuk megukur heterogeitas (keberagama) dari suatu kumpula sampel data. Jika kumpula sampel data semaki heteroge, maka ilai etropy-ya semaki besar. Meurut Ruggieri (2002), iformatio gai atribut a dari suatu himpua T dapat dihitug sebagai berikut. Jika sebuah atribut a adalah diskret dari suatu himpua kasus T da T 1,, T s adalah sub-himpua dari T yag terdiri dari kasus-kasus yag ilaiya JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 302
sudah diketahui maka utuk medapatka iformatio gai dari atribut a atau Gai(a) dibutuhka etropy keseluruha kelas atau ifo(t) da etropy masig-masig atribut pada himpua T atau ifo(ti). Rumus dari Gai(a) adalah sebagai berikut: dimaa ilai etropy keseluruha kelas: sedagka ilai etropy utuk setiap atribut i: keteraga: = Bayakya kasus dalam himpua T = Bayakya kasus dalam sub-himpua = Bayak dari kasus-kasus dalam himpua T yag memiliki kelas C j Jika a adalah atribut kotiu maka kasus dalam T dega ilai atribut tersebut diurutka dari yag terkecil sampai terbesar. Dimisalka ilai hasil peguruta adalah w 1,..., w m, da ilai v = dimaa i [1, m-1] da pemisaha yag terjadi utuk atribut bertipe kotiu adalah: Utuk setiap ilai v, gai ifo dari gai dihitug dega mempertimbagka prosedur pemisaha di atas. Iformatio gai utuk a didefiisika sebagai ilai maksimum dari semua gai da ilai v merupaka sebagai ilai ambag batas utuk atribut kotiu. 2.4 Ketepata Klasifikasi Meurut Johso da Wicher (2007), terjadiya kesalaha klasifikasi suatu observasi merupaka hal yag sagat mugki terjadi. Hal ii dikareaka terkadag terdapat beberapa observasi yag tidak berasal dari kelompok tertetu tetapi dimasukka ke dalam kelompok tersebut. Perhituga ilai Apparet Error Rates (APER) dapat dilakuka dega megguaka matriks kofusi sebagai berikut: Tabel 1. Matrik Kofusi Kelompok Prediksi 1 2 1 11 12 1 Kelompok Aktual Jumlah Observasi 2 21 22 2 Maka ilai APER dapat dihitug dega rumus: APER 11 12 12 21 21 22 JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 303
Meurut Sugiarto (2000), utuk medapatka model terbaik diguaka uji beda dua proporsi dega lagkah sebagai berikut: Hipotesis H 0 : PR 1 = PR 2 (tidak ada perbedaa sigifika dari kedua metode) H 1 : PR 1 PR 2 (ada perbedaa sigifika dari kedua metode) Taraf Sigifikasi: α = 5% Statitik Uji: dega : PR 1 = Proporsi metode regresi logistik bier PR 2 = Proporsi metode algoritma C4.5 PR gab = Proporsi gabuga yaitu 1 = ukura sampel pada metode regresi logistik bier 2 = ukura sampel pada metode algoritma C4.5 Kriteria Uji : H 0 ditolak jika Z hitug > Z α/2 atau Z hitug < - Z α/2 Jika H 0 diterima, maka tidak ada perbedaa yag sigifika atara sistem klasifikasi metode regresi logistik bier dega metode algoritma C4.5. Sistem klasifikasi terbaik adalah sistem klasifikasi yag mempuyai ilai akurasi palig tiggi. 3. METODOLOGI PENELITIAN Sumber data yag diguaka dalam peelitia ii adalah data sekuder yaitu data pasie hipertesi di UPT Puskesmas Pojog 1, Guugkidul selama bula Oktober sampai November 2015. Jumlah populasi sebayak 3.112 jiwa, da jumlah sampel sebayak 354 jiwa. Variabel yag diguaka dalam peelitia ii adalah jeis hipertesi (primer da sekuder) sebagai variabel respo (Y),sedagka variabel prediktor (X) adalah jeis kelami, umur, tekaa darah sistolik, tekaa darah diastolik, riwayat berobat (ruti da tidak tetu), da peyakit lai (ada da tidak ada). 4. HASIL DAN PEMBAHASAN 4.1 Peyakit Hipertesi di UPT Puskesmas Pojog I Bula Oktober-November 2015 Berdasarka data UPT Puskesmas Pojog I, Guugkidul bula Oktober- November 2015 utuk peyakit hipertesi diperoleh iformasi sebagai berikut: Tabel 2. Data Pasie Hipertesi Jeis Hipertesi Jumlah Persetase Primer 266 75% Sekuder 88 25% Total 354 100% Berdasarka Tabel 2, dapat dilihat bahwa jumlah pasie yag mederita hipertesi primer lebih bayak dibadigka dega pasie yag mederita hipertesi sekuder. Jumlah pasie yag mederita hipertesi primer adalah sebayak 266 jiwa atau 75% dari JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 304
keseluruha, sedagka sisaya 25% atau 88 jiwa merupaka pasie yag mederita hipertesi sekuder. 4.2 Pegklasifikasia Regresi Logistik Bier Utuk membagi data traiig da testig dilakuka beberapa kali percobaa dega melihat hasil akurasi yag palig tiggi. Pada peelitia ii, data dipartisi 60% utuk data traiig atau sebayak 212 data da 40% data testig atau sebayak 142 data. Dari hasil pegolaha data traiig diperoleh model regresi logistik sebagai berikut: Model awal : dega: -2,404 0,877(X 11 ) + 0,021(X 2 ) + 0,025(X 3 ) 0,013(X 4 ) + 0,433(X 51 ) 0,749(X 61 ) Setelah dilakuka uji sigifikasi parameter, ada tiga variabel yag tidak mempegaruhi model yaitu variabel umur, tekaa darah diastolik, da riwayat berobat, sehigga perlu dilakuka uji sigifikasi parameter yag kedua utuk meguji variabel jeis kelami, tekaa darah sistolik, da peyakit lai. 4.2.1 Uji Rasio Likelihood Tabel 3. Uji Rasio Likelihood Uji ke- G Nilai Tabel Chi-Square Keputusa 1 20,911 = 12,592 H 0 ditolak 2 15,186 = 7,815 H 0 ditolak Berdasarka Tabel 3, diketahui bahwa pada taraf sigifikasi 5%, variabel prediktor secara bersama-sama mempegaruhi model. 4.2.2 Uji Wald Tabel 4. Uji Wald Pertama Variabel Wald Keputusa X 11 5,637 3,841 H 0 ditolak X 2 2,558 3,841 H 0 diterima X 3 5,497 3,841 H 0 ditolak X 4 0,676 3,841 H 0 diterima X 51 1,426 3,841 H 0 diterima X 61 4,492 3,841 H 0 ditolak Tabel 5. Uji Wald Kedua Variabel Wald Keputusa X 11 4,525 3,841 H 0 ditolak X 3 5,834 3,841 H 0 ditolak X 61 3,925 3,841 H 0 ditolak Berdasarka Tabel 4 da Tabel 5, dapat dilihat bahwa pada taraf sigifikasi 5%, variabel prediktor yag sigifika mempegaruhi model adalah X 11 (jeis kelami), X 3 JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 305
(tekaa darah sistolik), da X 61 (peyakit lai). Sedagka variabel X 2 (umur), X 4 (tekaa darah diastolik), da X 51 (riwayat berobat) tidak sigifika mempegaruhi model. 4.2.3 Uji Goodess of Fit Berdasarka uji goodess of fit diperoleh hasil bahwa pada taraf sigifikasi 5%, H 0 diterima karea ilai. Jadi model regresi logistik bier yag terbetuk sesuai. 4.2.4 Model Akhir Setelah dilakuka uji sigifikasi terhadap model baik secara keseluruha maupu idividu, diperoleh model akhir sebagai berikut: 4.2.5 Ketepata Klasifikasi Pada peyusua tabel klasifikasi, maka perlu dihitug probabilitas dari data testig, sehigga didapatka matriks kofusi sebagai berikut: Tabel 6. Hasil Ketepata Klasifikasi Regresi Logistik Bier Prediksi Observasi Sekuder Primer Sekuder 1 0 Primer 39 102 Berdasarka Tabel 6, dapat diketahui bahwa pada pegklasifikasia jeis hipertesi di UPT Puskesmas Pojog I, Guugkidul didapatka ilai APER sebesar 27,4648% dega ketepata klasifikasi sebesar 72,5352%. 4.3 Pegklasifikasia Algoritma C4.5 4.3.1 Pembetuka Poho Keputusa Algoritma C4.5 Pembetuka poho keputusa meghasilka sebayak 13 simpul, yag terdiri dari satu simpul akar (tekaa darah sistolik), 5 simpul keputusa, da 7 simpul dau. Berikut ii adalah hasil perhituga mecari ilai etropy da iformatio gai dari semua atribut utuk meetuka simpul akar: Tabel 7. Nilai Iformatio Gai utuk Simpul Akar No Atribut Gai (dalam bits) 1 Jeis Kelami 0,0134 2 Sistolik 0,07957 3 Diastolik 0,00569 4 Riwayat Berobat 0,000671 5 Peyakit Lai 0,010468 6 Umur 0,046731 JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 306
Berdasarka Tabel 7, dapat diketahui bahwa dalam peelitia ii atribut tekaa darah sistolik terpilih sebagai pemilah pada simpul akar karea memiliki ilai iformatio gai terbesar diatara atribut laiya. Gambar 1. Poho Klasifikasi Algoritma C4.5 Berdasarka poho keputusa pada Gambar 1, bayakya keseluruha simpul yag terbetuk adalah 13 simpul, yag terdiri dari satu simpul akar, 5 simpul keputusa, da 7 simpul dau. Sedagka variabel yag berpegaruh adalah tekaa darah sistolik, riwayat berobat, peyakit lai, tekaa darah diastolik, da jeis kelami. 4.2.2 Ketepata Klasifikasi Berikut matriks kofusi pada perhituga ketepata klasifikasi algoritma C4.5 : Tabel 8. Ketepata Klasifikasi Algoritma C4.5 Prediksi Observasi Sekuder Primer Sekuder 3 37 Primer 14 88 Berdasarka Tabel 8, dapat diketahui bahwa pada pegklasifikasia jeis hipertesi di UPT Puskesmas Pojog I, Guugkidul didapatka ilai APER sebesar 35,9155% dega ketepata klasifikasi sebesar 64,0845%. 4.4 Perbadiga Ketepata Klasifikasi Ketepata klasifikasi megguaka regresi logistik bier da algoritma C4.5 sebagai berikut: JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 307
Tabel 9. Perbadiga Ketepata Klasifikasi Regresi Logistik Bier Algoritma C4.5 APER 27,4648% 35,9155% 1-APER 72,5352% 64,0845% Berdasarka Tabel 9, diperoleh ilai ketepata klasifikasi megguaka metode regresi logistik bier sebesar 72,5352% dega ilai laju error sebesar 27,4648%. Sedagka ilai ketepata klasifikasi megguaka metode algoritma C4.5 adalah sebesar 64,0845% dega ilai laju error 35,9155%. Utuk medapatka metode terbaik, maka dilakuka evaluasi ketepata klasifikasi dega melakuka uji beda dua proporsi sebagai berikut : Hipotesis: H 0 : PR 1 = PR 2 (tidak ada perbedaa sigifika dari kedua metode) H 1 : PR 1 PR 2 (ada perbedaa sigifika dari kedua metode) Taraf Sigifikasi: α = 5% Statitik Uji: Kriteria Uji: H 0 ditolak jika Z hitug < -Z α/2 atau Z hitug > Z α/2 Keputusa: Karea Z hitug = 27,71682 > Z α/2 = 1,960 maka H 0 ditolak. Kesimpula: Jadi pada taraf sigifikasi 5% disimpulka bahwa ada perbedaa sigifika dari kedua metode. Dega kata lai, metode regresi logistik bier lebih baik dalam megklasifikasika jeis peyakit hipertesi di UPT Puskesmas Pojog I, Guugkidul dibadigka dega metode algoritma C4.5. 5. KESIMPULAN Berdasarka aalisis da pembahasa yag telah diuraika di atas, maka dapat diambil kesimpula sebagai berikut: 1. Pada regresi logistik bier, faktor-faktor yag mempegaruhi terjadiya jeis peyakit hipertesi adalah jeis kelami, tekaa darah sistolik, serta peyakit lai. 2. Poho keputusa yag terbetuk megguaka algoritma C4.5 meghasilka poho sebayak 13 simpul, yag terdiri dari sebuah simpul akar yaitu atribut tekaa darah sistolik, 5 simpul keputusa, serta 7 simpul dau. Faktor-faktor yag mempegaruhi terjadiya jeis peyakit hipertesi adalah tekaa darah sistolik, riwayat berobat, peyakit lai, tekaa darah diastolik, da jeis kelami, sedagka faktor umur tidak berpegaruh. 3. Berdasarka hasil aalisis regresi logistik bier diperoleh ilai APER=27,4648% da ketepata klasifikasi sebesar 72,5352%, sedagka pada algoritma C4.5 diperoleh ilai APER=35,9155% dega ketepata klasifikasi sebesar 64,0845%. Dari uji beda proporsi dihasilka bahwa ada perbedaa sigifika atara kedua JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 308
metode, sehigga dapat dikataka bahwa regresi logistik bier lebih baik dibadigka algoritma C4.5 dalam megklasifikasika jeis peyakit hipertesi di UPT Puskesmas Pojog I, Guugkidul. DAFTAR PUSTAKA Agresti, A. 1990. Categorical Data Aalysis.New York: Joh Wiley & Sos. Hastie, T.,Tibshirai, R. Ad Friedma, J. H. 2009. The Elemets of Statistical Learig: Data Miig. Iferece ad Predictio Secod Editio. New York: Spriger Sciece Bussiess Media. Hosmer, D. W. ad Lemeshow S. 2000. Applied Logistic Regressio. Uited States of America: Sos Ic. Johso, R. A. ad Wicher. D. W., 2007. Applied Multivariate Statistical Aalysis. Sixth Editio. New Jersey: Pretice Hall Iteratioal, Ic. Kemeteria Kesehata RI. 2013. Pusat Data da Iformasi Kemeteria Kesehata RI Hipertesi.(https://www.google.co.id/url?sa=t&rct=j&q=&esrc=s&source=web&cd =1&cad=rja&uact=8&ved=0ahUKEwiu8u7m5ezJAhUCqYKHfROA8oQFggdM AA&url=http%3A%2F%2Fwww.depkes.go.id%2Fdowload.php%3Ffile%3Ddow load%2fpusdati%2fifodati%2fifodatihipertesi.pdf&usg=afqjcnhwli HieCeL1Ksg4Tr_yxZ10Ky7Cg diakses pada taggal 21 Desember 2015) Kusrii da Luthfi. 2009. Algoritma Data Miig. Yogyakarta: Adi Offset. Masjoer, A. dkk. 2001. Kapita Selekta Kedoktera Edisi Ketiga. Jakarta: Media Aesculapius Fakultas Kedoktera Uiversitas Idoesia. Quila, J. R., 1993. C4.5: Programs For Machie Learig. Sa Mateo: Morga Kaufma Publisher, Ic. Riset Kesehata Dasar. 2013. Riset Kesehata Dasar 2013. (http://labmadat. litbag.depkes.go.id/images/dowload/lapora/rkd/2013/lapora_riskesdas_2013 _fial.pdf diakses pada taggal 21 Desember 2015) Ruggieri, S., 2002. Efficiet C4.5. (http://www.di.uipi.it/~ruggieri/ Papers/ec45.pdf, diakses pada taggal 21 Desember 2015). Rokach, L. ad Maimo, O., 2008. Data Miig With Decisio Trees: Theory ad Applicatios. Sigapura: World Scietific Publishig Co. Pte. Ltd. Sugiarto, D.S. 2000. Metode Statistika. Jakarta: Gramedia Pustaka Utama. UPT Puskesmas Pojog I. 2015. Profil Kesehata UPT Puskesmas Pojog I Dias Kesehata Kabupate Guugkidul Tahu 2015 (Data tahu 2014). Yogyakarta: UPT Puskesmas Pojog I. Witte, I. H., Frak, E., Hall, M. A., 2011. DATA MINING Practical Machie Learig Tools ad Teachiques. Secod Editio. Califoria: Morga Kaufma. World Health Orgaizatio. 2013. A Global Brief of Hypertesio. (http://www. who.it/cardiovasculardiseases/publicatios/global_brief_hypertesio/e/ diakses pada taggal 21 Desember 2015) JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 309