PERBANDINGAN KLASIFIKASI PENYAKIT HIPERTENSI MENGGUNAKAN REGRESI LOGISTIK BINER DAN ALGORITMA C4.5 (Studi Kasus UPT Puskesmas Ponjong I, Gunungkidul)

dokumen-dokumen yang mirip
KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC)

TINJAUAN PUSTAKA Pengertian

BAB III METODE PENELITIAN

PENGGGUNAAN ALGORITMA GAUSS-NEWTON UNTUK MENENTUKAN SIFAT-SIFAT PENAKSIR PARAMETER DAN

9 Departemen Statistika FMIPA IPB

Kata Kunci : CHAID, IPM, regresi logistik ordinal.

BAB III METODOLOGI 3.1 Tempat dan Waktu Penelitian 3.2 Bahan dan Alat 3.3 Metode Pengumpulan Data Pembuatan plot contoh

Materi 5 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2016 Nizar Rabbi Radliya

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN. Analisis regresi menjadi salah satu bagian statistika yang paling banyak aplikasinya.

Penyelesaian: Variables Entered/Removed a. a. Dependent Variable: Tulang b. All requested variables entered.

Analisis Regresi Ordinal Untuk Mengetahui Faktor-Faktor Yang Mempengaruhi Kualitas Pelayanan Kesehatan Pada Komunitas Latino

BAB II LANDASAN TEORI. Dalam tugas akhir ini akan dibahas mengenai penaksiran besarnya

Jurnal EKSPONENSIAL Volume 8, Nomor 2, Nopember 2017 ISSN

STATISTICS. Hanung N. Prasetyo Week 11 TELKOM POLTECH/HANUNG NP

Nama : INDRI SUCI RAHMAWATI NIM : ANALISIS REGRESI SESI 01 HAL

PENGUJIAN HIPOTESIS. Atau. Pengujian hipotesis uji dua pihak:

Bab III Metoda Taguchi

Perbandingan Metode Regresi Robust Estimasi Least Trimmed Square, Estimasi Scale, dan Estimasi Method Of Moment

PENGARUH INFLASI TERHADAP KEMISKINAN DI PROPINSI JAMBI

A. Pengertian Hipotesis

Pendekatan Nilai Logaritma dan Inversnya Secara Manual

BAB III METODE PENELITIAN

Nama : INDRI SUCI RAHMAWATI NIM : ANALISIS REGRESI SESI 01 HAL

PENDUGA RASIO UNTUK RATA-RATA POPULASI MENGGUNAKAN KUARTIL VARIABEL BANTU PADA PENGAMBILAN SAMPEL ACAK SEDERHANA DAN PENGATURAN PERINGKAT MEDIAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Perbandingan Power of Test dari Uji Normalitas Metode Bayesian, Uji Shapiro-Wilk, Uji Cramer-von Mises, dan Uji Anderson-Darling

III. METODOLOGI PENELITIAN. Penelitian ini dilakukan di SMA Negeri 1 Way Jepara Kabupaten Lampung Timur

PROSIDING ISBN:

3 METODE PENELITIAN 3.1 Kerangka Pemikiran 3.2 Lokasi dan Waktu Penelitian

TUGAS ANALISIS REGRESI (HALAMAN

BAB III TAKSIRAN KOEFISIEN KORELASI POLYCHORIC DUA TAHAP. Permasalahan dalam tugas akhir ini dibatasi hanya pada penaksiran

Pertemuan Ke-11. Teknik Analisis Komparasi (t-test)_m. Jainuri, M.Pd

Pengujian Normal Multivariat T 2 Hotteling pada Faktor-Faktor yang Mempengaruhi IPM di Jawa Timur dan Jawa Barat Tahun 2007

KLASIFIKASI MUTASI JABATAN STRUKTURAL PEGAWAI NEGERI SIPIL MENGGUNAKAN METODE DECISION TREE

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB V ANALISA PEMECAHAN MASALAH

BAB III METODOLOGI PENELITIAN

III. METODOLOGI PENELITIAN. Penelitian ini dilaksanakan di MTs Muhammadiyah 1 Natar Lampung Selatan.

Pedahulua Hipotesis: asumsi atau dugaa semetara megeai sesuatu hal. Ditutut utuk dilakuka pegeceka kebearaya. Jika asumsi atau dugaa dikhususka megeai

BAB IV PENGUMPULAN DAN PENGOLAHAN DATA. Langkah Langkah Dalam Pengolahan Data

Mata Kuliah : Matematika Diskrit Program Studi : Teknik Informatika Minggu ke : 4

BAB 3 METODE PENELITIAN

BAB III METODE PENELITIAN. penelitian yaitu PT. Sinar Gorontalo Berlian Motor, Jl. H. B Yassin no 28

MODUL PRAKTIKUM Statistik Inferens (MIK 411)

REGRESI LINIER DAN KORELASI. Variabel bebas atau variabel prediktor -> variabel yang mudah didapat atau tersedia. Dapat dinyatakan

TRANSFORMASI BOX-COX PADA ANALISIS REGRESI LINIER SEDERHANA

Mahasiswa Jurusan Statistika, Institut Teknologi Sepuluh Nopember. Dosen Jurusan Statistika, Institut Teknologi Sepuluh Nopember

III. METODE PENELITIAN. Lokasi penelitian dilakukan di Provinsi Sumatera Barat yang terhitung

UKURAN PEMUSATAN DATA

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

III. METODOLOGI PENELITIAN. Penelitian ini dilakukan di SMA Negeri 1 Way Jepara Kabupaten Lampung Timur

BAB I PENDAHULUAN Latar Belakang Permasalahan

BAB III METODOLOGI PENELITIAN

III. METODOLOGI PENELITIAN. Populasi dalam penelitian ini adalah semua siswa kelas XI IPA SMA Negeri I

PENERAPAN REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA REGRESI POISSON

Probabilitas dan Statistika Teorema Bayes. Adam Hendra Brata

Ukuran Pemusatan. Pertemuan 3. Median. Quartil. 17-Mar-17. Modus

BAB IV HASIL DAN PEMBAHASAN. Sebelum melakukan deteksi dan tracking obyek dibutuhkan perangkat

Uji apakah ada perbedaan signifikan antara mean masing-masing laboratorium. Gunakan α=0.05.

BAB 2 LANDASAN TEORI. Statistika merupakan salah satu cabang penegtahuan yang paling banyak mendapatkan

BAB I PENDAHULUAN. 1.1 Latar Belakang. Universitas Sumatera Utara

IV. METODE PENELITIAN. Penelitian ini dilakukan di Kawasan Pantai Anyer, Kabupaten Serang

PENDUGAAN PARAMETER DARI DISTRIBUSI POISSON DENGAN MENGGUNAKAN METODE MAXIMUM LIKEHOOD ESTIMATION (MLE) DAN METODE BAYES

BAB III METODE PENELITIAN

IV. METODE PENELITIAN

METODE NUMERIK JURUSAN TEKNIK SIPIL FAKULTAS TEKNIK UNIVERSITAS BRAWIJAYA 7/4/2012 SUGENG2010. Copyright Dale Carnegie & Associates, Inc.

JURNAL GAUSSIAN, Volume 1, Nomor 1, Tahun 2012, Halaman Online di:

ANALISIS TABEL INPUT OUTPUT PROVINSI KEPULAUAN RIAU TAHUN Erie Sadewo

Metode Bootstrap Persentil Pada Sensor Tipe II Berdistribusi Eksponensial

Logistic Regression Analysis To Determine Factors Affecting The Grade Point Average (GPA) Of FMIPA Student Of Sam Ratulangi University Of Manado

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN Penelitian ini dilakukan di kelas X SMA Muhammadiyah 1 Pekanbaru. semester ganjil tahun ajaran 2013/2014.

IV. METODE PENELITIAN. berdasarkan tujuan penelitian (purposive) dengan pertimbangan bahwa Kota

Universitas Dian Nuswantoro Jalan Nakula 1 No 5-11, (024) , Semarang

BAB III METODE PENELITIAN

JURNAL GAUSSIAN, Volume 2, Nomor 2, April 2013, Halaman Online di:

Modul Kuliah statistika

Pengendalian Proses Menggunakan Diagram Kendali Median Absolute Deviation (MAD)

PENAKSIR BAYES UNTUK PARAMETER DISTRIBUSI EKSPONENSIAL BERDASARKAN FUNGSI KERUGIAN KUADRATIK DAN FUNGSI KERUGIAN ENTROPI

BAB 2 LANDASAN TEORI

1200 (0,535) (0,465) (1200 1).0,05 + (0,535) (0,465)

PETA KONSEP RETURN dan RISIKO PORTOFOLIO

BAB II LANDASAN TEORI. matematika secara numerik dan menggunakan alat bantu komputer, yaitu:

b. Penyajian data kelompok Contoh: Berat badan 30 orang siswa tercatat sebagai berikut:

RESPONSI 2 STK 511 (ANALISIS STATISTIKA) JUMAT, 11 SEPTEMBER 2015

IV. METODE PENELITIAN

Jurnal Gradien Vol. 11 No. 2 Juli 2015 :

BAB III PEMBAHASAN. Pada BAB III ini akan dibahas mengenai bentuk program linear fuzzy

Kompleksitas dari Algoritma-Algoritma untuk Menghitung Bilangan Fibonacci

PENAKSIRAN. Penaksiran Titik. Selang Kepercayaan untuk VARIANSI. MA2181 ANALISIS DATA Utriweni Mukhaiyar 17 Oktober 2011

III. MATERI DAN METODE PENELITIAN. Penelitian telah dilakukan pada bulan November - Desember 2013 di

PENAKSIRAN DAN PERAMALAN BIAYA D. PENAKSIRAN BIAYA JANGKA PANJANG E. PERAMALAN BIAYA

III. METODOLOGI PENELITIAN. Populasi dalam penelitian ini adalah semua siswa kelas XI MIA SMA Negeri 5

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

METODE PENELITIAN. dalam tujuh kelas dimana tingkat kemampuan belajar matematika siswa

STUDI TENTANG BEBERAPA MODIFIKASI METODE ITERASI BEBAS TURUNAN

Transkripsi:

ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 5, Nomor 2, Tahu 2016, Halama 299-309 Olie di: http://ejoural-s1.udip.ac.id/idex.php/gaussia PERBANDINGAN KLASIFIKASI PENYAKIT HIPERTENSI MENGGUNAKAN REGRESI LOGISTIK BINER DAN ALGORITMA C4.5 (Studi Kasus UPT Puskesmas Pojog I, Guugkidul) Wella Rumaeda 1, Yuciaa Wiladari 2, Diah Safitri 3 1 Mahasiswa Jurusa Statistika FSM Uiversitas Dipoegoro 2,3 Staff Pegajar Jurusa Statistika FSM Uiversitas Dipoegoro rumaedawella@yahoo.com ABSTRACT Hypertesio is a major problem i the world today. I Idoesia prevalece of hypertesio is still high. There are two types of hypertesio based o cause, primary ad secodary hypertesio. I this thesis focused o the classificatio of types of hypertesio based o the cause usig biary logistic regressio ad C4.5 algorithms with case studies i UPT Puskesmas Pojog I, Guugkidul of October-November 2015. Biary logistic regressio is a method that describes the relatioship betwee the respose variable ad several predictor variables with the variable equal to 1 to declare the existece of a characteristic ad the value 0 to declare the absece of a characteristic. C4.5 algorithm is oe method of classificatio of data miig is used to create a decisio tree. The predictor variables were used i this thesis are geder, age, systolic blood pressure, diastolic blood pressure, treatmet history, as well as diseases ad or other complaits. Based o this aalysis, classificatio of hypertesio by biary logistic regressio method obtaied value APER=27,4648% ad 72,5352% of accuracy, while the value obtaied usig the algorithm C4.5 APER=35,9155% ad the accuracy 64,0845 %. I two differet test proportio was foud that there were sigificat differeces of the two methods. Keywords : Types of Hypertesio, Classificatio, C4.5 Algorithm, Bier Logistic Regressio, APER 1. PENDAHULUAN 1.1 Latar Belakag Sampai saat ii, hipertesi atau peyakit darah tiggi masih mejadi masalah utama di duia, baik di egara maju maupu di egara berkembag. Meurut World Health Orgaizatio (2013), peyakit yag dijuluki the silet killer of death ii merupaka peyebab kematia omor satu di duia. Di Idoesia sediri, meurut Riset Kesehata Dasar (2013) bahwa prevelesi hipertesi di Idoesia terbilag masih cukup tiggi yaitu sebesar 25,8 %. Berdasarka data UPT Puskesmas Pojog I tahu 2015, peyakit hipertesi primer sepajag tahu 2014, berada diuruta pertama pada sepuluh besar peyakit yag bayak diderita oleh masyarakat, yaitu sebayak 3.112 jiwa. Meurut Masjoer dkk (2001), hipertesi sediri tidak meujukka gejala tertetu. Terdapat sekitar 95% kasus hipertesi yag tidak diketahui peyebabya, sedagka sisaya ditimbulka akibat adaya peyakit lai. Meurut Kemeteria Kesehata RI (2013), berdasarka peyebabya, hipertesi dibagi mejadi, yaitu hipertesi primer da hipertesi sekuder. Hipertesi primer adalah suatu kodisi dimaa terjadi tekaa darah tiggi yag tidak diketahui peyebabya secara pasti. Sedagka hipertesi sekuder merupaka suatu kodisi terjadiya tekaa darah tiggi yag peyebabya secara spesifik diketahui seperti adaya peyakit lai. Ada beberapa metode statistika yag dapat diguaka utuk megetahui faktorfaktor yag mempegaruhi jeis hipertesi, diataraya yaitu model regresi logistik bier

da algoritma C4.5. Hosmer da Lemeshow (2000) megataka bahwa model regresi logistik bier merupaka metode regresi logistik yag diguaka utuk megaalisis hubuga atara satu variabel respo da beberapa variabel prediktor, dega variabel respoya berupa data kualitatif dikotomi yaitu berilai 1 utuk meyataka keberadaa sebuah karakteristik da berilai 0 utuk meyataka ketidakberadaa sebuah karakteristik. Kusrii da Luthfi (2009) meyebutka, algoritma C4.5 adalah salah satu metode klasifikasi dari data miig yag diguaka utuk megkostruksika poho keputusa (decisio tree). Sehubuga dega peelitia ii, kedua metode tersebut diguaka karea keduaya dapat megatasi data yag bertipe kategorik. Selai itu regresi logistik bier diguaka utuk megidetifikasi dua variabel respo bertipe kategorik dalam peelitia ii variabel hipertesi primer da sekuder. Semetara algoritma C4.5 memiliki perhituga sederhaa dalam megklasifikasika jeis peryakit hipertesi da dapat megatasi data bertipe kotiu. 1.2 Tujua Peelitia Tujua dari peulisa peelitia ii adalah: 1. Meetuka faktor-faktor yag mempegaruhi terjadiya jeis peyakit hipertesi di UPT Puskesmas Pojog I 2. Medapatka permodela peyebab terjadiya jeis peyakit hipertesi megguaka metode regresi logistik bier serta megukur ketepata klasifikasiya 3. Membetuk poho klasifikasi megguaka metode Algoritma C4.5 da megukur ketepata klasifikasiya 4. Membadigka ketepata klasifikasi atara metode regresi logistik bier dega metode Algoritma C4.5. 2. TINJAUAN PUSTAKA 2.1 Hipertesi Meurut World Health Orgaizatio (2013), hipertesi merupaka suatu kodisi dimaa pembuluh darah terus-meerus megalami peigkata tekaa. Adaya peigkata tekaa pada pembuluh darah megakibatka kerja jatug utuk memompa darah semaki keras/cepat. Hipertesi juga dapat didefiisika sebagai peigkata tekaa sistolik lebih besar atau sama dega 140 mmhg da atau tekaa diastolik sama atau lebih besar 90 mmhg. Meurut Masjoer dkk (2001), berdasarka peyebabya hipertesi dibagi mejadi dua gologa, yaitu hipertesi primer adalah hipertesi yag tidak diketahui peyebabya secara pasti da hipertesi sekuder adalah hipertesi yag diketahui secara spesifik peyebabya. 2.2 Model Regresi Logistik Bier Hosmer da Lemeshow (2000) meyataka bahwa regresi logistik bier diguaka utuk mejelaska hubuga atara beberapa variabel predikor X terhadap variabel respo Y yag bersifat dikotomi atau bier. Dikotomi artiya variabel respo Y haya berilai 1 utuk keberadaa suatu karakteristik da berilai 0 utuk ketidakberadaa suatu karakteristik. Model probabilitas regresi logistik adalah: dega JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 300

2.2.1 Estimasi Parameter Meurut Agresti (1990),utuk meetuka estimasi parameter regresi logistik bier dapat diguaka metode Maximum Likelihood Estimatio (MLE) yag membutuhka turua pertama da turua kedua dari fugsi likelihood. Hosmer da Lemeshow (2000) megataka, pada dasarya fugsi maksimum likelihood megguaka estimasi ilai utuk memaksimalka fugsi log likelihoodya sebagai berikut : Hosmer da Lemeshow (2000) meyeburka, utuk medapatka ilai yag memaksimalka ilai, maka dituruka terhadap,,,..., dega hasil sama dega ol. Sehigga hail turua pertama dalam betuk matriks adalah dega: da Oleh sebab turua pertama dari fugsi log likelihood tidak berbetuk closed form, maka estimasi parameter dilakuka dega metode umerik, sehigga dibutuhka turua kedua dalam betuk matriks adalah sebagai berikut: dega: Meurut Hastie, et al. (2009), utuk medapatka estimasi parameter diguaka metode Newto Raphso dega lagkah-lagkah sebagai berikut: a. Meetuka ilai taksira awal utuk b. Meghitug da ivers dari c. Meghitug taksira baru utuk setiap d + 1 dega rumus: d. Proses iterasi berheti bila didapat hasil yag koverge, 2.2.2 Uji Rasio Likelihood Hosmer da Lemeshow (2000) megataka bahwa, uji rasio likelihood merupaka uji sigifikasi parameter secara keseluruha atau bersama-sama. Hipotesis : H 0 : β 1 = β 2 =... = β p = 0 H 1 : palig sedikit salah satu dari β j 0 dega j = 1,2,...,p Statistik uji : dega: l likelihood tapa variabel bebas l likelihood dega variabel bebas JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 301

Kriteria uji : H 0 ditolak jika ilai G > χ 2 (α,p) 2.2.3 Uji Wald Meurut Hosmer da Lemeshow (2000), uji Wald merupaka uji sigifikasi parameter utuk masig-masig variabel prediktor, yag diperoleh dega cara megkuadratka rasio estimasi parameter dega estimasi stadar errorya. Hipotesis : H 0 : β j = 0 dega j= 1, 2,..., p H 1 : β j 0 dega j= 1, 2,..., p Statistik uji : W j ˆ j ˆ SE j Kriteria uji : H 0 ditolak jika W j > χ 2 (α,1) 2 2.2.4 Uji Goodess of Fit Hosmer da Lemeshow (2000), megataka bahwa uji goodess of fit merupaka uji yag dilakuka utuk megetahui apakah ada perbedaa atara prediksi da hasil observasi (model sesuai atau tidak). Statistik uji utuk uji goodess of fit adalah sebagai berikut : Hipotesis : H 0 : Model sesuai (tidak ada perbedaa atara hasil observasi dega hasil prediksi) H 1 : Model tidak sesuai (ada perbedaa atara hasil observasi dega hasil prediksi) Statistik uji : dimaa: da g = bayakya grup = bayakya observasi pada grup ke-b Kriteria uji: H 0 ditolak jika 2.3 Algoritma C4.5 Meurut Kusrii da Luthfi (2009), algoritma C4.5 merupaka salah satu algoritma yag dapat dipakai dalam pembetuka poho keputusa (decisio tree). Algoritma C4.5 diperkealka oleh Quila (1993) sebagai versi perbaika dari Algoritma Iterative Dichotomiser 3 (ID3). Meurut Witte et al., (2011), algoritma C4.5 memiliki keuggula dibadigka dega ID3 yaitu mampu megatasi ilai yag hilag (missig value), megatasi data bertipe kotiu, da melakuka pemagkasa poho (pruig trees). Meurut Quila (1993), algoritma C4.5 megguaka kriteria gai dalam meetuka pemecah ode pada poho keputusa. Rokach da Maimo (2008) meyebutka, iformatio gai atau yag bisa disebut dega gai ifo adalah kriteria pemisaha yag megguaka pegukura etropy. Etropy adalah rataa jumlah iformasi yag dibutuhka utuk megidetifikasika kelas pada kasus ke dalam himpua T. Nilai dari setiap peghituga etropy memiliki satua bits atau biary digits. Etropy diguaka sebagai suatu parameter utuk megukur heterogeitas (keberagama) dari suatu kumpula sampel data. Jika kumpula sampel data semaki heteroge, maka ilai etropy-ya semaki besar. Meurut Ruggieri (2002), iformatio gai atribut a dari suatu himpua T dapat dihitug sebagai berikut. Jika sebuah atribut a adalah diskret dari suatu himpua kasus T da T 1,, T s adalah sub-himpua dari T yag terdiri dari kasus-kasus yag ilaiya JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 302

sudah diketahui maka utuk medapatka iformatio gai dari atribut a atau Gai(a) dibutuhka etropy keseluruha kelas atau ifo(t) da etropy masig-masig atribut pada himpua T atau ifo(ti). Rumus dari Gai(a) adalah sebagai berikut: dimaa ilai etropy keseluruha kelas: sedagka ilai etropy utuk setiap atribut i: keteraga: = Bayakya kasus dalam himpua T = Bayakya kasus dalam sub-himpua = Bayak dari kasus-kasus dalam himpua T yag memiliki kelas C j Jika a adalah atribut kotiu maka kasus dalam T dega ilai atribut tersebut diurutka dari yag terkecil sampai terbesar. Dimisalka ilai hasil peguruta adalah w 1,..., w m, da ilai v = dimaa i [1, m-1] da pemisaha yag terjadi utuk atribut bertipe kotiu adalah: Utuk setiap ilai v, gai ifo dari gai dihitug dega mempertimbagka prosedur pemisaha di atas. Iformatio gai utuk a didefiisika sebagai ilai maksimum dari semua gai da ilai v merupaka sebagai ilai ambag batas utuk atribut kotiu. 2.4 Ketepata Klasifikasi Meurut Johso da Wicher (2007), terjadiya kesalaha klasifikasi suatu observasi merupaka hal yag sagat mugki terjadi. Hal ii dikareaka terkadag terdapat beberapa observasi yag tidak berasal dari kelompok tertetu tetapi dimasukka ke dalam kelompok tersebut. Perhituga ilai Apparet Error Rates (APER) dapat dilakuka dega megguaka matriks kofusi sebagai berikut: Tabel 1. Matrik Kofusi Kelompok Prediksi 1 2 1 11 12 1 Kelompok Aktual Jumlah Observasi 2 21 22 2 Maka ilai APER dapat dihitug dega rumus: APER 11 12 12 21 21 22 JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 303

Meurut Sugiarto (2000), utuk medapatka model terbaik diguaka uji beda dua proporsi dega lagkah sebagai berikut: Hipotesis H 0 : PR 1 = PR 2 (tidak ada perbedaa sigifika dari kedua metode) H 1 : PR 1 PR 2 (ada perbedaa sigifika dari kedua metode) Taraf Sigifikasi: α = 5% Statitik Uji: dega : PR 1 = Proporsi metode regresi logistik bier PR 2 = Proporsi metode algoritma C4.5 PR gab = Proporsi gabuga yaitu 1 = ukura sampel pada metode regresi logistik bier 2 = ukura sampel pada metode algoritma C4.5 Kriteria Uji : H 0 ditolak jika Z hitug > Z α/2 atau Z hitug < - Z α/2 Jika H 0 diterima, maka tidak ada perbedaa yag sigifika atara sistem klasifikasi metode regresi logistik bier dega metode algoritma C4.5. Sistem klasifikasi terbaik adalah sistem klasifikasi yag mempuyai ilai akurasi palig tiggi. 3. METODOLOGI PENELITIAN Sumber data yag diguaka dalam peelitia ii adalah data sekuder yaitu data pasie hipertesi di UPT Puskesmas Pojog 1, Guugkidul selama bula Oktober sampai November 2015. Jumlah populasi sebayak 3.112 jiwa, da jumlah sampel sebayak 354 jiwa. Variabel yag diguaka dalam peelitia ii adalah jeis hipertesi (primer da sekuder) sebagai variabel respo (Y),sedagka variabel prediktor (X) adalah jeis kelami, umur, tekaa darah sistolik, tekaa darah diastolik, riwayat berobat (ruti da tidak tetu), da peyakit lai (ada da tidak ada). 4. HASIL DAN PEMBAHASAN 4.1 Peyakit Hipertesi di UPT Puskesmas Pojog I Bula Oktober-November 2015 Berdasarka data UPT Puskesmas Pojog I, Guugkidul bula Oktober- November 2015 utuk peyakit hipertesi diperoleh iformasi sebagai berikut: Tabel 2. Data Pasie Hipertesi Jeis Hipertesi Jumlah Persetase Primer 266 75% Sekuder 88 25% Total 354 100% Berdasarka Tabel 2, dapat dilihat bahwa jumlah pasie yag mederita hipertesi primer lebih bayak dibadigka dega pasie yag mederita hipertesi sekuder. Jumlah pasie yag mederita hipertesi primer adalah sebayak 266 jiwa atau 75% dari JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 304

keseluruha, sedagka sisaya 25% atau 88 jiwa merupaka pasie yag mederita hipertesi sekuder. 4.2 Pegklasifikasia Regresi Logistik Bier Utuk membagi data traiig da testig dilakuka beberapa kali percobaa dega melihat hasil akurasi yag palig tiggi. Pada peelitia ii, data dipartisi 60% utuk data traiig atau sebayak 212 data da 40% data testig atau sebayak 142 data. Dari hasil pegolaha data traiig diperoleh model regresi logistik sebagai berikut: Model awal : dega: -2,404 0,877(X 11 ) + 0,021(X 2 ) + 0,025(X 3 ) 0,013(X 4 ) + 0,433(X 51 ) 0,749(X 61 ) Setelah dilakuka uji sigifikasi parameter, ada tiga variabel yag tidak mempegaruhi model yaitu variabel umur, tekaa darah diastolik, da riwayat berobat, sehigga perlu dilakuka uji sigifikasi parameter yag kedua utuk meguji variabel jeis kelami, tekaa darah sistolik, da peyakit lai. 4.2.1 Uji Rasio Likelihood Tabel 3. Uji Rasio Likelihood Uji ke- G Nilai Tabel Chi-Square Keputusa 1 20,911 = 12,592 H 0 ditolak 2 15,186 = 7,815 H 0 ditolak Berdasarka Tabel 3, diketahui bahwa pada taraf sigifikasi 5%, variabel prediktor secara bersama-sama mempegaruhi model. 4.2.2 Uji Wald Tabel 4. Uji Wald Pertama Variabel Wald Keputusa X 11 5,637 3,841 H 0 ditolak X 2 2,558 3,841 H 0 diterima X 3 5,497 3,841 H 0 ditolak X 4 0,676 3,841 H 0 diterima X 51 1,426 3,841 H 0 diterima X 61 4,492 3,841 H 0 ditolak Tabel 5. Uji Wald Kedua Variabel Wald Keputusa X 11 4,525 3,841 H 0 ditolak X 3 5,834 3,841 H 0 ditolak X 61 3,925 3,841 H 0 ditolak Berdasarka Tabel 4 da Tabel 5, dapat dilihat bahwa pada taraf sigifikasi 5%, variabel prediktor yag sigifika mempegaruhi model adalah X 11 (jeis kelami), X 3 JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 305

(tekaa darah sistolik), da X 61 (peyakit lai). Sedagka variabel X 2 (umur), X 4 (tekaa darah diastolik), da X 51 (riwayat berobat) tidak sigifika mempegaruhi model. 4.2.3 Uji Goodess of Fit Berdasarka uji goodess of fit diperoleh hasil bahwa pada taraf sigifikasi 5%, H 0 diterima karea ilai. Jadi model regresi logistik bier yag terbetuk sesuai. 4.2.4 Model Akhir Setelah dilakuka uji sigifikasi terhadap model baik secara keseluruha maupu idividu, diperoleh model akhir sebagai berikut: 4.2.5 Ketepata Klasifikasi Pada peyusua tabel klasifikasi, maka perlu dihitug probabilitas dari data testig, sehigga didapatka matriks kofusi sebagai berikut: Tabel 6. Hasil Ketepata Klasifikasi Regresi Logistik Bier Prediksi Observasi Sekuder Primer Sekuder 1 0 Primer 39 102 Berdasarka Tabel 6, dapat diketahui bahwa pada pegklasifikasia jeis hipertesi di UPT Puskesmas Pojog I, Guugkidul didapatka ilai APER sebesar 27,4648% dega ketepata klasifikasi sebesar 72,5352%. 4.3 Pegklasifikasia Algoritma C4.5 4.3.1 Pembetuka Poho Keputusa Algoritma C4.5 Pembetuka poho keputusa meghasilka sebayak 13 simpul, yag terdiri dari satu simpul akar (tekaa darah sistolik), 5 simpul keputusa, da 7 simpul dau. Berikut ii adalah hasil perhituga mecari ilai etropy da iformatio gai dari semua atribut utuk meetuka simpul akar: Tabel 7. Nilai Iformatio Gai utuk Simpul Akar No Atribut Gai (dalam bits) 1 Jeis Kelami 0,0134 2 Sistolik 0,07957 3 Diastolik 0,00569 4 Riwayat Berobat 0,000671 5 Peyakit Lai 0,010468 6 Umur 0,046731 JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 306

Berdasarka Tabel 7, dapat diketahui bahwa dalam peelitia ii atribut tekaa darah sistolik terpilih sebagai pemilah pada simpul akar karea memiliki ilai iformatio gai terbesar diatara atribut laiya. Gambar 1. Poho Klasifikasi Algoritma C4.5 Berdasarka poho keputusa pada Gambar 1, bayakya keseluruha simpul yag terbetuk adalah 13 simpul, yag terdiri dari satu simpul akar, 5 simpul keputusa, da 7 simpul dau. Sedagka variabel yag berpegaruh adalah tekaa darah sistolik, riwayat berobat, peyakit lai, tekaa darah diastolik, da jeis kelami. 4.2.2 Ketepata Klasifikasi Berikut matriks kofusi pada perhituga ketepata klasifikasi algoritma C4.5 : Tabel 8. Ketepata Klasifikasi Algoritma C4.5 Prediksi Observasi Sekuder Primer Sekuder 3 37 Primer 14 88 Berdasarka Tabel 8, dapat diketahui bahwa pada pegklasifikasia jeis hipertesi di UPT Puskesmas Pojog I, Guugkidul didapatka ilai APER sebesar 35,9155% dega ketepata klasifikasi sebesar 64,0845%. 4.4 Perbadiga Ketepata Klasifikasi Ketepata klasifikasi megguaka regresi logistik bier da algoritma C4.5 sebagai berikut: JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 307

Tabel 9. Perbadiga Ketepata Klasifikasi Regresi Logistik Bier Algoritma C4.5 APER 27,4648% 35,9155% 1-APER 72,5352% 64,0845% Berdasarka Tabel 9, diperoleh ilai ketepata klasifikasi megguaka metode regresi logistik bier sebesar 72,5352% dega ilai laju error sebesar 27,4648%. Sedagka ilai ketepata klasifikasi megguaka metode algoritma C4.5 adalah sebesar 64,0845% dega ilai laju error 35,9155%. Utuk medapatka metode terbaik, maka dilakuka evaluasi ketepata klasifikasi dega melakuka uji beda dua proporsi sebagai berikut : Hipotesis: H 0 : PR 1 = PR 2 (tidak ada perbedaa sigifika dari kedua metode) H 1 : PR 1 PR 2 (ada perbedaa sigifika dari kedua metode) Taraf Sigifikasi: α = 5% Statitik Uji: Kriteria Uji: H 0 ditolak jika Z hitug < -Z α/2 atau Z hitug > Z α/2 Keputusa: Karea Z hitug = 27,71682 > Z α/2 = 1,960 maka H 0 ditolak. Kesimpula: Jadi pada taraf sigifikasi 5% disimpulka bahwa ada perbedaa sigifika dari kedua metode. Dega kata lai, metode regresi logistik bier lebih baik dalam megklasifikasika jeis peyakit hipertesi di UPT Puskesmas Pojog I, Guugkidul dibadigka dega metode algoritma C4.5. 5. KESIMPULAN Berdasarka aalisis da pembahasa yag telah diuraika di atas, maka dapat diambil kesimpula sebagai berikut: 1. Pada regresi logistik bier, faktor-faktor yag mempegaruhi terjadiya jeis peyakit hipertesi adalah jeis kelami, tekaa darah sistolik, serta peyakit lai. 2. Poho keputusa yag terbetuk megguaka algoritma C4.5 meghasilka poho sebayak 13 simpul, yag terdiri dari sebuah simpul akar yaitu atribut tekaa darah sistolik, 5 simpul keputusa, serta 7 simpul dau. Faktor-faktor yag mempegaruhi terjadiya jeis peyakit hipertesi adalah tekaa darah sistolik, riwayat berobat, peyakit lai, tekaa darah diastolik, da jeis kelami, sedagka faktor umur tidak berpegaruh. 3. Berdasarka hasil aalisis regresi logistik bier diperoleh ilai APER=27,4648% da ketepata klasifikasi sebesar 72,5352%, sedagka pada algoritma C4.5 diperoleh ilai APER=35,9155% dega ketepata klasifikasi sebesar 64,0845%. Dari uji beda proporsi dihasilka bahwa ada perbedaa sigifika atara kedua JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 308

metode, sehigga dapat dikataka bahwa regresi logistik bier lebih baik dibadigka algoritma C4.5 dalam megklasifikasika jeis peyakit hipertesi di UPT Puskesmas Pojog I, Guugkidul. DAFTAR PUSTAKA Agresti, A. 1990. Categorical Data Aalysis.New York: Joh Wiley & Sos. Hastie, T.,Tibshirai, R. Ad Friedma, J. H. 2009. The Elemets of Statistical Learig: Data Miig. Iferece ad Predictio Secod Editio. New York: Spriger Sciece Bussiess Media. Hosmer, D. W. ad Lemeshow S. 2000. Applied Logistic Regressio. Uited States of America: Sos Ic. Johso, R. A. ad Wicher. D. W., 2007. Applied Multivariate Statistical Aalysis. Sixth Editio. New Jersey: Pretice Hall Iteratioal, Ic. Kemeteria Kesehata RI. 2013. Pusat Data da Iformasi Kemeteria Kesehata RI Hipertesi.(https://www.google.co.id/url?sa=t&rct=j&q=&esrc=s&source=web&cd =1&cad=rja&uact=8&ved=0ahUKEwiu8u7m5ezJAhUCqYKHfROA8oQFggdM AA&url=http%3A%2F%2Fwww.depkes.go.id%2Fdowload.php%3Ffile%3Ddow load%2fpusdati%2fifodati%2fifodatihipertesi.pdf&usg=afqjcnhwli HieCeL1Ksg4Tr_yxZ10Ky7Cg diakses pada taggal 21 Desember 2015) Kusrii da Luthfi. 2009. Algoritma Data Miig. Yogyakarta: Adi Offset. Masjoer, A. dkk. 2001. Kapita Selekta Kedoktera Edisi Ketiga. Jakarta: Media Aesculapius Fakultas Kedoktera Uiversitas Idoesia. Quila, J. R., 1993. C4.5: Programs For Machie Learig. Sa Mateo: Morga Kaufma Publisher, Ic. Riset Kesehata Dasar. 2013. Riset Kesehata Dasar 2013. (http://labmadat. litbag.depkes.go.id/images/dowload/lapora/rkd/2013/lapora_riskesdas_2013 _fial.pdf diakses pada taggal 21 Desember 2015) Ruggieri, S., 2002. Efficiet C4.5. (http://www.di.uipi.it/~ruggieri/ Papers/ec45.pdf, diakses pada taggal 21 Desember 2015). Rokach, L. ad Maimo, O., 2008. Data Miig With Decisio Trees: Theory ad Applicatios. Sigapura: World Scietific Publishig Co. Pte. Ltd. Sugiarto, D.S. 2000. Metode Statistika. Jakarta: Gramedia Pustaka Utama. UPT Puskesmas Pojog I. 2015. Profil Kesehata UPT Puskesmas Pojog I Dias Kesehata Kabupate Guugkidul Tahu 2015 (Data tahu 2014). Yogyakarta: UPT Puskesmas Pojog I. Witte, I. H., Frak, E., Hall, M. A., 2011. DATA MINING Practical Machie Learig Tools ad Teachiques. Secod Editio. Califoria: Morga Kaufma. World Health Orgaizatio. 2013. A Global Brief of Hypertesio. (http://www. who.it/cardiovasculardiseases/publicatios/global_brief_hypertesio/e/ diakses pada taggal 21 Desember 2015) JURNAL GAUSSIAN Vol. 5, No. 2, Tahu 2016 Halama 309