METODE KLASIFIKASI BERSTRUKTUR POHON DENGAN ALGORITMA QUEST DAN ALGORITMA CART (Aplikasi pada Data Pasien Penyakit Jantung) SKRIPSI NUR SAUNAH RANGKUTI 130803016 DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2017
METODE KLASIFIKASI BERSTRUKTUR POHON DENGAN ALGORITMA QUEST DAN ALGORITMA CART (Aplikasi pada Data Pasien Penyakit Jantung) SKRIPSI Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains NUR SAUNAH RANGKUTI 130803016 DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2017
PERSETUJUAN Judul: Metode Klasifikasi Bersturuktur Pohon dengan Algoritma QUEST dan Algoritma CART (Aplikasi pada Data Pasien Penyakit Jantung). Kategori : Skripsi Nama : Nur Saunah Rangkuti Nomor Induk Mahasiswa : 130803016 Program Studi : Sarjana (S1) Matematika Departemen Fakultas : Matematika : Matematika Dan Ilmu Pengetahuan Alam Disetujui di Medan, 2017 Komisi Pembimbing Pembimbing 2, Pembimbing 1, Dr. Sutarman, M.Sc NIP. 19631026 199103 1 001 Dr. Elly Rosmaini, M.Si NIP. 19600520 198503 2 002 Disetujui Oleh Departemen Matematika FMIPA USU Ketua Dr. Suyanto, M.Kom NIP. 19590813 198601 1 002 i
PERNYATAAN METODE KLASIFIKASI BERSTRUKTUR POHON DENGAN ALGORITMA QUEST DAN ALGORITMA CART (Aplikasi pada Data Pasien Penyakit Jantung) SKRIPSI Saya mengakui bahwa skripsi ini adalah hasil karya sendiri. Kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya. Medan, 2017 Nur Saunah Rangkuti 130803016 ii
PENGHARGAAN Puji Syukur penulis ucapkan kehadirat Allah Subhanahu wa Ta ala, yang telah melimpahkan rahmat dan karunia-nya serta memberikan banyak kemudahan sehingga penulis dapat menyelesaikan skripsi yang berjudul Metode Klasifikasi Berstruktur Pohon dengan Algoritma QUEST dan Algoritma CART (Aplikasi pada Data Pasien Penyakit Jantung). Shalawat dan salam penulis ucapkan kepada Rasulullah Shallallahu Alaihi wa Sallam, keluarga, para sahabat, dan orang-orang yang mengikutinya. Terima kasih penulis sampaikan kepada bapak Dr. Suyanto, M.Kom selaku ketua Departemen Matematika dan terima kasih kepada ibu Dr. Elly Rosmaini, M.Si selaku pembimbing 1 yang banyak berjasa kepada penulis dimana beliau telah meluangkan waktu dan pikirannya, memberikan pengarahan, saran, dan kritik terkait penulisan skripsi ini. Terima kasih kepada bapak Dr. Sutarman, M.Sc selaku pembimbing 2, yang juga telah meluangkan waktu, pikiran, dan saran untuk perbaikan skripsi ini. Terima kasih sebesar-besarnya penulis sampaikan kepada kedua orang tua atas do a dan dukungannya kepada penulis baik secara moril ataupun materi, kepada abang, kakak dan adik saya yang sudah meluangkan waktu dan pikirannya untuk mendengarkan curahan hati penulis, memberikan nasihat, dan selalu memotivasi penulis. Terima kasih kepada Bapak Direktur Rumah Umum Pusat Haji Adam Malik Medan yang telah membantu penulis memberikan data yang diperlukan dalam penulisan skripsi ini. Terima kasih penulis sampaikan kepada bapak Dr. Pasukat Sembiring, M.Si selaku penguji 1 dan bapak Drs. Henri Rani Sitepu, M.Si selaku penguji 2 yang telah meluangkan waktu, pikiran dan memberikan kritik maupun saran untuk perbaikan skripsi ini dan sebagai pembelajaran bagi penulis. Terima kasih penulis sampaikan kepada seluruh dosen Matematika USU yang telah membagikan ilmu kepada penulis selama masa perkuliahan, Dekan dan Wakil Dekan FMIPA USU, serta seluruh staf administrasi FMIPA USU. Terima kasih juga penulis ucapkan kepada teman-teman yang telah memberikan do a dan motivasi kepada penulis dalam mengerjakan skripsi. Semoga Tuhan memberikan balasan kebaikan atas segala bantuan yang telah semua berikan kepada penulis. iii
METODE KLASIFIKASI BERSTRUKTUR POHON DENGAN ALGORITMA QUEST DAN ALGORITMA CART (Aplikasi pada Data Pasien Penyakit Jantung) ABSTRAK Metode klasifikasi yang sering digunakan adalah metode klasifikasi berstruktur pohon, diantaranya yaitu QUEST (Quick, Unbiased, Efficient Statistical Trees) dan CART (Classification and Regression Tree). QUEST menggunakan uji ANOVA F dan Chi-square untuk pemisah terbaik pada setiap langkahnya. Sedangkan CART memilih pemilah terbaik berdasarkan tingkat kehomogenan yang maksimum. Penelitian ini bertujuan untuk mengetahui faktor-faktor yang mempengaruhi seseorang menderita penyakit jantung. Data yang digunakan dalam penelitian ini adalah data pasien penyakit jantung di RSUP H. Adan Malik Medan. Variabel dependennya adalah penyakit jantung, sedangkan variabel independennya adalah umur, jenis kelamin, tekanan darah, kolesterol, gula darah, hasil eletrokardiografi dan kondisi jantung. Metode QUEST menghasikan 3 kelas dimana ada 2 variabel independen yang signifikan terhadap penyakit jantung yaitu hasil eletrokardiografi dan kondisi jantung. Sedangkan CART menghasilkan 6 kelas dimana ada 3 variabel independen yang signifikan terhadap penyakit jantung yaitu kolesterol, jenis kelamin dan umur. Perbedaan dalam klasifikasi antara algoritma QUEST dan algoritma CART adalah pembentukan pohon klasifikasinya, dimana pembentukan pohon pada algoritma QUEST adalah biner. Sedangkan pembentukan pohon pada algoritma CART adalah non biner. Kata kunci: Klasifikasi, QUEST (Quick, Unbiased, Efficient Statistical Trees), CART (Classification and Regression Tree). iv
CLASSIFICATION METHOD OF TREE STRUCTURE WITH QUEST ALGORITHM AND CART ALGORITHM (Application on Patient Data of Heart Desease) ABSTRACT A frequently used classification method is a tree classed classification method, such as QUEST (Quick, Unbiased, Efficient Statistical Trees) and CART (Classification and Regression Tree). QUEST using ANOVA F test dan Chisquare test for the best separator at each step. While CART choose the best divider based on the maximum homogeneity level. This study aims to determine the factors that effect a persen suffering from heart desease. The data used in this study is the data of patients with heart desease in RSUP H. Adan Malik Medan.The dependent variable is heart desease, while the independent variables are age, sex, blood pressure, cholesterol, blood sugar, eletrokardiografi test and heart condition. QUEST method yielding 3 classes there are 2 independent variables that are significant to heart desease that are eletrokardiografi test and heart condition. While CART method yielding 6 classes there are 3 independent variables that are significant to heart desease that are cholesterol, sex and age. Differences in the intermediate classification between QUEST algorithm and CART algorithm are the formation of the tree classification, in which the formation in QUEST algorithm is binary. While the formation in CART algorithm adalah non-binary. Keywords: Classification, QUEST (Quick, Unbiased, Efficient Statistical Trees), CART (Classification and Regression Tree). v
DAFTAR ISI PERSETUJUAN PERNYATAAN PENGHARGAAN ABSTRAK ABSTRACT DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR DAFTAR LAMPIRAN Halaman i ii iii iv v vi viii x xi BAB 1 BAB 2 BAB 3 PENDAHULUAN 1.1 Latar Belakang 1 1.2 Rumusan Masalah 3 1.3 Batasan Masalah 4 1.4 Tujuan Penelitian 4 1.5 Manfaat Penelitian 4 1.6 Metodologi Penelitian 5 1.7 Kerangka Penelitian 6 TINJAUAN PUSTAKA 2.1 Skala Pengukuran 7 2.2 Metode Klasifikasi Berstruktur Pohon 8 2.3 Konsep-Konsep Dasar pada Algoritma QUEST dan Algoritma CART 10 2.3.1 Uji Khi-kuadrat (X 2 ) 10 2.3.2 Uji ANOVA F 12 2.3.3 Uji Levene F 13 2.3.4 Analisis Diskriminan Kuadratik 13 2.4 Metode QUEST 15 2.4.1 Algoritma QUEST 15 2.5 Metode CART 19 2.5.1 Algoritma CART 20 METODE PENELITIAN 3.1 Penelitian 21 3.1.1 Jenis Penelitian 21 vi
3.1.2 Lokasi dan Waktu Penelitian 21 3.1.2.1 Lokasi Penelitain 21 3.1.2.2 Waktu Penelitian 21 3.1.3 Populasi dan Sampel 21 3.1.4 Jenis dan Pengambilan Sampel 22 3.1.5 Variabel Penelitian 22 3.1.6 Skala Ukuran Penelitian 23 3.1.7 Analisis Data 23 3.1.8 Langkah-Langkah Analisis Data 23 BAB 4 BAB 5 HASIL DAN PEMBAHASAN 4.1 Data 25 4.2 Penyelesaian dengan Algoritma QUEST 26 4.2.1 Simpul awal (t 0 ) 26 4.2.2 Simpul Dalam (t 1 ) 35 4.2.3 Simpul Dalam (t 2 ) 43 4.3 Penyelesaian dengan Algoritma QUEST 47 4.3.1 Cabang Pertama 48 4.3.2 Cabang Pertama pada Kondisi Jantung Cacat Sementara/Cacat Tetap 51 4.3.3 Cabang Ketiga pada Kolestrol 176 54 4.3.4 Cabang Keempat pada Tekanan Darah 124 56 4.3.5 Cabang Keempat pada Tekanan Darah > 124 59 4.3.6 Cabang Ketiga pada Kolesterol 176 61 4.3.7 Cabang Keempat pada Kondisi Jantung yang Normal 63 4.4 Perbandingan Algoritma QUEST dengan Algoritma CART 68 KESIMPULAN DAN SARAN 5.1 Kesimpulan 70 5.2 Saran 74 DAFTAR PUSTAKA 75 vii
DAFTAR TABEL Nomor Tabel Judul Halaman 2.1 Kontigensi Dua Arah 11 2.2 ANOVA F 12 2.3 Struktur Data Analisis Diskriminan Kuadratik 14 4.1 Frekuensi Teramati O ij 28 4.2 Hasil Uji Statistika Pemilihan Peubah Penyekat Simpul t 0 29 4.3 Tabulasi x 6 30 4.4 Tabulasi x 6 Hasil Transformasi 34 4.5 Hasil Uji Statistika Pemilihan Peubah Penyekat Simpul t 1 37 4.6 Tabulasi x 7 38 4.7 Tabulasi x 7 Hasil Transformasi 41 4.8 Hasil Uji Statistika Pemilihan Peubah Penyekat Simpul t 2 45 4.9 Tabulasi x 7 untuk Simpul t 2 45 4.10 Daftar Calon Mutakhir 48 4.11 Perhitungan P L dan P R 49 4.12 Perhitungan P(j t L ) dan P(j t R ) 49 4.13 Kesesuaian untuk Calon Cabang 50 4.14 Daftar Calon Mutakhir 52 4.15 Perhitungan P L dan P R 52 4.16 Kesesuaian untuk Calon Cabang 53 4.17 Daftar Calon Mutakhir 54 4.18 Perhitungan P L dan P R 55 4.19 Kesesuaian untuk Calon Cabang 55 4.20 Daftar Calon Mutakhir 57 4.21 Perhitungan P L dan P R 57 4.22 Kesesuaian untuk Calon Cabang 58 4.23 Daftar Calon Mutakhir 58 4.24 Perhitungan P L dan P R 59 4.25 Kesesuaian untuk Calon Cabang 59 4.26 Daftar Calon Mutakhir 60 4.27 Perhitungan P L dan P R 61 4.28 Kesesuaian untuk Calon Cabang 61 4.29 Daftar Calon Mutakhir 62 4.30 Perhitungan P L dan P R 62 4.31 Kesesuaian untuk Calon Cabang 64 4.32 Perbandingan Hasil Klasifikasi Algoritma QUEST dan 64 viii
Algoritma CART 5.1 Perbandingan Hasil Klasifikasi Algoritma QUEST dan Algoritma CART 72 ix
DAFTAR GAMBAR Nomor Gambar Judul Halaman 2.1 Pohon Klasifikasi 9 4.1 Pohon Keputusan Cabang Pertama 45 4.2 Pohon Keputusan Cabang Kedua pada Kondisi Jantung 47 4.3 Pohon Keputusan Cabang Ketiga 56 4.4 Pohon Keputusan Cabang Keempat 58 4.5 Pohon Keputusan Cabang Keempat pada Tekanan Darah >124 60 4.6 Pohon Keputusan Cabang Ketiga pada Kolesterol >176 63 4.7 Pohon Keputusan Cabang Kedua pada Kondisi Jantung yang Normal 66 x
DAFTAR LAMPIRAN Nomor Judul Halaman Lamp. 1 Data-Data Pasien Penyakit Jantung di Rumah Sakit Umum 76 Pusat Haji Adam Malik 2 Surat Keterangan Izin Riset di Rumah Sakit Umum Pusat 81 Haji Adam Malik. 3 Surat Keterangan Selesai Riset di Rumah Sakit Umum 82 Pusat Haji Adam Malik. 4 Lampiran SPSS 83 xi