PENERAPAN METODE ASSOCIATION RULES DAN COSINE SIMILARITY UNTUK PENGEMBANGAN FITUR DETEKSI DINI PENYAKIT SKRIPSI Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu Jurusan Informatika Disusun Oleh: Aldion Renata M0508025 JURUSAN INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA Juni, 2013
ii
MOTTO Bukan kesulitan yang membuat kita takut tapi ketakutanlah yang membuat kita sulit, karena itu jangan pernah mencoba untuk menyerah dan jangan pernah menyerah untuk mencoba - Sayidina Ali bin Abi Thalib - Marva Collins - Kita adalah apa yang Kita lakukan berulang-ulang, maka keunggulan bukanlah suatu perbuatan melainkan hasil dari kebiasaan - Aristoteles - iii
PERSEMBAHAN Karya ini penulis persembahkan kepada : - Calon pendamping hidup, RA Retnosari Trihastuti - Sahabat terbaik Elvin, Rahmad, Ismail, Andri dan Teman-teman S1 informatika angkatan 2008 - Teman-teman kos Galera 1 iv
PENERAPAN METODE ASSOCIATION RULES DAN COSINE SIMILARITY UNTUK PENGEMBANGAN FITUR DETEKSI DINI PENYAKIT ALDION RENATA Jurusan Infromatika. Fakultas Matematika dan Ilmu Pengetahuan Alam. Universitas Sebelas Maret ABSTRAK Pendeteksian penyakit dapat dilakukan dengan perbandingan gejala. Untuk meminimalisir jumlah gejala yang ditanyakan guna memperoleh feedback, diperlukan pengelompokkan gejala dan pengeliminasian penyakit dalam beberapa tahap. Pengelompokan gejala akan dilakukan menggunakan metode association rules. Gejala-gejala yang telah dikelompokkan dijadikan sebagai acuan dalam mengajukan pertanyaan untuk memperoleh feedback, kemudian feedback akan dihitung nilai similarity-nya dengan gejala penyakit menggunakan rumus Cosine. Penyakit dengan nilai similarity yang tidak memenuhi batas minimum akan dieliminasi. Nilai similarity terbesar menjadi kesimpulan hasil deteksi. Ada tiga macam rules yang digunakan dalam penelitian ini yaitu rules implikasi, rules implikasi support lebih dari sama dengan 9%, dan rules gabungan antara rules implikasi dan rules kontraposisi. Dalam logika matematika, implikasi memiliki ekuivalensi dengan bentuk kontraposisinya. Ketiga rules tersebut memiliki hasil pengujian yang berbeda. Rules implikasi dan gabungan menghasilkan akurasi yang lebih baik dibandingkan dengan rules implikasi support lebih dari sama dengan 9%. Efektifitas pengurangan jumlah pertanyaan setiap rules mencapai 70.439%, 70.20%, dan 70.436% atau dapat mengeliminasi rata-rata 90 dari 128 pertanyaan. Meskipun nilai efektifitas yang dihasilkan memiliki perbedaan yang tidak signifikan, tetapi rules implikasi menghasilkan nilai similarity yang lebih tinggi sehingga rules implikasi lebih baik dibandingkan kedua rules lainnya. Kata Kunci : Cosine similarity, Association rules, Pendeteksian penyakit, Feedback, Gejala v
IMPLEMENTATION OF ASSOCIATION RULES AND COSINE SIMILARITY METHODS FOR EARLY DETECTION OF DISEASE FEATURES DEVELOPMENT ALDION RENATA Department of Informatics. Faculty of Mathematic and Natural Science. Sebelas Maret University ABSTRACT Detection of disease can be done by symptoms comparation.clustering of symptoms and elimination of diseases in several stages necessary to minimize the number of symptoms and to get feedback. Symptoms will be clustered by association rules method. The clusters of symptoms serve as reference in asking question to gain feedbacks, then it will be compared by disease symptoms and calculated the similarity value with cosine formula. Disease with the similarity value below the minimum threshold will be eliminated. The conclusion of detection result is disease with the highest similarity value. There are three kinds of rules used in this research: implication rules, implication rules with support greater than or equal to 9%, and joint rules between implication and contraposition rules. Implication have equivalence with its contraposition in mathematical logic. Three kinds of rules have different test result. Implication rules and joint rules produce similar accuracy values better than implication rules with support greater than or equal to 9%. Effectiveness of reducing the number of questions per rules reach 70.439%, 70.20%, and 70.436% or it can eliminate an average of 90 out of 128 questions. Eventhough the effectiveness of each rules have no significant differences values, implication rules produce higher similarity value so that implication rules better than others. Keywords : Association rules, Cosine similarity, Detection of disease, Feedback, Symptoms vi
KATA PENGANTAR Puji syukur kehadirat Allah SWT karena dengan ridho dan rahmat-nya, Penerapan Metode Association Rules dan Cosine Similarity untuk Pengembangan Fitur Deteksi Dini Penyakit Penulis mengucapkan terima kasih kepada berbagai pihak yang telah memberikan bimbingan, dukungan dan saran dalam pembuatan laporan ini, terutama kepada: 1. Ibu Umi Salamah, S.Si., M.Kom selaku Ketua dan pembimbing akademik Jurusan Informatika FMIPA UNS 2. Bapak Wiharto, S.T., M.Kom selaku Sekretaris Jurusan Informatika FMIPA UNS 3. Bapak Ristu Saptono, S.Si., M.T selaku Dosen Pembimbing I yang telah memberikan bimbingan selama proses penyusunan Tugas Akhir ini. 4. Bapak Meiyanto Eko Sulistyo., S.T, M.Eng selaku Pembimbing II yang telah memberikan bimbingan selama proses penyusunan Tugas Akhir ini. 5. Ibu Sari Widya Sihwi, S.Kom., M.T.I selaku Penguji I yang telah memberikan kritik dan saran yang membangun dalam penyusunan laporan Tugas Akhir ini. 6. Bapak Didiek Sri Wiyono, S.T., M.T selaku Penguji II yang telah memberikan kritik dan saran yang membangun dalam penyusunan laporan Tugas Akhir ini. 7. RA Retnosari Trihastuti yang selalu menemani, memberikan semangat dan bantuan yang luar biasa dari awal hingga terselesaikannya Tugas Akhir ini. 8. Teman-teman terdekat penulis yang selalu memberi semangat dan dukungan yang tulus : Elvin, Rahmad, Ismail, dan Andri. Semoga skripsi ini dapat bermanfaat bagi pihak yang berkepentingan. Surakarta, Juli 2013 Penulis vii
DAFTAR ISI HALAMAN JUDUL... i HALAMAN PERSETUJUAN... ii HALAMAN PENGESAHAN... iii HALAMAN MOTTO... iv HALAMAN PERSEMBAHAN... v ABSTRAK... vi ABSTRACT... vii KATA PENGANTAR... viii DAFTAR ISI... ix DAFTAR TABEL... xi DAFTAR GAMBAR... xii DAFTAR LAMPIRAN... xiii BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah... 2 1.3 Batasan Masalah... 2 1.4 Tujuan Penelitian... 3 1.5 Manfaat Penelitian... 3 1.6 Sistematika Penulisan... 3 BAB II TINJAUAN PUSTAKA... 5 2.1 Dasar Teori... 5 2.1.1 Association rule... 5 2.1.2 Similarity... 6 2.1.3 Logika Matematika... 8 2.1.4 Penyakit-penyakit Metabolik dan Degeneratif... 8 2.2 Penelitian Terkait... 9 BAB III METODE PENELITIAN... 13 3.1 Tahap Pengumpulan Data... 13 3.2 Tahap Pemodelan Data... 13 ix
3.2.1 Proses Pembentukan Rules... 13 3.2.2 Proses Pengelompokan Ulang Gejala... 14 3.2.3 Proses Eliminasi Penyakit dan Penemuan Penyakit yang mungkin dialami... 14 3.3 Tahap Pengembangan Aplikasi... 14 3.4 Tahap Pengujian dan Analisa Hasil... 14 BAB IV HASIL DAN PEMBAHASAN... 17 4.1 Deskripsi Data... 17 4.2 Pemodelan Sistem... 17 4.2.1 Pembentukan Rules... 17 4.2.2 Pengelompokan Ulang Gejala... 19 4.2.3 Eliminasi Penyakit dan Penemuan Penyakit yang mungkin dialami... 21 4.3 Hasil Pengujian... 34 4.3.1 Pengujian dengan Feedback Lengkap... 34 4.3.2 Pengujian dengan Feedback Random 20%... 35 4.3.3 Pengujian dengan Feedback Random 40%... 36 4.3.4 Pengujian dengan Feedback Data Real... 36 4.4 Pembahasan... 38 BAB V PENUTUP... 41 5.1 Kesimpulan... 41 5.2 Saran... 42 DAFTAR PUSTAKA... 43 LAMPIRAN... 45 x
DAFTAR TABEL Tabel 2.1 Perbandingan implikasi, konvers, invers, dan kontraposisi... 8 Tabel 4.1 Rules implikasi dengan 9%... 19 Tabel 4.2 Contoh rules yang diperoleh pada proses pertama... 19 Tabel 4.3 Rules hasil kontraposisi yang tidak memiliki bentuk implikasi... 19 Tabel 4.4 Contoh pengelompokan ulang gejala hasil penerapan rules implikasi... 20 Tabel 4.5 Daftar Pertanyaan Tahap Pertama... 27 Tabel 4.6 Daftar Pertanyaan dan feedback yang diinputkan... 28 Tabel 4.7 Daftar Pertanyaan selanjutnya dan feedback yang diinputkan... 29 Tabel 4.8 Daftar pertanyaan gejala yang merupakan consequent dari pertanyaan sebelumnya pada Rules implikasi dan gabungan... 30 Tabel 4.9 Rangkuman hasil pengujian feedback lengkap dengan Association Rules dan Cosine Similarity... 35 Tabel 4.10 Rangkuman hasil pengujian feedback random 20% dengan Association Rules dan Cosine Similarity... 36 Tabel 4.11 Rangkuman hasil pengujian feedback random 40% dengan Association Rules dan Cosine Similarity... 37 Tabel 4.12 Rangkuman hasil pengujian feedback data realdengan Association Rules dan Cosine Similarity... 37 Tabel 4.13 Jumlah pertanyaan yang harus dijawab di setiap pengujian dengan Rules implikasi... 38 Tabel 4.14 Jumlah pertanyaan yang harus dijawab di setiap pengujian dengan Rules... 38 Tabel 4.15 Jumlah pertanyaan yang harus dijawab di setiap pengujian dengan Rules gabungan... 39 xi
DAFTAR GAMBAR Gambar 3.1 Alur Metodologi Penelitian... 13 Gambar 4.1 Matriks hubungan penyakit dengan gejala... 17 Gambar 4.2 Alur proses pengajuan pertanyaan menggunakan rules implikasi... 23 Gambar 4.3 Alur proses pengajuan pertanyaan menggunakan rules implikasi dengan support... 23 Gambar 4.4 Alur proses pengajuan pertanyaan menggunakan rules gabungan... 23 Gambar 4.5 Pertanyaan tahap 1 pada penerapan rules implikasi dengan support... 31 Gambar 4.6 Pertanyaan tahap 1 pada penerapan rules implikasi dan gabungan.. 31 Gambar 4.7 Daftar pertanyaan tahap selanjutnya menggunakan rules implikasi 32 Gambar 4.8 Daftar pertanyaan tahap selanjutnya menggunakan rules implikasi... 32 Gambar 4.9 Daftar pertanyaan tahap selanjutnya Alur proses pengajuan pertanyaan menggunakan rules gabungan... 32 Gambar 4.10 Contoh hasil aplikasi deteksi dini penyakit... 34 xii
DAFTAR LAMPIRAN LAMPIRAN A... 46 LAMPIRAN B... 48 LAMPIRAN C... 52 LAMPIRAN D... 55 LAMPIRAN E... 57 LAMPIRAN F... 63 LAMPIRAN G... 69 xiii