BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini sering terjadi data explosion problem yaitu data data yang tersimpan dalam database berjumlah sangat besar namun dari data data tersebut belum banyak dimanfaatkan terutama dalam hal pencarian informasi berharga (knowledge). Untuk mengatasi hal tersebut salah satunya adalah dengan menggunakan data mining karena data mining dapat membantu membuat hipotesis baru ataupun membantu analis untuk menemukan informasi berharga dari data tersebut. Salah satu fungsionalitas data mining adalah klasifikasi. Klasifikasi adalah proses mencari identitas umum diantara entitas-entitas yang berbeda dan mengklasifikasikannya ke dalam class yang sesuai. Klasifikasi pada data yang berjumlah besar dan kompleks jika dilakukan secara manual akan sulit dan membutuhkan waktu yang lama. Hal ini dapat diatasi dengan pembangunan suatu tools klasifikasi karena dengan adanya tools klasifikasi data yang berjumlah besar dan kompleks tersebut akan lebih mudah dan cepat dikelompokkan sesuai dengan class-nya masing-masing. Klasifikasi dapat dilakukan pada banyak bidang, diantaranya bidang ekonomi, kesehatan, dan pendidikan. Pada Tugas Akhir ini metode yang digunakan dalam pembangunan klasifikasi adalah Naive Bayesian Classifier karena metode ini merupakan metode klasifikasi yang sederhana yaitu berdasarkan pada probabilitas namun mampu mengklasifikasikan data cukup akurat. 1.2 Perumusan Masalah Permasalahan yang dijadikan obyek penelitian dan pengembangan Tugas Akhir ini adalah bagaimana mengimplementasikan dan menganalisis metode 1
2 Naive Bayesian Classifier untuk klasifikasi pada data mining dengan beberapa macam tipe atribut, missing value terhadap akurasi pengklasifikasian data. 1.3 Tujuan Berdasarkan pada masalah yang telah didefinisikan di atas, maka tujuan Tugas Akhir ini adalah: 1. Mengimplementasikan metode Naive Bayesian Classifier untuk mengklasifikasikan data 2. Menangani missing value pada atribut. 3. Menangani probabilitas nol yang mungkin terjadi pada data training. 4. Menangani penghitungan atribut continuous dengan menggunakan Gaussian Density Function dan pendiskretisasian dengan menggunakan Entropy Minimum Description Length (E-MDL) 5. Menghitung keakuratan pengklasifikasian data yang didahului dengan uji kebenaran terhadap model yang dibangun 6. Menganalisis perilaku Naive Bayesian Classifier terhadap akurasi pengklasifikasian data. 1.4 Batasan Masalah Dalam Tugas Akhir ini, batasan masalah yang digunakan untuk pembangunan klasifikasi menggunakan Naive Bayesian Classifier sebagai berikut : 1. Data yang akan dijadikan kajian berupa record dan terbagi menjadi 2 kelompok, yaitu data training dan data testing. 2. Data sudah tersimpan dalam database, user memilih data yang ingin diklasifikasikan. 3. Nilai dari suatu atribut independence terhadap nilai atribut lainnya. 4. Tidak membandingkan metode naive bayesian classifier dengan metode klasifikasi lain. 5. Tidak membahas mengenai statistika.
3 6. Tidak melakukan penanganan noise. 1.5 Metodologi Langkah langkah yang digunakan dalam merealisasikan tujuan dan pemecahan masalah di atas adalah : 1. Studi Literatur Mempelajari konsep-konsep klasifikasi data mining dan Naive Bayesian Classifier secara global yang diperoleh dari buku dan jurnal. 2. Pendalaman materi Mendalami materi yang akan digunakan yaitu konsep klasifikasi dan metode Naive Bayesian Classifier 3. Perancangan dan implementasi Merancang dan membangun perangkat lunak sebagai alat bantu dalam proses analisis. 4. Analisis dan Evaluasi Melakukan uji kebenaran pengklasifikasian data dengan menghitung akurasi. 1.6 Sistematika Penulisan Tugas Akhir ini disusun berdasarkan sistematika sebagai berikut : BAB I Pendahuluan Bab ini meliputi latar belakang, perumusan masalah, tujuan, batasan masalah, metodologi dan sistematika penulisan. BAB II Dasar Teori Bab ini memuat berbagai dasar teori yang mendukung dan mendasari penulisan Tugas Akhir ini yaitu mengenai konsep data mining, klasifikasi, dan Naive Bayesian Classifier BAB III Analisis dan Perancangan Sistem
4 BAB IV BAB V Dalam bab ini diuraikan tentang analisis, perancangan pembangunan perangkat lunak sebagai alat bantu dalam proses analisis. Implementasi dan Pengujian Bab ini memuat tentang analisis terhadap keakuratan pegklasifikasian data menggunakan metode Naive Bayesian Classifier dengan menggunakan beberapa macam tipe atribut. Kesimpulan dan Saran Bab ini berisi kesimpulan yang diambil dari pembahasan bab-bab sebelumnya serta saran-saran untuk pengembangan selanjutnya.
5