IMPLEMENTASI DATA MINING ROUGH SET DALAM MENENTUKAN TINGKAT KERUSAKAN ALAT DAN BAHAN KIMIA (STUDI KASUS DI LABORATORIUM RESEP SMK S-16 FARMASI BENGKULU) Oleh : Marnis Nasution, S.Kom, M.Kom Dosen Prodi Manajemen Informatika, AMIK LABUHANBATU Rantauprapat, Medan, Email : nenis@yahoo.com ASBTRACT Data mining is one of the methods used in extracting the data in generating new knowledge from stored data. The extent of damage to the equipment and chemicals that affect the cost of school often do not know how much it cost the school. With data mining that generates knowledge in the form of some rules and help the school to predict the extent of damage and the cost of chemicals that can be in. Keywords : Data mining, Rough sets, Rosetta, replacement tools and chemicals. I. PENDAHULUAN 1.1 Latar Belakang Masalah Datamining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Salah satu contohnya adalah mengektraksi dari data yang tidak lengkap. Menurut Jerzi (2003), dataminingroughset tetap dapat menggali pengetahuan di dalam sebuah database walaupun data tersebut tidaklah lengkap. Ada dua langkah yang diambil dalam menangani data yang tidak lengkap, pertama data tidak lengkap dibiarkan sehingga pada tabel keputusan hanya rule yang terisi yang mempengaruhi keputusan akhir sedangkan langkah kedua adalah data yang kosong dicari nilai terendah atau tertingginya yang ditentukan dari tabel keputusan. 1.2 Perumusan Masalah 1 Bagaimana menentukan tingkat kerusakan alat dan bahan pada Laboratorium Resep SMK S-16 Farmasi Bengkulu? 2 Bagaimana menentukan tingkat kerusakan alat dan bahan kimia pada Laboratorium Resep SMK S-16 Farmasi Bengkulu dengan menggunakan Rosetta? 3 Bagaimana penerapan dataminingroughset dalam menentukan tingkat kerusakan alat dan bahan kimia? 1.3 Batasan Masalah Menganalisaan tingkat kerusakan alat dan bahan kimia pada Laboratorium Resep SMK S-16 Farmasi Bengkulu. Metode yang digunakan adalah roughset dan diimplementasikan pada Rosetta. II. LANDASAN TEORI 2.1 Knowledge Discovery in Database (KDD) Knowledge discovery in database (KDD) adalah penerapan metode saintifik pada data mining. Dalam konteks ini data mining merupakan satu langkah dari proses KDD (Herawati, 2013). 2.2 Definisi Data Mining Datamining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Datamining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machinelearning untuk mengektrasi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar (kusrini dan Luthfi, 2009). 2.3 Rough Set Teori Rough Set merupakan salah satu teknik yang dirasa cukup efisien untuk Knowledge Discovery in Database (KDD) 1
proses dan Data Mining. Data mining merupakan serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data. 2.4 Information System Tabel 2.1 Informiation System Nama barang Lama pakai (tahun) Tingkat kerusakan(%) Nam a bara ng A 2 50 Lama Tingkat Keputusan pakai kerusak (tahun an (%) ) A 2 50 Diperbaiki B 3 66 Diperbaiki Equivalen Class Tabel 2.3 Equivalen Class A B C EC1 2 50 Diperbaiki EC2 3 66 Diperbaiki EC3 1 39 Layak dipakai EC4 1 51 Diperbaiki EC5 3 75 Diganti Discerniblity Matrix Tabel 2.4 Discernibility Matrix EC1 EC2 EC3 EC4 EC5 EC1 - A AB A AB EC2 A - AB A B EC3 AB AB - B AB EC4 A A B - AB EC5 AB B AB AB - Discernibility Matrix Modulo D Tabel 2.5 Discernibility Matrix Modulo D EC1 EC2 EC3 EC4 EC5 EC1 - - AB - AB EC2 - - AB - B EC3 AB AB - B AB EC4 - - B - AB EC5 AB B A AB - B 3 66 C 1 39 D 1 51 E 3 75 F 2 50 G 1 51 Decision System Tabel 2.2 Decision System C 1 39 Layak dipakai D 1 51 Diperbaiki E 3 75 Diganti F 2 50 Diperbaiki G 1 51 Diperbaiki Reduct Clas s Tabel 2.6 Reduct CNF of Boolean Prime Implican t Reduct E1 (A B) (A B) {A},{B } E2 (A B) (B) (B) {B} E3 (A B) (B) (B) {B} E4 (B) (A B) (B) {B} E5 (A B) (B) ( A) Generating rule (A B) {A},{B } Berikut contoh rule yang didapat dari reduct diatas: A2,B2 C1 If A=2 And B=2 Then C=1 If lama pakai=2 tahun And tingkat kerusakan= 50%-74% Then barang layak pakai. B2 C1 If B=2 Then C=1 If tingkat kerusakan= 50%-74% Then barang diperbaiki. B1 C2 B=1 Then C=2 If tingkat kerusakan= 0%-69% Then barang layak pakai. A3,B3 C3 2
If A=3 And B=3 Then C=3 If lama pakai=3 tahun And tingkat kerusakan= 75%-100% Then barang diganti. III. PEMBAHASAN 3.1 Kerangka Kerja 3.2 Arsitektur Sistem Mendefinisikan Ruang Lingkup Masalah Menganalisa Masalah Menentukan Tujuan Mempelajari Literatur Mengumpulkan Data Menganalisa Teknik Pengolahan Data Dengan Teknik Artifical Intelligen Rough Set Mengimplementasi proses Rough Set Menggunakan Software Rosetta Menguji Hasil Penelitian Menghasilkan Kesimpulan Gambar 3.1 Arsitektur Penyelesaian Rough Set 3.3 Pengumpulan Data Metode pengumpulan data yang digunakan adalah pengamatan langsung di Laboratorium Resep SMK S-16 Kota Bengkulu. Selain melakukan pengamatan juga dilakukan wawancara kepada pihak-pihak yang terkait dengan penelitian ini. juga melakukan pengambilan sampel laporan inventaris Laboratorium Resep selama dua tahun guna menunjang penelitian ini NAMA RAK OBAT PANCI PILLEN PLANK STAMPER (KECIL) AYAKAN TIMBANGAN GRAM PEMADAM API GELAS UKUR 500 ml GELAS UKUR 100 ml KOMPUTER Tabel 3.1 Information System 3.4 Equivalen Class EC1 EC2,1 EC2,2 EC3 EC4 EC5 EC6 EC7 EC8 BAHAN LAMA PAKAI JUMLAH BRG LAMA LAMA 2 LAMA SEDANG 1 LAMA SEDANG 1 RUSAK BARU 4 CUKUP SEDANG 2 LAMA SEDANG 2 LAMA SEDANG 1 RUSAK BARU 2 RUSAK BARU 3 CUKUP SEDANG 1 Tabel 4.2 EquivalenClass A B C D LAMA LAMA 2 3 LAMA SEDANG 1 4 LAMA SEDANG 1 0 RUSAK BARU 4 1 CUKUP SEDANG 2 3 LAMA SEDANG 2 3 RUSAK BARU 2 0 RUSAK BARU 3 2 CUKUP SEDANG 1 4 3
Discernibility Matrix Tabel 4.2 DiscernibilityMatrix EC2 EC3 EC4 EC5 EC6 EC7 EC8 EC1 X BC ABC AB B AB ABC ABC EC2 BC X ABC AC C ABC ABC A EC3 ABC ABC X ABC ABC C C ABC EC4 AB AC ABC X X AB ABC C EC5 B C ABC X X AB ABC AC EC6 AB ABC C AB AB X C ABC EC7 ABC ABC C ABC ABC C X ABC EC8 ABC A ABC C AC ABC ABC X 3.5 Discernilibily Matrix Modulo D Tabel 4.3 Discernibility Matrix Modulo D EC1 EC2 EC3 EC4 EC5 EC6 EC7 EC8 EC1 X BC ABC X X AB ABC ABC EC2 BC X ABC AC C X ABC X EC3 ABC ABC X ABC ABC C C ABC EC4 X AC ABC X A AB ABC C EC5 X C ABC A X AB ABC AC EC6 AB X C AB AB X C ABC EC7 ABC ABC C ABC ABC C X ABC EC8 ABC X ABC C AC ABC ABC X 3.6 Reduct Tabel 4.4 Reduct Class CNF of Boolean Fungtion Prime Implican Reduct t EC1 (B C)^(A B C)^(A C)^ B {B} C^A EC2 (B C)^(A B C)^(A C)^ C^A {A,C} C^A EC3 (A B C)^C C {C} EC4 (A B)^(A C)^(A B C)^ A^C {A,C} A^C EC5 B^C^(A B C)^A^(A B)^ B^C^A {A,B,C} (A C) EC6 (A B)^(A B C)^C (A B)^ {A,C},{B, C C} EC7 (A B C)^C C {C} EC8 (A B C)^A^C^(A C) A^C {A,C} 4 3.7 General Rule {B} = {lama pakai} If lama pakai= lama Then kerusakan=17%-71% If lama pakai= sedang Then kerusakan= >28% or 0% or 26%-28% If lama pakai= baru Then kerusakan = 2% or 3%-25% {A,C} = {bahan, jumlah barang} If bahan= tahan lama And jumlah barang=11-16 Then Kerusakan 17%-71% If bahan= tahan lama And jumlah barang=1-10 Then Kerusakan 71% or 0% If bahan= mudah rusak And jumlah barang= >28 Then Kerusakan 2% If bahan= cukup tahan And jumlah barang=11-16 Then Kerusakan 17%-71% If bahan= mudah rusak And jumlah barang=3-25 Then Kerusakan 0% If bahan= cukup tahan And jumlah barang= 2 Then Kerusakan 71% If jumlah barang= 3-25 Then kerusakan 17%- 71% or 0% If jumlah barang= 2 Then kerusakan 71% or 0% If jumlah barang= >28 Then kerusakan 1%- 10% If jumlah barang= 26-28 Then kerusakan 11%- 16% {A,B,C}={bahan, lama pakai, jumlah barang} If bahan= tahan lama And lama pakai= lama And jumlah barang= 3-25 Then kerusakan = 17%-71% If bahan= tahan lama And lama pakai= sedang And jumlah barang= 2 Then kerusakan = 71% or 0% If bahan= mudah rusak And lama pakai= baru And jumlah barang= > 28 Then kerusakan = 1%-10% If bahan= cukup tahan And lama pakai= sedang And jumlah barang= 3-25 Then kerusakan = 17%-71%
If bahan= tahan lama And lama pakai= sedang And jumlah barang= 3-25 Then kerusakan = 17%-71% If bahan= mudah rusak And lama pakai= baru And jumlah barang= 3-25 Then kerusakan = 0% If bahan= mudah rusak And lama pakai= baru And jumlah barang= 26-28 Then kerusakan = 11%-16% If bahan= cukup tahan And lama pakai= sedang And jumlah barang= 2 Then kerusakan = 71% {B,C} = {lama pakai, jumlah barang} If lama pakai= lama And jumlah barang = 26-28 Then kerusakan= 17%-71% If lama pakai= sedang And jumlah barang = 2 Then kerusakan= 71% or 0% If lama pakai= baru And jumlah barang = >28 Then kerusakan= 1%-10% If lama pakai= sedang And jumlah barang = 3-25 Then kerusakan= 17%-71% If lama pakai= baru And jumlah barang = 26-28 Then kerusakan= 0% If lama pakai= baru And jumlah barang = >28 Then kerusakan= 11%-16% IV. PENGUJIAN 4.1 Teknik Pengujian Proses pengujian dilakukan untuk mendapatkan data mengenai kelayakan alat dan bahan kimia pada Laboratorium Resep SMK S- 16 Kota Bengkulu dan guna mendapatkan tingkat kerusakan pada tiap-tiap alat. Proses pengujian ini dilakukan menggunakan alat bantu perangkat lunak Rosetta. Dalam menggunakan sofware Rosetta data dalam bentuk Decision System disimpan ke dalam Software Microsof Excel seperti gambar 4.1: Gambar 4.1 Data Pada Microsof Excel Data yang digunakan berasal dari laporan inventaris pada tahun 2012 dan tahun 2013 untuk menguji banyak data. Data yang sebelumnya berbentuk laporan kemudian diubah dalam bentuk Decision System dan dibuat ke bentuk Microsof Excel, data yang telah berbentuk xls nantinya akan dimport ke dalam SoftwareRosetta. Data tersebut memiliki tiga variabel yaitu bahan, lama pakai dan jumlah barang, setiap field memiliki satu variabel keputusan. Data tersebut adalah dasar awal dalam pembuatan Rule-rule yang akan membantu dalam pengambilan keputusan. 4.2 Tampilan Hasil Program 1. Menu Utama Menu utama dapat dikatakan sebagai antar muka (Use Interface) antara User dengan program. Menu utama menampilkan pilihan menu yang tersedia pada program. Pada Rosseta terdapat lima pilihan yaitu menu File, Edit, View, Window dan Help. 2. Form New Projek Form New Projek merupakan tempat di mana Projek akan dikerjakan. Di sinilah akan dimulai langkah-langkah pengerjaan untuk memperoleh rules yang dibutuhkan. 3. Open Database / Information System Langkah selanjutnya adalah membuka database yang sebelumnya telah dibuat dalam bentuk Microsof Excel dengan sajian Decision System. Untuk membuka data tersebut dengan mengklik kanan pada stuctures dan pilih ODBC, maka akan tambil kotak dialog ODBC import. Kemudian pilih Open database dan pilih bentuk file Excel File, setelah itu pilih databese yang sebelumnya telah dibuat kemudian klik OK. 5
maka akan muncul Reduct- double klik nya. Gambar 4.2 Form Pilih Database 4. Decision System Berikutnya adalah Decision System, yaitu data yang telah dibuat dapat ditampilkan dengan cara klik tanda (+) pada maka akan ada muncul, lalu double klik, maka akan data yang telah dimasukkan ke dalam Rosetta Gambar 4.3 Form DecisionSystem a. Reduct Pada Proses Reduct data akan dideklarasikan dan dikombinasikan untuk mendapatkan GenerateRulenya. Langkahlangkah untuk menghasilkan reduct dimulai dengan meng-klik kanan pada kemudian pilih Reduct lalu pilih Dynamic Reduct lalu klik OK. Gambar 4.5 FormReduct Dari hasil pencarian Software Rosetta dihasilkan tiga Reduct yang merupakan dasar dalam pembuatan Rule-rule. Reduct ini adalah hasil atribut minimal dari atribut kondisi yang sebelumnya telah disederhanakan menggunakan prime implicant fungsi boolean. Tiga reduct ini akan dicari rulenya disesuaikan data yang diimportkan awalnya. Support merupakan banyaknya kondisi reduct yang sesuai dengan data yang awalnya dimasukkan sedangkan length adalah panjang Reduct. b. Generate Rule Yang terakhir adalah proses menampilkan Generate Rule. Yang pertama klik kanan pada kemudian pilih Generate Rule lalu klik OK. 4.4 Pilihan Reduct Gambar Gambar 4.6 Pilih GenerateRule Selanjutnya klik tanda (+) maka akan muncul, kemudian double klik maka akan muncul Ruleyang dihasilkan. Kemudian klik tanda (+) pada sehingga akan muncul, selanjutnya 6
Gambar 4.7 FormGenerateRule Output Yang Dihasilkan Dalam percobaan mengunakan Rosetta ini menghasilkan output berupa rulerule, berikut hasil output-nya: IF bahan(mudah rusak) AND jumlah(3) OR kerusakan(2) IF bahan(mudah rusak) AND jumlah(1) IF bahan(tahan lama) AND jumlah(3) IF bahan(tahan lama) AND jumlah(4) bahan(mudah rusak) AND jumlah(4) OR kerusakan(1) IF bahan(mudah rusak) AND jumlah(2) OR kerusakan(4) IF bahan(tahan lama) AND jumlah(2) OR kerusakan(3) IF lama pakai(baru) AND jumlah(3) OR kerusakan(2) IF lama pakai(baru) AND jumlah(2) OR kerusakan(4) IF lama pakai(baru) AND jumlah(1) IF lama pakai(sedang) AND jumlah(2) IF lama pakai(lama) AND jumlah(1) IF lama pakai(lama) AND jumlah(3) IF lama pakai(lama) AND jumlah(2) => kerusakan(3) OR kerusakan(0) IF lama pakai(sedang) AND jumlah(4) IF lama pakai(baru) AND jumlah(4) OR kerusakan(1) IF bahan(tahan lama) AND lama pakai(sedang) AND jumlah(1) OR kerusakan(4) OR kerusakan(3) IF bahan(cukup tahan) => kerusakan(0) IF bahan(mudah rusak) => kerusakan(0) OR kerusakan(2) OR kerusakan(4) OR kerusakan(1) IF bahan(mudah rusak) AND lama pakai(sedang) IF jumlah(4) OR kerusakan(1) IF jumlah(2) OR kerusakan(3) OR kerusakan(4) IF jumlah(3) OR kerusakan(2) IF lama pakai(lama) OR kerusakan(3) IF lama pakai(baru) OR kerusakan(2) OR kerusakan(4) OR kerusakan(1)p 4.3 Hasil Pengujian Pada Proses pengujian menggunakan Software Rosetta, dihasikan Rule-Rule yang sesuai dengan variabel yang didapat dari laporan inventaris sekolah. Rule-Rule tersebut yang nantinya akan menjadi alat bantu dalam proses penggantian alat dan bahan kimia Pada Laboratorium Resep. Rule-rule tersebut akan digunakan dalam pengambilan keputusan apakah alat tersebut akan diganti, diperbaiki atau layak pakai. Proses keputusan yang dulunya diambil langsung oleh pakar dari alat dan bahan kimia yang merupakan kepala Laboratorium Resep, kini dapat dilakukan siapa saja yang bertugas mengganti alat dan bahan kimia. Sehingga tidak lagi ada ketergantungan dengan adanya kepala Laboratorium Resep. Rule-rule yang dihasilkan akan menuntun para pekerja yang mengganti alat dalam mengambil keputusan. Ketidakhadiran kepala Labor Resep tidak akan lagi menjadi halangan dalam proses penggantian alat dan bahan kima pada Laboratorium Resep SMK S- 16 Kota Bengkulu. 7
4.4 Perbandingan Sistem Lama dengan Sistem Baru 1. Untuk pencarian informasi Pada sistem yang lama pencarian informasi memakan waktu lama, karena bentuk laporan yang dibuat kepala Laboratorium Resep tidak memuat data yang lengkap dan terperinci sehingga akan membuat kesulitan dalam menentukan penggantian alat dan bahan kimia pada Laboratorium Resep. Dengan sistem yang baru ini keputusan penggantian alat dan bahan kimia tidak akan memakan waktu yang lama karena sudah tersedianya rule-rule yang membantu dalam proses menentukan persentase kerusakan pengambilan keputusan penggantian alat dan bahan kimia di Laboratorium Resep. 2. Pengolahan Data Dengan dirancang suatu teknik pengolahan data yang dapat diolah secara komputerisasi maka pengolahan datanya dapat dilakukan dengan cepat, dibandingkan dengan pengolahan data yang tidak menggunakan suatu teknik tertentu, walaupun pengolahan datanya sudah memakai komputer. Apalagi kalau pengolahan data dalam penentuan kelayakan dilakukan secara manual bahkan tidak menggunakan suatu teknik tertentu, seperti yang dikerjakan selama ini. V. PENUTUP 5.1 Kesimpulan 1. Tingkat kerusakan alat dan bahan kimia yang pasti terjadi akan terdeteksi dengan rule-rule yang dihasilkan oleh metode rough set dan dengan dapat dilihatnya presentase kerusakannya pihak sekolah dapat membuat rancangan untuk proses penggantian alat dan bahan serta sekolah dapat menghitung kapan masa alat dan bahan kimia tersebuat akan diganti. 2. Data mining rough set menggunakan variabel-variabel penting yang berhubungan dengan alat dan bahan kimia seperti bahan, lama pakai dan kondisi. Dari tiga variabel ini data mining rough set akan menghasilkan reduct yang merupakan hasil atribut minimal yang telah diseleksi, dari hasil reduct tersebut dapat menghasilkan rule yang dapat membantu memperlihatkan presentase kerusakan alat dan bahan kimia pada Laboratorium Resep SMK S-16 Farmasi Bengkulu. 3. Data yang berasal dari laporan inventaris laboratorium resep SMK S-16 Farmasi Bengkulu yang kemudian diproses di Software Rosetta akan menghasilkan rulerule. Rule-rule tersebut akan memperlihatkan berapa persentase kerusakan alat dan bahan kimia pada Laboratorium Resep SMK S-16 Farmasi Bengkulu. 5.2 Saran Dari hasil pembuatan tesis ini penulis dapat menyampaikan saran-saran: 1. Untuk membuat sebuah keputusan yang cukup tinggi tingkat keakuratannya maka dapat digunakan terknik Artificial Intellignt Rough Set. 2. Untuk mengolah data dalam kapasitas besar, selain menggunakan Software Rosset dapat menggunakan Software Rough Set lainnya. 3. Untuk penulis selanjutnya disarankan agar dapat membandingkan metode pengambilan keputusan dengan menggunakan teknik Artificial Intelligent Rough Set ini dengan teknik lain DAFTAR PUSTAKA Angga Ginanjar Mabrur dan Riani Lubis. (2012). Penerapan Data mining Untuk Memprediksi Kriteria Nasabah Kredit Jurnal Komputer dan Informatikan (KOMPUTA). Edisi 1. Volume 1. Durairaj M. dan Sathyavathi T. (2013). Applying Rough Set for Medical Informatics Data Analysis International Journal of Scientific Research in Biological Science. Volume 1. Issue 1. Eko Nur Wahyudi. (2013). Teknik Klasifikasi untuk Melihat Kecenderungan Calon Mahasiswa Baru dalam Memilih Jenjang Program Studi di Perguruan 8
Tinggi Jurnal Teknologi Informasi DINAMIK. Volume 18. No. 1. Andika Praja. Aplikasi Data Mining untuk Perbandingan Manajemen Laba Terhadap Persistensi Pada Perusahaan Perbankan yang Go Publik di Bursa Efek Indonesia ISSN 1693-2617. Menterikesehatan republic Indonesia peraturanmenterikesehatan republic Indonesia no 284/MENKES/PER/III/2007 Herawati, Fajar Astuti. 2013. Data Mining. Yogyakarta. Andi. Imay, Shinya. et.al. (2008). Rough Sets Approach to Human Resource Development of Information Technology Corporations IJSSST. Volume 9. No.2. Mujib, Ridwan. et.al. (2013). Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Neive Bayes Classifier Jurnal EECCIS volume 7. No.1. Dian Wirdasari. (2011). Penerapan Data Mining UntukMengolah Data penempatanbuku di perpustakaansmktipab 7 lubukpakamdenganmetode association rule. A.S.Salama (2011). Some Topological Properties of Rough Set with Tools for Data Mining IJCSI. Volume 8. No.2. Mohammad Rizal Ariefdan Daniel o Siahaan. 2010. Klasterisasiteksmenggunakanmeto demax max Roughness (MMR) denganpengayaansimilaritas kata. Sarjon Defit. (2007). Peranan Diskretisasi Data Dalam Menambang Rule Asosiasi Dari Databese Prosiding Seminar Nasional Sistem & Teknologi Informasi (SNASTI). Susanto, Sani dan Dedy Suryadi. 2010. Pengantar Data Mining: Menggali Pengetahuan Dari Bongkahan Data. Yogyakarta. Andi. W, Jerzy. (2003). Rough Set Statrgies to Data with Missing Attribut Value IEE. 56-63. Wanqing, Li. et.al. (2010). Data Mining Based on Set in Risk Decision-making: Foundation and Application ISSN: 1109-2750. YudhoGiriSucahyo. 2003. MenggaliInfomasi yang terpendam. W, Jerzy. (2003). Rough Set Statrgies to Data with Missing Attribut Value IEE. 56-63. Widodo, Prabowo Pudjo et.al. 2013. Penerapan Data Mining Dengan Matlab. Bandung. Rekayasa Sains 9