KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.

dokumen-dokumen yang mirip
Manfaat Pohon Keputusan

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

Penerapan Data Mining dalam Memprediksi Pembelian cat

BAB 2 LANDASAN TEORI

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

PRAKTIKUM KE-5 KLASIFIKASI I

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

Modul IV KLASIFIKASI

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret

APLIKASI PENENTUAN CALON PENDONOR DARAH MENGGUNAKAN METODE ALGORITMA ID3 ( STUDI KASUS PMI KOTA KEDIRI )

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA)

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

DECISION TREE BERBASIS ALGORITMA UNTUK PENGAMBILAN KEPUTUSAN

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse

BAB II LANDASAN TEORI

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Algoritma C4.5. Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1.

IMPLEMENTASI DATA MINING ALGORITMA C4.5 UNTUK MEMPREDIKSI PEMBAYARAN PINJAMAN PADA KOPERASI SIMPAN PINJAM PRIMKOVERI BINA BAKTI PEMALANG

4.1. Pengambilan Data

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru

BAB III ANALISIS DAN DESAIN SISTEM

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Supervised Learning Misalkan kita ingin membuat suatu program komputer yang ketika diberi gambar seseorang, dapat menentukan apakah orang dalam

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE

Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

BAB 2 LANDASAN TEORI

TINJAUAN PUSTAKA. Definisi Data Mining

PENERAPAN ALGORITMA C4.5 DALAM PENERIMAAN CALON KARYAWAN PT. TELKOM AKSES AREA LAMPUNG BERBASIS WEBSITE

PENGAMBILAN KEPUTUSAN UNTUK PENENTUAN BEASISWA TEPAT SASARAN MENGGUNAKAN METODE DECISION TREE DI SMK TARUNA BAKTI KERTOSONO

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

Kerusakan Barang Jadi

Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa

BAB I PENDAHULUAN 1.1 Latar Belakang

Algoritma Data Mining (2) Tugas Klasifikasi

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB I PENDAHULUAN 1.1 Latar Belakang

DIAGNOSA KETERLAMBATAN PERKEMBANGAN PADA ANAK BALITA DENGAN ACUAN DENVER II DAN PENGAMBIL KEPUTUSAN DENGAN METODE DECISION TREE BERBASIS JSP

Cara Membuat Mail Merge di Word 2010

BAB 1 PENDAHULUAN 1-1

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

BAB III METODE PENELITIAN

Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit

BAB III ANALISA DAN PERANCANGAN SISTEM

Mail Merge. Pembuatan Database Alamat

IMPLEMENTASI KNOWLEDGE DISCOVERY IN DATABASE (KDD) DALAM SERVICE LEVEL AGREEMENT (SLA) KLAIM PADA ASURANSI KESEHATAN

BAB 2 TINJAUAN PUSTAKA

Cara Membuat Mail Merge di Word 2007

BAB II TINJAUAN PUSTAKA

BAB III ANALISA DAN DESAIN SISTEM

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

MODUL 12 Model Prediktif

JURNAL IMPLEMENTASI ALGORITMA C4.5 DALAM PENENTUAN JURUSAN DI SMK PEMUDA PAPAR KEDIRI

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

Jurnal KomTekInfo Fakultas Ilmu Komputer, Volume 1, No. 2, Desember 2014 ISSN :

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN Latar Belakang

BAB III ANALISIS DAN DESAIN SISTEM

Burhanudin Junardi Karim Dr. Lintang Yuniar Banowosari, S.Kom., M.Sc

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

Belajar Mudah Algoritma Data Mining : C4.5

PENGAMBILAN POLA KELULUSAN TEPAT WAKTU PADA MAHASISWA STMIK AMIKOM YOGYAKARTA MENGGUNAKAN DATA MINING ALGORITMA C4.5.

Perencanan Pembuatan Game Anime MMORPG dengan pendekatan Penjualan Item mall untuk Player

Konsep Data Mining. Klasifikasi : Pohon Keputusan. Bertalya Universitas Gunadarma 2009

Petunjuk Instalasi Aplikasi

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom

PENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI PREDIKAT KEBERHASILAN MAHASISWA DI AMIK TUNAS BANGSA. Abstrak

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

IMPLEMENTASI DATA MINING UNTUK MENGETAHUI PERILAKU SESEORANG DALAM MEMBELI ALAT PANAHAN

a. Menyiapkan database

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

SATIN Sains dan Teknologi Informasi

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

PROGRAM BANTU SELEKSI AWAL DOSEN BERPRESTASI MENGGUNAKAN METODE ITERATIVE DICHOTOMISER 3

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

BAB 2 TINJAUAN PUSTAKA

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

OpenOffice Writer Aplikasi perkantoran OpenOffice.org Writer

Transkripsi:

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.1 Muhammad Syahril Program Studi Sistem Informasi, STMIK Triguna Dharma mhd.syahril@gmail.com ABSTRAK: Penyajian data untuk menghasilkan nilai informasi sering kali ditampilkan dalam bentuk tabulasi. Kalau data yang ditampilkan memiliki kapasitas kecil, mungkin tidak terlalu sulit untuk mencerna kandungan informasi tersebut. Tetapi bila data yang disajikan memiliki kapasitas yang sangat besar, dikhawatirkan adanya kendala untuk menyerap informasi secara tepat dan cepat. Hal ini dikarenakan bahwa dibutuhkan waktu yang cukup lama untuk membaca data yang ditampilkan secara rinci hingga akhir data. Data yang akan dibahas pada tulisan ini adalah berkaitan dengan data historis yang berisi tentang kriteria seorang pasien yang berpotensi penyakit hipertensi atau tidak. Data historis yang ditampilkan akan dikonversi menjadi bentuk sebuah pohon keputusan. Dengan demikian penyerapan informasi akan menjadi lebih mudah dan lebih cepat untuk dilakukan. Tulisan ini mengimplementasikan disiplin ilmu Data Mining menggunakan teknik Klasifikasi Pohon Keputusan serta diaplikasikan dengan tools Rapid Miner 4.1. Kata Kunci: Klasifikasi Pohon Keputusan, Rapid Miner 4.1 A. PENDAHULUAN Konsep Data Mining merupakan upaya menggali informasi yang terpendam dalam timbunan data yang berjumlah besar. Data mining bukanlah suatu bidang yang sama sekali baru. Salah satu kesulitan untuk mendefinisikan data mining adalah kenyataan bahwa data mining mewarisi banyak aspek dan teknik dari bidang-bidang ilmu yang sudah mapan terlebih dulu. Beberapa solusi yang dapat diselesaikan oleh Data Mining adalah dalam bidang pasar dan manajemen, keuangan, telekomunikasi, keuangan, astronomi dan bidang-bidang lainnya. Salah satu teknik Data Mining yang umum digunakan adalah Teknik Klasifikasi. Didalam Klasifikasi, ada beberapa metode klasifikasi yang digunakan, anatara lain: pohon keputusan, rule based, neural network, support vector machine, naive bayes, dan nearest neighbour. Dan pada kajian ini penulis akan menggunakan teknik pohon keputusan, karena beberapa alasan: 1. Dibandingkan dengan classifier JST atau bayesian, sebuah pohon keputusan mudah diinterpretasi/ ditangani oleh manusia. 2. Sementara training JST dapat menghabiskan banyak waktu dan ribuan iterasi, pohon keputusan efisien dan sesuai untuk himpunan data besar. 3. Algoritma dengan pohon keputusan tidak memerlukan informasi tambahan selain yang terkandung dalam data training (yaitu, pengetahuan domain dari distribusidistribusi pada data atau kelas-kelas). 4. Pohon keputusan menunjukkan akurasi klasifikasi yang baik dibandingkan dengan teknik-teknik yang lainnya. 103

B. POHON KEPUTUSAN Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat kuat. Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang mempresentasikan aturan. Aturan dapat dengan mudah dipahami dengan bahasa alami. Dan mereka juga dapat diekspresikan dalam bentuk bahasa basis data seperti Structured Query Language untuk mencari record pada katogori tertentu. Pohon keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Karena pohon keputusan memadukan antara eksplorasi data dan pemodelan, dia sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain. Proses pada pohon keputusan adalah mengubah bentuk data (tabel) menjadi model pohon, mengubah model pohon menjadi rule, dan menyederhanakan rule (Basuki & Syarif, 2003) Pohon Keputusan adalah struktur flowchart yang menyerupai tree (pohon), dimana setiap simpul internal menandakan suatu tes pada atribut, setiap cabang merepresentasikan hasil tes, dan simpul daun merepresentasikan kelas atau distribusi kelas. Alur pada Pohon Keputusan di telusuri dari simpul akar ke simpul daun yang memegang prediksi kelas untuk contoh tersebut. Pohon Keputusan mudah untuk dikonversi ke aturan klasifikasi (classification rules)(zalilia, 2007). Tinjauan pada kasus ini adalah bagaimana cara mengubah data historis menjadi sebuah pohon keputusan. Yang dapat memprediksi keputusan dalam hal penentuan apakah seseorang pasien baru berpotensi menderita hipertensi hanya dengan menentuan kriteriakriteria yang dibutuhkan saja. Tanpa harus melalui proses pemeriksaan yang memakan waktu. Tentunya dengan memanfaatkan Tools Rapid Miner untuk menetapkan sebuah pohon keputusan yang bersumber dari data historis, untuk keperluan pemeriksaan dimasa mendatang. C. KLASIFIKASI POHON KEPUTUSAN Klasifikasi adalah sebuah proses untuk menemukan model yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang kelasnya tidak diketahui (Tan et all, 2004). Di dalam klasifikasi diberikan sejumlah record yang dinamakan training set, yang terdiri dari beberapa atribut, atribut dapat berupa kontinyu ataupun kategoris, salah satu atribut menunjukkan kelas untuk record. D. ALGORITMA POHON KEPUTUSAN Banyak algoritma yang dapat dipakai dalam pembentukan pohon keputusan, antara lain ID3, CART, dan C4.5 (Larose,2005). Algoritma C4.5 merupakan pengembangan dari dari algoritma ID3 (Larose, 2005). Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut : a. Pilih atribut sebagai akar b. Buat cabang untuk tiap-tiap nilai c. Bagi kasus dalam cabang\ d. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama. Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atributatribut yang ada. Untuk menghitung gain digunakan rumus seperti tertera dalam persamaan berikut. Gain(S,A) = n Si Entropy(S) - * Entropy( Si) S Keterangan : i1 104

S : himpunan kasus A : atribut n : jumlah partisi atribut A Si : jumlah kasus pada partisi ke-i S : jumlah kasus dalam S Sementara itu, penghitungan nilai entropi dapat dilihat pada persamaan 2 berikut. Entropy (S) = n i1 - pi * log 2 pi Keterangan : S : himpunan kasus A : fitur n : jumlah partisi S pi : proporsi dari S i terhadap S E. MODEL KLASIFIKASI Model Klasifikasi terdiri dari (Tan et all, 2006): 1. Pemodelan Deskriptif yaitu dapat bertindak sebagai suatu alat yang bersifat menjelaskan untuk membedakan antara objek dengan kelas yang berbeda. 2. Pemodelan Prediktif dimana model klasifikasi juga dapat menggunakan prediksi label kelas yang belum diketahui recordnya. F. TUJUAN KLASIFIKASI Tujuan dari klasifikasi adalah untuk dapat menjelaskan sebagai berikut: 1. Menemukan model dari training set yang membedakan record kedalam kategori atau kelas yang sesuai, model tersebut kemudian digunakan untuk mengklasifikasikan record yang kelasnya belum diketahui sebelumnya pada test set. 2. Mengambil keputusan dengan memprediksikan suatu kasus, berdasarkan hasil klasifikasi yang diperoleh. G. KONSEP DATA DALAM POHON KEPUTUSAN Konsep data dalam pohon keputusan diberikan seperti pada Gambar 1, yakni sebagai berikut: 1. Data dinyatakan dalam bentuk tabel dengan atribut dan record. 2. Atribut menyatakan suatu parameter yang dibuat sebagai kriteria dalam pembentukan tree. Misalkan untuk menentukan seorang pasien berpotensi menderita hipertensi, kriteria yang diperhatikan adalah berat bedan, usia dan jenis kelamin. Salah satu atribut merupakan atribut yang menyatakan data solusi per-item data yang disebut dengan target atribut. 3. Atribut memiliki nilai-nilai yang dinamakan dengan instance. Misalkan atribut berat badan mempunyai instance berupa overweight, average dan underweight Gambar 1. Konsep Pohon Keputusan H. KOMPOSISI POHON KEPUTUSAN Sebagaimana sebuah pohon, komposisi Pohon Keputusan terdiri dari beberapa bagian yang disebut dengan simpul. Adapun pohon keputusan tersebut mempunyai 3 tipe simpul yaitu (Zalilia, 2007): 1. Root Node atau simpul akar dimana tidak ada masukan edge dan nol atau lebih keluaran edge (tepi), 2. Internal Node atau simpul internal, masingmasing memiliki satu masukan edge dan 2 atau lebih edge keluaran, 3. Leaf Node atau simpul daun disebut juga sebagai simpul akhir, masing-masing memiliki satu masukan edge dan tidak ada edge keluaran. 105

Pada Pohon Keputusan (Gambar 2) setiap simpul daun menandai label kelas. Simpul yang bukan simpul akhir terdiri dari akar dan simpul internal yang terdiri dari kondisi tes atribut pada sebagian record yang mempunyai karakteristik yang berbeda. Simpul akar dan simpul internal ditandai dengan bentuk oval dan simpul daun ditandai dengan bentuk segi empat (Han, 2001). J. TRANSFORMASI DATA Tools Rapid Miner tidak meminta format data asli (*.xls) sebagaimana yang disiapkan di atas, melainkan membutuhkan format data yang lebih mudah diproses kedalam sistem aplikasinya. Format yang dimaksud adalah comma separated value atau *.csv. Oleh karena itu kita perlu mengubah format hipertensi.xls di atas menjadi hipertensi.csv K. INSTALASI TOOLS DATA MINING RAPID MINER Setelah ketersediaan data training dengan format yang diminta sudah dapat disiapkan, maka pastikan pula Tools Rapid Miner sudah terinstalasi secara baik. Gambar 2. Komposisi Pohon Keputusan I. PENYIAPAN DAN PENGOLAHAN DATA TRAINING Hal yang terpenting dalam penyelesaian kasus Pohon Keputusan adalah ketersediaan data training atau data histori. Untuk sampel kasus, penulis mencoba untuk memilih kasus hipertensi. Adapun data training yang dipakai adalah dalam format Microsoft Excel diberian pada Tabel 1 berikut. L. BEKERJA DENGAN RAPID MINER 4.0 Bukalah Tools Aplikasi Rapid Miner 4.0 yang telah diinstalasi kemudian ikuti panduan berikut : Tampilan interface dari Rapid Miner wizard adalah sebagai berikut (Gambar 3). Setelah Aplikasi Rapid Miner 4.1 sudah aktif, Klik Menu File pilih Wizard Tabel 1. Data Training: Hipertensi.xls 106 Gambar 3. Interface Wizard Rapid Miner Pada tampilan jendela wizard di atas, kita diberitahu tentang tahapan atau step yang akan dilakukan untuk memproses data

berdasarkan prosedur standar yang disiapkan oleh Tools Rapid Miner, kita cukup memilih tombol Next Tahapan yang muncul berikutnya adalah Please Specify a Data File pada kotak dialog Example Source Wizard (Gambar 6). Disini kita diminta untuk memanggil data training yang sudah kita siapkan di awal yaitu file hipertensi.csv. Pilihlah tombol Choose untuk menetapkan nama dan alamat file hipertensi.csv dimaksud. Gambar 4. Wizard Memilih Template Jendela yang muncul berikutnya adalah jendela wizard Select Template (Gambar 4). Pada kotak dialog ini Pilihlah opsi Data Input + Pohon Decision Learning. Kemudian kembali pilih tombol Next untuk melanjutkan. Gambar 6. Pemanggilan Data Training Setelah nama dan alamat file data training (hipertensi.csv) ditampilkan maka langkah berikutnya adalah mengklik Next untuk memulai melakukan pengaturan data training. Selanjutnya akan muncul kotak dialog berikut (Gambar 7). Gambar 5. Pengaturan Setting Data Training Selanjutnya akan muncul kotak dialog wizard Make Setting (Gambar 5). Tahap ini akan membawa kita pada proses pengaturan konfigurasi data training sehingga data yang kita siapkan tersebut dapat diproses oleh sistem Rapid Miner. Untuk memulainya Klik Tombol Start Configuration Wizard..., maka akan muncul kotak dialog Welcome To Example Source Wizard, klik tombol Next untuk melanjutkan. Gambar 7. Penentuan Jenis Pemisah Data Field Pada kotak dialog diatas kita diminta untuk menentukan tanda pemisah terhadap field data training (hipertensi.csv). Pada kasus ini kita cukup memilih separated by, yaitu opsi yang kedua yang menandakan bahwa 107

file data training yang kita siapkan adalah berformat comma separated value. Untuk melanjutkan klik tombol Next. Centang atau tandai pada pilihan Use First Row For Column Names, agar baris pertama dari data training dijadikan sebagai judul kolom. Klik Next untuk melanjutkan. tipe attribut. Sedangkan untuk kolom Hipertensi pilih tipe label seperti yang ditunjukkan oleh gambar di atas. Kembali Klik Next untuk melanjutkan. Setelah konfigurasi data dilakukan maka tahap selanjutnya adalah menyimpan data training berikut konfigurasi yang telah dilakukan tersebut ke dalam sebuah nama file baru yang berformat *.aml. Misalnya hipertensi.aml Klik Finish pada kotak dialog yang muncul untuk menegaskan nama file yang telah kita tentukan. Gambar 8. Penentuan Type Atribut Data Pada kotak dialog Please specify the attribute value types. (Gambar 8), aturlah type data untuk setiap atribut dan kolom dengan pilihan string (teks kalau bertipe data huruf) kemudian Klik tombol Next untuk melanjutkan. Pada kotak dialog yang muncul berikutnya, Pilihlah tombol... Pada input Attribut untuk membuka file *.aml (hipertensi.aml) yang telah kita buat sebelumnya. Secara umum Rapid Miner menyimpan data yang telah kita konfigurasi diatas ke dalam alamat berikut : C:\Program Files\Rapid- I\RapidMiner-4.x \ hipertensi.aml Maka bukalah file yang diminta (hipertensi.aml) dengan memiilih tombol Open pada kotak dialog yang aktif. Selanjutnya klik tombol Finish Gambar 9. Penentuan Tipe Data Atribut Pada kotak dialog diatas (Gambar 9), kita diminta untuk mengatur tipe data untuk semua kolom yang ada. Untuk kolom Nama Pasien pilihlah tipe data Id, untuk kolom Berat Badan, Usia dan Jenis Kelamin Pilih 108 Berikutnya kita akan dibawa ke halaman depan Rapid Miner. Klik Tombol checklist warna hijau pada panel atas, untuk mem validasi operator dan pengaturan yang telah di buat. Pastikan muncul tulisan Process Ok pada panel bawah status. Klik Tombol F5 pada keyboard untuk melihat hasil aplikasi Sebelum hasil ditampilkan biasanya selaku muncul pesan untuk menyimpan hasilnya yang akan ditampilkan dalam bentuk file baru yang berformat *.xml. Pilih tombol YES untuk menyimpan hasil output dalam bentuk *.xml (yaitu : hipertensi.xml)

Perhatikan lokasi penyimpanan yaitu lokasi default Rapid Miner, klik save untuk mengakhiri langkah penyimpanan, dan melihat hasil pohon keputusan dari data training yang telah diteliti. Berikut hasil akhir data training studi kasus klasifikasi penyakit hipertensi yang telah diubah menjadi berupa pohon keputusan yang mudah difahami, dapat dilihat pada Gambar 10. Gambar 10. Hasil Konversi Data Training Menjadi Pohon Keputusan N. DAFTAR PUSTAKA Jogiyanto H. M. 1999. Analisa dan Desain. Yogyakarta: Andi Offset. Kusrini, Emha Taufiq Luthfi. 2009. Algoritma Data Mining. Yogyakarta : Penerbit Andi Kusrini. 2008. Aplikasi Sistem Pakar, Yogyakarta: Penerbit Andi. ----. 2006. Sistem Pakar Teori dan Aplikasi. Yogyakarta: Penerbit Andi. Larose, Daniel T. 2005. Discovering Knowledge in Data: An Introduction to Data Mining. John Willey & Sons, Inc. Laboratorim Data Mining. 2011. Klasifikasi Decision Tree dalam http://datamininglab.com. Yogyakarta : Fakultas Teknologi Industri Universitas Islam Indonesia Rapid Miner4.1 manual Santosa, Budi. 2007. Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis: Teori dan Aplikasi. Yogyakarta : Graha Ilmu Susanto, Sani., dan Suryadi, Dedi. 2010. Pengantar Data Mining: Menggali Pengetahuan Dari Bongkahan Data. Yogyakarta : Andi M. SIMPULAN Data yang ditampilkan dalam bentuk pohon keputusan lebih mudah dan cepat untuk difahami dibandingkan bila data disajikan dalam bentuk tabulasi. Rapid Miner 4.1 berperan cukup baik dalam mengkonversikan data training yang ada. Sehingga walaupun data yang dikonversikan dalam bentuk sebuah pohon keputusan berasal dari data yang sangat besar, namun pada dasarnya nilai kandungan data yang ditampilkan punya kecenderungan memiliki pola yang dapat menghasilkan data yang cukup informatif. 109