APLIKASI DATA MINING DENGAN METODE CLASSIFICATION BERBASIS ALGORITMA C4.5

dokumen-dokumen yang mirip
JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

JURNAL IMPLEMENTASI ALGORITMA C4.5 DALAM PENENTUAN JURUSAN DI SMK PEMUDA PAPAR KEDIRI

RANCANG BANGUN APLIKASI DATA MINING ANALISIS TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus Di Politeknik Negeri Malang)

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

Model Aplikasi Penentuan Jenis Beasiswa Berbasis Algoritma K-NN Termodifikasi

dengan harga jual yang lebih rendah. Sedangkan diskon atau potongan harga adalah pengurangan harga langsung dari suatu produk yang dilakukan dalam

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Manfaat Pohon Keputusan

BAB 2 LANDASAN TEORI

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

Keyword : C 4.5 algorithm, Decision Support System, Selection Employees Candidate

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

Klasifikasi Penerima Bantuan Kredit Koperasi Dengan Metode ID3

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

Penerapan Data Mining Penjualan Sepatu Menggunakan Metode Algoritma Apriori

PENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI PREDIKAT KEBERHASILAN MAHASISWA DI AMIK TUNAS BANGSA. Abstrak

Keywords: C4.5 algorithm, Decision Supporting System, Fixing Employee Salary Increase

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

PERBANDINGAN ALGORITMA APRIORI DAN ALGORITMA FP-GROWTH UNTUK PEREKOMENDASI PADA TRANSAKSI PEMINJAMAN BUKU DI PERPUSTAKAAN UNIVERSITAS DIAN NUSWANTORO

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI DATA MINING ALGORITMA C4.5 UNTUK MEMPREDIKSI PEMBAYARAN PINJAMAN PADA KOPERASI SIMPAN PINJAM PRIMKOVERI BINA BAKTI PEMALANG

DECISION TREE BERBASIS ALGORITMA UNTUK PENGAMBILAN KEPUTUSAN

Implementasi Model Pohon Kepututusan Untuk Mengklasifikasi Masa Studi Mahasiswa Menggunakan Algoritma C4.5 [Universitas Diponegoro]

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3)

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA C4.5 UNTUK MEMPREDIKSI KELAYAKAN PEMBIAYAAN ANGGOTA PADA BMT IHSAN MULIA YOGYAKARTA NASKAH PUBLIKASI

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit

Muhammad Yudin Ritonga ( )

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU


ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

Analisa Data Mining Menggunakan Algoritma Frequent Pattern Growth Pada Data Transaksi Penjualan Restoran Joglo Kampoeng Doeloe Semarang

BAB II LANDASAN TEORI

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

BAB III MODEL POHON KEPUTUSAN. Pohon keputusan merupakan metode klasfikasi dan prediksi yang sangat

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

ANALISA POLA PEMILIHAN PROGRAM STUDI BAGI CALON MAHASISWA DI UNIVERSITAS ABDURRAB MENGGUNAKAN ASSOCIATION RULE

IMPLEMENTASI DATA MINING PADA PENENTUAN JUMLAH SKS MENGGUNAKAN DECISION TREE

SISTEM PENDUKUNG KEPUTUSAN PENILAIAN KINERJA KARYAWAN MENGGUNAKAN METODE ANALYTICAL HIERARCHY PROCESS (AHP)

IMPLEMENTASI METODE ASSOSIATION RULES UNTUK MENEMUKAN POLA HUBUNGAN ANTARA DATA AKADEMIK DAN NON-AKADEMIK TUGAS AKHIR

BAB II TINJAUAN PUSTAKA

Algoritma C4.5. Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1.

ANALISIS DAN IMPLEMENTASI PENGAMBILAN POLA KEPUTUSAN NASABAH YANG BERHAK MENERIMA KREDIT MENGGUNAKAN ALGORITMA ID3 PADA BANK MANDIRI PANGKALPINANG

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

APLIKASI DATA MINING UNTUK POLA PERMINTAAN DARAH DI UDD ( UNIT DONOR DARAH ) PMI KOTA SURABAYA MENGGUNAKAN METODE APRIORI

KOMPARASI ALGORITMA C4.5 DENGAN NAÏVE BAYES DALAM PENGKLASIFIKASIAN TINGKAT PENDIDIKAN ANAK MISKIN. Andi Nurhayati 1, Andi Baso Kaswar 2

IMPLEMENTASI DATA MINING TERHADAP PENYUSUNAN LAYOUT MAKANAN PADA RUMAH MAKAN PADANG MURAH MERIAH

IMPLEMENTASI ALGORITMA C4.5 UNTUK MENENTUKAN PENERIMA BEASISWA DI STT HARAPAN MEDAN

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

IMPLEMENTASI FUZZY TERHADAP SISTEM PENDUKUNG KEPUTUSAN DALAM MENENTUKAN KELAYAKAN PEMBIAYAAN PENGAJUAN KREDIT BARANG.

Data Mining Pengklasifikasian: Konsep Dasar, Pohon Keputusan, and Evaluasi Model. Pengklasifikasian: Definisi. Catatan Kuliah untuk Bab 4

Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis

BAB II TINJAUAN PUSTAKA

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

BAB II TINJAUAN PUSTAKA

IMPLEMENTASI DECISION TREE UNTUK MEMPREDIKSI JUMLAH MAHASISWA PENGAMBIL MATAKULIAH DENGAN MENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORMATIKA ITS

BAB I PENDAHULUAN 1.1 Latar Belakang

Implementasi Algoritme Modified-Apriori Untuk Menentukan Pola Penjualan Sebagai Strategi Penempatan Barang Dan Promo

Abidah Elcholiqi, Beta Noranita, Indra Waspada

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Decision Tree Penentuan Masa Studi Mahasiswa Prodi Teknik Informatika (Studi Kasus: Fakultas Teknik dan Komputer Universitas Harapan Medan)

Model Penentuan Jenis Beasiswa Menggunakan Algoritma K-NN Kombinasi Basis Aturan Dan Basis Pengetahuan

Penerapan Data Mining dalam Memprediksi Pembelian cat

BAB I PENDAHULUAN Latar Belakang

Classification. Decision Tree. Decision Tree. Konsep Decision Tree. Penggunaan Decision Tree. When To Consider Decision Tree?

DAFTAR ISI PHP... 15

ANALISA DATA PENJUALAN OBAT DENGAN MENGGUNAKAN ALGORITMA APRIORI PADA RUMAH SAKIT UMUM DAERAH H. ABDUL MANAN SIMATUPANG KISARAN

Rayendra AMIK Kosgoro Solok

PENERAPAN DATA MINING UNTUK KLASIFIKASI PREDIKSI PENYAKIT ISPA (Infeksi Saluran Pernapasan Akut) DENGAN ALGORITMA DECISION TREE (ID3)

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.

RANCANG BANGUN SISTEM INFORMASI KEUANGAN SISWA PADA SEKOLAH MADRASAH ALIYAH NEGERI (MAN) PAJARAKAN BERBASIS WEB

IDENTIFIKASI LAMA STUDI BERDASARKAN KARAKTERISTIK MAHASISWA MENGGUNAKAN ALGORITMA C4.5

JURNAL. Sistem Bantu Pemilihan Penerima Bantuan Siswa Miskin Menggunakan KNN (K-NEAREST NEIGHBOR)

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

Research of Science and Informatic

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

Metodologi Algoritma A Priori. Metodologi dasar algoritma a priori analisis asosiasi terbagi menjadi dua tahap :

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

2.2 Data Mining. Universitas Sumatera Utara

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

PENERAPAN ALGORITMA C4.5 DALAM PENERIMAAN CALON KARYAWAN PT. TELKOM AKSES AREA LAMPUNG BERBASIS WEBSITE

Pola Kompetensi Mahasiswa Program Studi Informatika Menggunakan FP-Growth

BAB 2 TINJAUAN PUSTAKA

APLIKASI MONITORING KETERSEDIAAN STOK BARANG MINIMARKET DENGAN METODE MARKET BASKET ANALYSIS (MBA)

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

Transkripsi:

Seminar Nasional Sistem Informasi Indonesia, 2-4 Desember 2013 APLIKASI DATA MINING DENGAN METODE CLASSIFICATION BERBASIS ALGORITMA C4.5 Rizky Tahara Shita 1), Nita Marliani 2) 1, 2) Universitas Budi Luhur, Fakultas Teknologi Informasi, Jl. Ciledug Raya. Petukangan Utara. Jakarta Selatan, Jakarta, 12260 HP: +62 857 1648 3190 E-mail: rizky.tahara@gmail.com 1), nita.marliani@gmail.com 2) Abstrak PT. Biro Klasifikasi Indonesia telah memiliki kumpulan data yang besar; baik data pegawai, keuangan, kapal, surveyor maupun laporan survey yang sebenarnya data tersebut berpotensi untuk menghasilkan informasi baru yang berguna dalam menyusun berbagai strategi maupun sebagai penunjang keputusan. Dengan memanfaatkan teknik Classification pada data mining yang berbasis algoritma C4.5 (pembetukan pohon keputusan) untuk membagi kumpulan data yang besar menjadi himpunan record yang lebih kecil, maka dapat memperkirakan kelas dari suatu atribut dan diharapkan dapat membentuk pohon keputusan yang merepresentasikan aturan dalam data yang digunakan agar dapat dipahami dan disajikan dalam bentuk yang lebih informatif. Pohon keputusan yang ada dapat digunakan untuk memperkirakan terlambat atau tidaknya laporan survey pada divisi survey dengan melihatnya berdasarkan data cabang, jenis kapal, jabatan surveyor maupun jenis survey. Kata kunci: data mining, classification, C4.5, survey Abstract PT. Biro Klasifikasi Indonesia already has lots of data; from employee, finance, ship, surveyor and the survey report which potentially to generate new useful information to form strategy as decision support. By using the Classification technique in data mining with C4.5 algorithm (build the decision tree) to divide big data into smaller records, then predicting a class in attribute and building the decision tree that represent rules in the data that used to understand and served in more informative way. Existing decision tree can be used to predict how late or not the survey report at the survey division by seeing it based on branch, ship type, surveyor position nor the survey type. Keywords: data mining, classification, C4.5, survey 1.PENDAHULUAN PT. Biro Klasifikasi Indonesia yang memiliki kumpulan data yang besar, sangat berpotensi untuk digunakan dalam penyampaian informasi yang lebih baik sebagai penunjang keputusan. Memanfaatkan konsep data mining dengan algoritma C4.5 maka diharapkan penyampaian data menjadi informasi sebagai penunjang keputusan dapat tercapai. 1.1 Tujuan Menganalisis dan merancang aplikasi berbasis web yang dijadikan dasar untuk membangun sistem data mining perkiraan laporan survey dengan memanfaatkan metode Classification berbasis algoritma C4.5. Meningkatkan akses informasi dari mana saja dan kapan saja secara cepat dan mudah. Mempermudah pengambilan keputusan. 1. LANDASAN TEORI 1.1 Pengertian Data Mining Merupakan serangkaian proses untuk menggali nilai tambah yang berupa informasi yang selama ini tidak diketahui secara manual dari suatu basisdata dengan melakukan proses extraksi dan mengenali pola

518 penting dari data yang ada [1]. Berdasarkan tugas yang dapat dilakukan, data mining dibagi menjadi beberapa kelompok, yaitu: Deskripsi, Estimasi, Prediksi, Klasifikasi, Pengklusteran dan Asosiasi. 1.2 Classification Rule Sebuah proses untuk menemukan model atau fungsi yang menjelaskan / membedakan konsep atau kelas data dengan tujuan untuk memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Hal ini juga dapat dikatakan sebagai pembelajaran (klasifikasi) yang memetakan sebuah unsur (item) data kedalam salah satu dari beberapa kelas yang sudah didefinisikan [2]. 1.3 C4.5 Algorithm Pembuatan pohon keputusan menggunakan algoritma C4.5 yang merupakan pengembangan dari algoritma ID3; dimana pengembangan dilakukan dalam hal mengatasi missing data, data continue, pruning [3]. Secara umum, algoritma C4.5 untuk membangun pohon keputusan dimulai dari pemilihan atribut sebagai akar, membuat cabang untuk tiap-tiap nilai; membagi kasus dalam cabang dan mengulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama. 2. PROSES BISNIS 2.1 Analisa Kebutuhan Kebutuhan PT. Biro Klasifikasi Indonesia adalah mengurangi tumpukan data yang ada agar dapat diolah menjadi informasi yang lebih bermanfaat. Data yang dibutuhkan dari sistem adalah data yang berhubungan dengan laporan survey, nilai atribut dan kemungkinannya. Variabel yang digunakan yaitu: Jenis survey; berisi seluruh kemungkinan jenis survey yang dilakukan pada setiap permohonan. Cabang; berisi seluruh kemungkinan cabang yang melakukan survey pada setiap permohonan. Kategori kapal; berisi seluruh kemungkinan jenis kapal yang di survey pada setiap permohonan. Jabatan; variabel tentang kemungkinan jabatan yang dimiliki oleh surveyor. Perkiraan; berfungsi untuk menentukan hasil keputusan yang pengelompokannya sudah ditentukan secara tetap agar tidak terjadi kesalahan dalam proses dan data perkiraan ini memiliki 2 nilai; yaitu: tepat dan terlambat. 2.2 Rancangan Basisdata Rancangan basisdata dapat dilihat pada class diagram gambar 1. 3. HASIL a. Implikasi Penelitian 3.1.1 Aspek Manajerial Pihak manager dan bagian survey dapat melihat secara detil mengenai keterlambatan laporan survey. 3.1.2 Aspek Sistem Aplikasi tidak mengganggu sistem yang berjalan (legacy system) karena merupakan pendukung (add on) dari aplikasi yang sudah ada. Dengan dukungan aplikasi web based, maka data serta laporan dapat diakses dan disajikan dengan mudah dan cepat oleh pihak manager maupun bagian survey sebagai penunjang keputusan. 3.1.3 Aspek Penelitian Lanjut Dapat dikembangkan agar proses lebih cepat dengan memanfaatkan metode lain yang disesuaikan dengan data yang ada untuk jumlah yang lebih besar. 4. PENUTUP 4.1 Kesimpulan Implementasi Classification berbasis algoritma C4.5 pada aplikasi sangat membantu dalam menganalisis perkiraan keterlambatan laporan survey dengan cara membentuk pohon keputusan yang memanfaatkan data permohonan yang ditunjang dengan aplikasi berbasis web, sehingga pihak terkait dapat lebih cepat dan mudah dalam mendapatkan informasi untuk menunjang keputusan secara mobile. 4.2 Saran Agar lebih baik, aplikasi dapat dikembangkan agar dapat bekerja lebih cepat; mengembangkan sisi basisdata agar dapat memproses data yang jumlahnya sangat besar serta pemilihan proses import data selain format.xls.

519 Gambar 1: Class Diagram

520 4.3 Tampilan Aplikasi 4.3.1 Import Data 4.3.2 Laporan Gambar 2: Import Data Gambar 3 Laporan

521 4.3.3 Data Mining Gambar 4 Proses Data Mining 5. DAFTAR PUSTAKA [1] Huda, Nugson Masykur, 2010. Aplikasi Data Mining untuk Menampilkan Informasi Tingkat Kelulusan Mahasiswa. Universitas Diponegoro. [2] Kusrini, dan Luthfi, Emha Taufiq, 2009. Algoritma Data Mining. Yogyakarta: C.V Andi Offset. [3] Moertini, Veronica Sri, 2007. Pengembangan Skalabilitas Algoritma Klasifikasi C4.5 dengan Pendekatan Konsep Operator Relasi. Universitas Pajajaran.