BAB II LANDASAN TEORI

dokumen-dokumen yang mirip
Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

BAB II LANDASAN TEORI

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

Manfaat Pohon Keputusan

BAB 2 TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

BAB II LANDASAN TEORI

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

BAB 1 PENDAHULUAN 1-1

BAB I PENDAHULUAN Latar Belakang

SKRIPSI TI S1 FIK UDINUS 1

Data ini berisi 13 atribut, yaitu. Dengan tipe atribut, yaitu

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. jurusan ditentukan berdasarkan standar kriteria tiap jurusan.

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1-1

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

ANALISA DATA MINING MENGGUNAKAN METODE CRISP - DM TERHADAP TRANSAKSI PEMBELIAN ASURANSI PADA BANK XYZ

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB II TINJAUAN PUSTAKA

BAB III METODOLOGI PENELITIAN

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

BAB II TINJAUAN PUSTAKA

TINJAUAN PUSTAKA. Definisi Data Mining

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

BAB II DASAR TEORI. untuk memenuhi berbagai kebutuhan. Kumpulan file/table/arsip yang saling berhubungan yang disimpan dalam

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

BAB 2 TINJAUAN PUSTAKA

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

1. Model Prediksi Ini Menggunakan Tools RapidMiner

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB 2 TINJAUAN PUSTAKA

Abidah Elcholiqi, Beta Noranita, Indra Waspada

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

JURNAL IT STMIK HANDAYANI

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier

PERBANDINGAN AKURASI KLASIFIKASI DARI ALGORITMA NAIVE BAYES, C4.5, DAN ONER (1R)

BAB II LANDASAN TEORI

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

RENCANA PEMBELAJARAN SEMESTER

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Supervised Learning Misalkan kita ingin membuat suatu program komputer yang ketika diberi gambar seseorang, dapat menentukan apakah orang dalam

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

CONTOH KASUS DATA MINING

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

LANDASAN TEORI Data Mining

APLIKASI ROUGH SET UNTUK MEMPREDIKSI PRESTASI CALON ANGGOTA KELOMPOK PROGRAMMING (STUDI KASUS : STMIK PELITA NUSANTARA)

PENGANTAR SOLUSI DATA MINING

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB IV GAMBARAN UMUM METODOLOGI DATA MINING

RANCANG BANGUN APLIKASI DATA MINING ANALISIS TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus Di Politeknik Negeri Malang)

APLIKASI PENJADWALAN PENGADAAN BARANG MENGGUNAKAN ALGORITMA APRIORI

BAB I PENDAHULUAN 1.1 Latar Belakang

DECISION TREE BERBASIS ALGORITMA UNTUK PENGAMBILAN KEPUTUSAN

PENERAPAN ASSOCIATION RULE MINING PADA DATA NOMOR UNIK PENDIDIK DAN TENAGA KEPENDIDIKAN

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

BAB 3 METODE PENELITIAN

ALGORITMA BAYESIAN CLASSIFICATION UNTUK MEMPREDIKSI HEREGRISTRASI MAHASISWA BARU DI STMIK WIDYA PRATAMA

BAB I PENDAHULUAN. yang cepat dan besar di Asia (Kartiwi, 2006). Pertumbuhan e-commerce yang

Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A Kel : A

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. 1 Universitas Indonesia. Implementasi algoritma clustering..., Adolf Pandapotan

BAB I PENDAHULUAN. Peminatan atau bidang peminatan adalah sebuah jurusan yang harus di

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

BAB I PENDAHULUAN. Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan

Penerapan Data Mining dalam Memprediksi Pembelian cat

KLASIFIKASI KECENDERUNGAN PENYAKIT MATA DI JAWA BARAT DENGAN ASSOCIATION RULE DAN NAÏVE BAYES CLASSIFIER

Versi Online tersedia di : JURNAL TECH-E (Online)

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

ANALISA ALGORITMA APRIORI UNTUK MENENTUKAN MEREK PAKAIAN YANG PALING DIMINATI PADA MODE FASHION GROUP MEDAN

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK

Transkripsi:

BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar. Data mining bukanlah suatu bidang yang sama sekali baru. Salah satu kesulitan untuk mendefinisikan data mining adalah kenyataan bahwa data mining mewarisi banyak aspek dan teknik dari bidang bidang ilmu yang sudah mapan terlebih dahulu. 1.2 Data Warehouse Data warehouse adalah suatu konsep dan kombinasi teknologi yang memfasilitasi organisasi untuk mengelola dan memelihara data historis yang diperoleh dari sistem atau aplikasi operasional. Pemakaian teknologi data warehouse hampir dibutuhkan oleh semua organisasi,tidak terkecuali perpustakaan. Data warehouse memungkinkan integrasi berbagai macam jenis data dari berbagai macam aplikasi atau sistem. Hal ini menjamin mekanisme akses satu pintu bagi manajemen untuk memperoleh informasi, dan menganalisisnya untuk pengambilan keputusan. 1.3 Metode Klasifikasi Klasifikasi merupakan metode analisis data yang digunakan untuk membentuk model yang mendeskripsikan kelas data yang penting, atau model data yang memprediksikan trend data. Klasifikasi digunakan untuk memprediksikan kelas data yang bersifat categorial, sedangkan prediksi untuk memodelkan fungsi yang mempunyai nilai continous. Klasifikasi juga merupakan proses pembelajaran secara terbimbing (supervised learning). Terbimbing karena kategori (class label) dari setiap training sampel diketahui. Untuk melakukan klasifikasi, training set sebagai data pembelajaran harus ada. Attribut dari sampel baru (unclassified sample) sama dengan atribut dari setiap sampel dalam training set hanya saja class label-nya belum diketahui. Metode klasifikasi ada empat yaitu: 1.3.1 Naive Bayesian Classification 4

Adalah metode klasifikasi yang berakar pada teorema Bayes atau metode pengklasifikasian dengan menggunakan metode probabilitas dan statistik yaitu memprediksi peluang dimasa depan berdasarkan pengalaman dimasa sebelumnya. 1.3.2 K-Nearest Neighbor (K-NN) Classification Adalah metode sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Algoritma k-nn adalah suatu metode yang menggunakan algoritma supervised. Yaitu algoritma yang bertujuan untuk menemukan pola baru dalam data dengan menghubungkan pola data yang sudah ada dengan data yang baru. 2.4.3 Association Rules Association rule adalah salah satu model data mining yang digunakan untuk mendapatkan hubungan ketergantungan antara item pada sekumpulan record. Di dalam aplikasi WEKA, Association Rules disebut juga OneR. Metode association rule mining juga merupakan metode dalam pencarian kondisi terjadinya nilai atribut dari data yang muncul bersama-sama. Metode ini melakukan pencarian pada hubungan yang memiliki nilai dalam kumpulan data. 2.4.4 Metode Decision Tree Decision tree adalah model prediksi menggunakan struktur pohon atau struktur berhirarki. Konsep dari decision tree adalah mengubah data menjadi pohon keputusan dan aturanaturan keputusan. Manfaat utama dari penggunaan decision tree adalah kemampuannya untuk membreak down proses pengambilan keputusan yang kompleks menjadi lebih simpel sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan. Di dalam aplikasi WEKA, decison tree juga disebut sebagai metode J48. Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan. Pohon keputusan juga berguna untuk mengekplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Data dalam pohon keputusan biasanya dinyatakan dalam bentuk tabel dengan atribut dan record. Ada beberapa kelebihan dan kekurangan dari metode Decision Tree ini: 1. Kelebihan dari metode decision tree adalah: a. Daerah pengambilan keputusan yang sbelumnya kompleks dan sangat global, dapat diubah menjadi lebih simple dan spesifik. 5

b. Mengeliminasi perhitungan-perhitungan yang tidak perlu. c. Fleksibel untuk memilih fitur dari internal node yang berbeda, fitur yang terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain dalam node yang sama. 2. Kekurangan dari metode decision tree adalah: a. Terjadi overlap terutama ketika kelsa-kelas dan kriteria yang digunakan jumlahnya sangat banyak. b. Pengakumulasian jumlah error dari setiap tingkat dalam sebuah decision tree yang besar. c. Kesulitan dalam mendesain decision tree yang optimal. d. Hasil kualitas keputusan yang didapatkan dari metode decision tree sangat tergantung pada bagaimana pohon tersebut didesain. 1.4 Pengertian Analisis Asosiasi Analasisi Asosiasi adalah teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item. Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya. 1.5 Pengertian Algoritma Apriori Algoritma apriori adalah algoritma pengambilan data dengan aturan asosiatif (Association rule ) untuk menentukan hubungan asosiatif suatu kombinasi item. Association Rule yang dimaksud dilakukan melalui mekanisme penghitungan support dan confidence dari suatu hubungan item. 1.6 Metode Regresi Analisis regresi merupakan salah satu analisis yang bertujuan untuk mengetahui pengaruh suatu variabel terhadap variabel lain. Dalam analisis regresi, variabel yang mempengaruhi disebut Independent Variable (variabel bebas) dan variabel yang dipengaruhi disebut Dependent Variable (variabel terikat). Jika dalam persamaan regresi hanya terdapat satu variabel bebas dan satu variabel terikat, maka disebut sebagai persamaan regresi sederhana, sedangkan jika variabel bebasnya lebih dari satu, maka disebut sebagai persamaan regresi berganda. 1.7 Metode Clustering 6

Clustering adalah metode penganalisaan data yang sering dimasukan sebagai satu metode Data Mining, yang tujuannya adalah untuk mengelompokan data dengan karakteristik yang sama ke suatu wilayah yang sama dan data dengan karakteristik yang berbeda ke wilayah yang lain. 1.8 Aplikasi WEKA Weka adalah aplikasi data mining open source berbasis Java. Weka terdiri dari koleksi algoritma machine learning yang dapat digunakan untuk melakukan generalisasi / formulasi dari sekumpulan data sampling. Pada penelitian ini, penulis menggunkaan aplikasi Weka versi 3-7-4. Gambar 2.1 Tampilan Awal WEKA Empat tombol diatas dapat digunakan untuk menjalanankan Aplikasi : 1. Explorer digunkan untuk menggali lebih jauh data dengan aplikasi WEKA 2. Experimenter digunakan untuk melakukan percobaan dengan pengujian statistic skema belajar 3. Knowledge Flow digunakan untuk pengetahuan pendukung 4. Simple CLI antar muka dengan menggunakan tampilan command-line yang memungkinkan langsung mengeksekusi perintah weka untuk Sistem Operasi yg tidak menyediakan secara langsung 1.9 Notepad++ 7

Notepad ++ adalah suatu text editor yang berjalan pada Operating System(OS) Windows. Notepad++ disini menggunakan komponen-komponen Scintilla agar dapat menampilkan dan menyunting text dan berkas source code berbagai bahasa pemrograman. 8