Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES. Bertalya Universitas Gunadarma 2009

dokumen-dokumen yang mirip
Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

PERTEMUAN 14 DATA WAREHOUSE

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 LANDASAN TEORI

jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006.

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

Manajemen Data. Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM :

2.2 Data Mining. Universitas Sumatera Utara

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

BAB 2 LANDASAN TEORI

BAB 3 METODE PENELITIAN

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

BAB 1 PENGERTIAN DATA MINING DAN FUNGSI-FUNGSI DATA MINING

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4)

Tahapan Proses KDD (Peter Cabena)

BAB II TINJAUAN PUSTAKA

BAB 3 LANDASAN TEORI

ARSITEKTUR & MODEL DATA MINING

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1. Latar Belakang

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

BAB 1 PENDAHULUAN Latar Belakang

BAB II LANDASAN TEORI

Gambar Tahap-Tahap Penelitian

BAB II LANDASAN TEORI

BAB 2 TINJAUAN PUSTAKA

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING

DESAIN APLIKASI UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA. Oleh : Rita Prima Bendriyanti ABSTRAK

3.1 Metode Pengumpulan Data

BAB 1 PENDAHULUAN 1-1

PROPOSAL PENELITIAN. PENERAPAN DATA MINING UNTUK MENINGKATKAN PENJUALAN PADA PT. XL AXIATA, Tbk PALEMBANG

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN

PE DAHULUA. Latar Belakang

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

System Testing Pengujian terhadap integrasi sub-system, yaitu keterhubungan antar sub-system.

PERTEMUAN 13 ARSITEKTUR & MODEL DATA MINING

BAB I PENDAHULUAN. bersaing. Dalam dunia bisnis yang dinamis dan penuh persaingan. Seiring dengan

BUSINESS INTELLIGENCE. Management Database & Informasi

BAB III METODE PENELITIAN

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING

BAB I PENDAHULUAN Latar Belakang

II. TINJAUAN PUSTAKA

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB IV METEDOLOGI PENELITIAN

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

BAB III METODOLOGI PENELITIAN

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB III METODOLOGI PENELITIAN

TUGAS DATA WAREHOUSE & DATA MINING OLAP, OPERASI OLAP & MOLAP

BAB I PENDAHULUAN. pengetahuan yang tersembunyi di dalam database. Data mining merupakan proses

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB III METODOLOGI PENELITIAN

BAB III LANDASAN TEORI

DATA WAREHOUSING AND ONLINE ANALYTICAL PROCESSING (OLAP)

Abidah Elcholiqi, Beta Noranita, Indra Waspada

BAB III LANDASAN TEORI

BAB III METODOLOGI PENELITIAN

PENDAHULUAN TINJAUAN PUSTAKA

PENGUJIAN PERANGKAT LUNAK

PENDAHULUAN TINJAUAN PUSTAKA

BAB IV ANALISIS DAN PERANCANGAN SISTEM. permasalahan dari suatu sistem informasi. Hasil akhir dari analisis sistem

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

Organizing Data and Information

BAB III METODE PENELITIAN

PENDAHULUAN. Latar Belakang

BAB III METODOLOGI PENELITIAN. Gambar 3.1 merupakan desain penelitian yang akan digunakan dalam

BAB II LANDASAN TEORI

PERTEMUAN 13 STRATEGI PENGUJIAN PERANGKAT LUNAK

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Data Warehouse, Data Mart, OLAP, dan Data Mining CHAPTER 6

BAB II TINJAUAN PUSTAKA

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB II LANDASAN TEORI

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

2. Data & Proses Datamining

STRATEGI PENGUJIAN PERANGKAT LUNAK

APLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA

III. METODE KONVENS IONAL 11. REKAYASA SISTEM BERBASIS KOMPUTER

BAB I PENDAHULUAN 1.1 Latar Belakang

Sistem Pendukung Keputusan. Komponen SPK. Entin Martiana, S.Kom, M.Kom. Politeknik Elektronika Negeri Surabaya

PERANCANGAN APLIKASI DATA MINING UNTUK MEMREDIKSI PERMINTAAN CUSTOMER PADA PERUSAHAAN PERSEWAAN MOBIL

BAB II TINJAUAN PUSTAKA. Bab ini menguraikan tentang teori-teori penunjang yang dipakai dalam

Perkembangan Teknologi Database

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

PERTEMUAN 1 & 2 PENDAHULUAN DAN PROSES KDD. 28 September 2005 Pendahuluan dan Proses KDD 1

Transkripsi:

Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES Bertalya Universitas Gunadarma 2009

Data Mining (DM) DM merupakan suatu proses penjelajahan otomatis untuk mendapatkan informasi berguna dalam suatu repositori data yang sangat besar. DM merupakan bagian yg terintegrasi dari Knowledge Discovery in Databases (KDD). KDD terbagi atas 3 tahap secara global yakni Data preprocessing Data mining Postprocessing DM dan KDD 2

Tahap-tahap pada KDD Data preprocessing, bertujuan mentransformasikan data mentah ke format yg sesuai utk analisis. Terdiri atas proses seleksi fitur, reduksi dimensionalitas, normalisasi dan subsetting data Postprocessing, bertujuan untuk menjamin bahwa hasil proses data mining yg diintegrasikan pada sistem penunjang keputusan, benar2 hasil yg valid. Terdiri atas proses penapisan pola, visualisasi dan interpretasi pola DM dan KDD 3

(KDD) Proses transformasi data mentah menjadi informasi berguna DM dan KDD 4

Tahap-tahap Detail pada KDD Seleksi proses penyeleksian atau segmentasi data menurut beberapa kriteria, mis. Orang-orang yang mempunyai mobil Preprocessing proses pembersihan data, dimana informasi yg tidak dibutuhkan dibuang, Mis. Jenis kelamin pasien utk analisis kehamilan Data dikonfigurasi ulang untuk memastikan format yg konsisten krn berasal dari berbagai sumber. Mis. Jenis kelamin disimpan dgn bentuk f atau m dan 1 atau 0 DM dan KDD 5

Tahap2 pada KDD (lanj.) Transformasi proses transformasi sehingga data menjadi berguna dan dapat ditelusuri. Data Mining proses yg berfokus pada ekstraksi pola2 data. Pola dapat didefinisikan sebagai sekumpulan fakta2 (data) F, bahasa L, dan beberapa measure of certainty (pengukuran kepastian) C. Suatu pola dinyatakan S dalam L menggambarkan keterhubungan antara subset Fs dari F dgn kepastian c dimana S adalah simpel dibandingkan perhitungan semua fakta dalam Fs. DM dan KDD 6

Tahap2 pada KDD (lanj.) Interpretasi & Evaluasi pola diidentifikasi sistem, lalu diinterpretasikan sebagai pengetahuan yg dapat digunakan utk mendukung pengambilan keputusan manusia, contoh tugas prediksi & klasifikasi, meringkas konten suatu database menjelaskan fenomena yg diamati DM dan KDD 7

Isu / Masalah DM Sistem data mining bertumpu pada database2 yg memasok data mentah sebagai masukan. Masalah yg timbul a.l : Informasi yg terbatas Database dirancang utk tujuan berbeda dgn DM. Atribut2nya sederhana. Data yg tidak lengkap menimbulkan masalah karena apabila tidak terdapat atribut2 penting utk pengetahuan domain aplikasi tertentu, hal ini akan mengakibatkan kesulitan utk mendapatkan pengetahuan yg tepat utk domain tertentu. Contoh, tidak dapat mendiagnosa penyakit malaria dari database pasien apabila database tersebut tidak terdapat hasil pengukuran sel darah merah pasien DM dan KDD 8

Isu / Masalah DM (lanj.) Nilai data yg hilang atau noise Biasanya database terkontaminasi oleh kesalahan sehingga tidak dapat sepenuhnya dinyatakan bahwa database mempunyai data yg benar. Ketidakpastian Ketidakpastian merujuk pada tingkat kesalahan dan noise pada data Bidang yg tidak relevan & termodifikasi serta ukurannya Database cenderung sangat besar & dinamis, dimana kontennya selalu berubah2 (ditambah, dimodifikasi & dihapus). DM dan KDD 9

Isu / Masalah DM (lanj.) Masalahnya bagaimana menyakinkan bahwa aturan yg ada tetap up-to-date & konsisten dgn informasi yg ada. Selain itu, bidang database terkadang tidak relevan dgn fokus pencarian data. Contoh, kode pos merupakan hal dasar utk menyatakan hubungan mengenai sesuatu secara geografis, seperti penjualan produk. DM dan KDD 10

Arsitektur DM Graphical user interface Pattern evaluation Data mining engine Database or data warehouse server Data cleaning & data integration Filtering Knowledge-base Databases Data Warehouse DM dan KDD 11

Data pada DM Database relasional Data warehouse Database transaksi Database lanjut & repositori informasi Database berorientasi objek & database relasional Database Spasial DataTime-series & data temporal Database teks & database multimedia Database heterogen & database legal WWW DM dan KDD 12