DATA MINING. Pertemuan 2. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

dokumen-dokumen yang mirip
Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

DATA MINING. Pertemuan 9. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 1. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

Data Mining Outline BAB I Pendahuluan. Rules. Pendahuluan 9/9/2016. Who Am I? Manusia Memproduksi Data. Ricky Maulana Fajri

Student Clustering Based on Academic Using K-Means Algoritms

BAB II LANDASAN TEORI

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining


BAB 2 TINJAUAN PUSTAKA

Data Mining. Fajar Agung Nugroho, S.Kom, M.CS

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB II TINJAUAN PUSTAKA

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

Algoritma Data Mining

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

BAB 2 TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

Data Mining. Romi Satria Wahono. WA/SMS:

Pretest dan Posttest untuk Mengukur Kompetensi Kognifif Mahasiwa

Data Mining I. Mata kuliah Data Warehouse Universitas Darma Persada Oleh: Adam AB

Data Mining II Estimasi

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

SKRIPSI TI S1 FIK UDINUS 1

BAB I PENDAHULUAN. 1.1 Latar Belakang

2. Tahapan Penelitian pemahaman merupakan awal proses penelitian

2.2 Data Mining. Universitas Sumatera Utara

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Pola Kompetensi Mahasiswa Program Studi Informatika Menggunakan FP-Growth

ANALISA DATA MINING MENGGUNAKAN METODE CRISP - DM TERHADAP TRANSAKSI PEMBELIAN ASURANSI PADA BANK XYZ

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA

2. Tahapan Penelitian

BAB 1 PENDAHULUAN. retail di Indonesia pada semester I 2010 telah mencapai Rp 40 triliun. Omzet perusahaan

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

Tahapan Proses KDD (Peter Cabena)

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

II. TINJAUAN PUSTAKA

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4)

Data Mining Outline BAB I Pendahuluan. Proses Data Mining. Recap

Algoritma Dasar. 4.1 Naive Bayes

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

PERTEMUAN 14 DATA WAREHOUSE

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

BAB II LANDASAN TEORI

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

Manfaat Pohon Keputusan

BAB I PENDAHULUAN 1.1 Latar Belakang

RENCANA PEMBELAJARAN SEMESTER

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

BAB II TINJAUAN PUSTAKA

PENERAPAN METODE APRIORI ASOSIASI TERHADAP PENJUALAN PRODUCT COSMETIC UNTUK MENDUKUNG STRATEGI PENJUALAN

Pen e g n a g n a t n a t r a r D at a a t a M ini n ng n oleh: Entin Martiana

APLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN STUDI DAN LANDASAN TEORI

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

BAB II LANDASAN TEORI

PERBANDINGAN DECISION TREE

DATA MINING ABU SALAM, M.KOM

ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis

TINJAUAN PUSTAKA. Definisi Data Mining

PENERAPAN METODE ASOSIASI GSP DAN APRIORI UNTUK STOK DAN REKOMENDASI PRODUK

BAB 2 TELAAH PUSTAKA

BAB IV GAMBARAN UMUM METODOLOGI DATA MINING

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

BAB I PENDAHULUAN. 1.1 Latar Belakang

METODE PENELITIAN. Tahapan pengembangan sistem PSP (Penetapan Strategi Penjualan) 1.0 seperti pada Gambar 2 di bawah ini. Mulai

ANALISA DATA PENJUALAN OBAT DENGAN MENGGUNAKAN ALGORITMA APRIORI PADA RUMAH SAKIT UMUM DAERAH H. ABDUL MANAN SIMATUPANG KISARAN

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II LANDASAN TEORI

Penggalian Informasi Potensial dari Basis Data di Perguruan Tinggi. Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

TEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author)

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING

DESAIN APLIKASI UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA. Oleh : Rita Prima Bendriyanti ABSTRAK

BAB II LANDASAN TEORI

Algoritma Data Mining (2) Tugas Klasifikasi

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

PENERAPAN DATA MINING UNTUK RENCANA SUKSESI SUMBER DAYA MANUSIA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOUR DI PT POS INDONESIA

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

Jurnal Edik Informatika Penelitian Bidang Komputer Sains dan Pendidikan Informatika V1.i1(52-62)

Assocation Rule. Data Mining

Transkripsi:

DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 2 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2016

Mengapa Data Mining? Penumpukan data Minimnya pemanfaatan data Peningkatan biaya penyimpanan dan perawatan data We are drowning in data, but starving for knowledge

Definisi Data Mining Tan (2006) mendefinisikan data mining sebagai proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan. Darly Pregibon (2011) menyatakan bahwa data mining adalah campuran dari statistik, kecerdasan buatan, dan riset basis data. Pramudiono (2006) mengartikan data mining sebagai serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual.

Apa itu Data Mining? Proses ekstraksi dari DATA ke PENGETAHUAN (pola, rumus, aturan, model) dengan beberapa teknik dari kumpulan data besar.

Apa itu Data Mining? Himpunan Data Metode Data Mining Pengetahuan

Data Informasi Pengetahuan NIP TGL DATANG PULANG 1103 02/12/2004 07:20 15:40 1142 02/12/2004 07:45 15:33 1156 02/12/2004 07:51 16:00 1173 02/12/2004 08:00 15:15 1180 02/12/2004 07:01 16:31 1183 02/12/2004 07:49 17:00 Data Kehadiran Pegawai

Data Informasi Pengetahuan NIP Masuk Alpa Cuti Sakit Telat 1103 22 1142 18 2 2 1156 10 1 11 1173 12 5 5 1180 10 12 Informasi Akumulasi Kehadiran Pegawai Per Bulan

Data Informasi Pengetahuan Senin Selasa Rabu Kamis Jumat Terlambat 7 0 1 0 5 Pulang Cepat 0 1 1 1 8 Izin 3 0 0 1 4 Alpa 1 0 2 0 2 Pola Kehadiran Mingguan Pegawai

Data Informasi Pengetahuan Kebijakan Kebijakan penataan jam kerja karyawan khusus untuk hari senin dan jumat Peraturan jam kerja: Hari Senin dimulai jam 10:00 Hari Jumat diakhiri jam 14:00 Sisa jam kerja dikompensasi ke hari lain

Hubungan dengan Bidang lainnya Statistics Computing Algorithms Pattern Recognition Database Technology Machine Learning Data Mining High Performance Computing

Hubungan dengan Bidang lainnya BUSINESS INTELLIGENCE PERFORMANCE MANAGEMENT ENTERPRISE REPORTING DATA MINING DATA WAREHOUSE EXTRACT, TRANSFORM, LOAD TRANSACTIONAL DATABASE

Penggunaan Software Data Mining http://www.kdnuggets.com/polls/2015/analytics-data-mining-data-science-software-used.html

Proses Data Mining Cross-Industry Standard Process for Data Mining (CRISP-DM) www.crisp-dm.org Fase Pemahaman Bisnis Fase Pemahaman Data Fase Penyebaran Fase Pengolahan Fase Evaluasi Fase Pemodelan

Proses Data Mining Tiga langkah utama dalam proses data mining (Gonunescu, 2011) 1. Ekplorasi/pemrosesan awal data 2. Membangun model dan melakukan validasi terhadapnya 3. Penerapan Peran Data Mining dalam Knowledge Discovery in Database (KDD)

Teknik Data Mining CLASSIFICATION, CLUSTERING, ASSOCIATION, ANOMALY, PREDICTION, ESTIMATION REGRESSION, SUQUATIAL PATTERN, DEVIATION DETECTION DLL Algoritma C4.5, Nearest Neighbor, A Priori, Fuzzy C-Means, Bayesian Classification, C4.5, K-Means, SVM, EM, PageRank, AdaBoost, knn, CART, dll

Classification Kasifikasi (classification) digunakan untuk pembuatan model yang dapat melakukan pemetaan dari setiap himpunan variabel ke setiap targetnya, kemudian menggunakan model tersebut untuk memberikan nilai target pada himpunan variabel yang baru didapat. Algoritma: Data Latih Algoritma Pelatihan Decision Tree Induction (C4.5) Nearest-Neighbor Bayesian Classification Neural Network Model Evaluation and Selection Techniques to Improve Classification Accuracy: Ensemble Methods dll Data Uji Pembangunan Model Penerapan Model Keluaran Data Uji

Classification: Contoh Kasus Data Keputusan Bermain Tenis (data set) 17

Classification: Contoh Kasus Pohon Keputusan Bermain Tenis (model) Algoritma C4.5

Classification: Contoh Kasus Seleksi Kondisi untuk Rekomendasi Bermain Tenis(rules) If outlook = sunny and humidity = high then play = no If outlook = rainy and windy = true then play = no If outlook = overcast then play = yes If humidity = normal then play = yes

Clustering Penklusteran (clustering) digunakan untuk melakukan pengelompokan data-data ke dalam sejumlah kelompok (cluster) berdasarkan karakteristik masing-masing data pada kelompok-kelompok yang ada. Algoritma: Cluster Analysis: Basic Concepts Partitioning Methods Hierarchical Methods Density-Based Methods Grid-Based Methods Evaluation of Clustering dll

Clustering: Contoh Kasus K=2 The initial data set Partition objects into k nonempty subsets Repeat Arbitrarily partition objects into k groups Compute centroid (i.e., mean point) for each partition Assign each object to the cluster of its nearest centroid Until no change Loop if needed Update the cluster centroids Update the cluster centroids Reassign objects

Clustering: Contoh Kasus Menentukan Strategi Marketing Universitas Himpunan Data yang digunakan 1. Data Mahasiswa yang Telah Lulus 2. Data Kota Asal Mahasiswa yang Telah Lulus (transformasi data) 3. Data Jurusan Mahasiswa yang Telah Lulus (transformasi data)

Clustering: Contoh Kasus Menentukan Strategi Marketing Universitas Pemodelan menggunakan algoritma K-Means 1. Menentukan jumlah cluster = 3 2. Menentukan nilai centroid dari setiap cluster 3. Petakan setiap data pada centroid cluster (cari yang terdekat)

Clustering: Contoh Kasus Menentukan Strategi Marketing Universitas Pemodelan menggunakan algoritma K-Means Hasil pemetaan setiap data ke setiap cluster 4. Hitung kembali pusat cluster yang baru berdasarkan rata-rata angggota yang ada pada cluster tersebut 5. Setelah didapatkan centroid yang baru dari setiap cluster, lakukan kembali dari langkah ketiga hingga centroid dari setiap cluster tidak berubah lagi dan tidak ada lagi data yang berpindah dari satu cluster ke cluster yang lain

Clustering: Contoh Kasus Menentukan Strategi Marketing Universitas Hasil Analisis Clustering

Clustering: Contoh Kasus Menentukan Strategi Marketing Universitas Strategi Promosi yang Dihasilkan 1. Promosi Dengan Mengirim Tim Marketing yang Sesuai dengan Jurusan yang Paling Banyak Diminati. 2. Promosi Pada Kota Berdasarkan Tingkat Akademik dari Calon Mahasiswa.

Association Asosiasi (association) digunakan untuk menemukan pola yang mendeteksi kumpuluan atribut-atribut yang muncul bersamaan dalam frekuensi yang sering, dan membentuk sejumlah kaidah dari kumpulan-kumpulan tersebut. Biasa disebut dengan affinity analysis atau market basket analysis. Algoritma: A Priori FP-Growth GRI dll Customers who bought this item... also bought...

Association: Contoh Kasus Data Transaksi (Format Tabular) Algoritma A Priori

Association: Contoh Kasus Contoh, pada hari kamis malam, 1000 pelanggan telah melakukan belanja di supermaket ABC, dimana: 200 orang membeli Teh, dan dari 200 orang yang membeli Teh, 50 orangnya membeli Gula. Jadi, association rule menjadi, Jika membeli Teh, maka membeli Gula, dengan nilai support = 200/1000*100% = 20% dan nilai confidence = 50/200*100% = 25%

Estimation: Contoh Kasus Customer Jumlah Pesanan (P) Jumlah Traffic Light (TL) Jarak (J) 1 3 3 3 16 2 1 7 4 20 3 2 4 6 18 4 4 6 8 36... Estimasi Waktu Pengiriman Pizza Regresi Linier 1000 2 4 2 12 Waktu Tempuh (T) Waktu Tempuh (T) = 0.48P + 0.23TL + 0.5J Pengetahuan (Rumus)

Materi Minggu Ke 3 Set Data 1. Definisi dan tipe data 2. Kualitas data 3. Similaritas dan dissimilaritas